用於 AI 和 ML 項目的電子健康記錄 (EHR) 數據集
現成的電子健康記錄 (EHR) 數據集可快速啟動您的醫療保健 AI 項目。
插入您今天丟失的醫療數據
目錄
為您的醫療保健 AI 找到正確的電子健康記錄 (EHR) 數據
使用一流的訓練數據改進您的機器學習模型。 電子健康記錄或 EHR 是包含患者病史、診斷、處方、治療計劃、疫苗接種或免疫接種日期、過敏、放射學圖像(CT 掃描、MRI、X 射線)和實驗室測試等的醫療記錄。 我們現成的數據目錄使您可以輕鬆獲得值得信賴的醫療培訓數據。
現成的電子健康記錄 (EHR):
- 5.1 個專業的 31 萬個以上記錄和醫生音頻文件
- 用於訓練臨床 NLP 和其他 Document AI 模型的真實世界黃金標準病歷
- 元數據信息,例如 MRN(匿名)、入院日期、出院日期、住院天數、性別、患者類別、付款人、財務類別、狀態、出院處置、年齡、DRG、DRG 描述、$ 報銷、AMLOS、GMLOS、風險死亡率、疾病嚴重程度、石斑魚、醫院郵政編碼等。
- 來自美國各州和地區的醫療記錄 - 東北 (46%)、南部 (9%)、中西部 (3%)、西部 (28%)、其他 (14%)
- 屬於所有患者類別的醫療記錄 - 住院患者、門診患者(臨床、康復、經常性、外科日間護理)、急診。
- 屬於所有患者年齡組的病歷 <10 歲 (7.9%)、11-20 歲 (5.7%)、21-30 歲 (10.9%)、31-40 歲 (11.7%)、41-50 歲 (10.4%) ), 51-60 歲 (13.8%), 61-70 歲 (16.1%), 71-80 歲 (13.3%), 81-90 歲 (7.8%), 90 歲以上 (2.4%)
- 患者性別比例為 46%(男性)和 54%(女性)
- 符合 HIPAA 的符合安全港指南的 PII 編輯文檔
按位置劃分的 EHR 數據
地點 | 文本文檔 |
---|---|
東北 | 4,473,573 |
南 | 1,801,716 |
中西部 | 781,701 |
·韋斯特 | 1,509,109 |
按主要診斷類別劃分的 EHR 數據
按主要診斷類別劃分的 EHR 數據 | 文本文檔 |
---|---|
循環系統 | 589,730 |
傳染病和寄生蟲病 | 559,244 |
呼吸系統 | 561,983 |
肌肉骨骼系統和結締組織 | 329,344 |
消化系統 | 346,369 |
神經系統 | 316,243 |
精神疾病和障礙 | 282,501 |
腎臟和泌尿道 | 209,561 |
懷孕、分娩和產褥期 | 165,303 |
新生兒和其他新生兒疾病起源於圍產期 | 163,605 |
內分泌、營養和代謝疾病和障礙 | 142,808 |
肝膽系統和胰腺 | 127,172 |
皮膚、皮下組織和乳房 | 89,577 |
藥物的傷害、中毒和毒性作用 | 64,097 |
血液、造血器官、免疫疾病 | 48,990 |
酒精/藥物使用和酒精/藥物引起的有機精神障礙 | 48,717 |
多重重大創傷 | 27,902 |
耳鼻喉 | 22,987 |
女性生殖系統 | 17,010 |
影響健康狀況和其他與衛生服務聯繫的因素 | 21,294 |
骨髓增生性疾病和疾病,低分化腫瘤 | 15,620 |
人類免疫缺陷病毒感染 | 12,422 |
男性生殖系統 | 9,230 |
眼 | 3,549 |
伯恩斯 | 444 |
酒精/藥物使用或誘發的精神障礙 | 48,717 |
與 MDC 合計 | 4,175,702 |
使用 3M 等特種石斑魚的案例(未指定 MDC) | 1,619,682 |
門診病例(未指定 MDC) | 1,980,606 |
生成未報銷的案例(未指定 MDC) | 790,697 |
總計包括所有內容(有和沒有 MDC 類別的情況) | 8,566,687 |
我們處理所有類型的數據許可,即文本、音頻、視頻或圖像。 數據集由 ML 的醫學數據集組成:醫師聽寫數據集、醫師臨床筆記、醫學對話數據集、醫學轉錄數據集、醫患對話、醫學文本數據、醫學圖像 - CT 掃描、MRI、超聲(收集的基礎定制要求) .
不能找到你想要的?
正在收集所有數據類型的新的現成醫療數據集
立即聯繫我們,免除您的醫療培訓數據收集後顧之憂