適用於 AI 和 ML 項目的電子健康記錄 (EHR) 數據集
現成的電子健康記錄 (EHR) 數據集可快速啟動您的醫療保健 AI 項目。
插入您今天缺少的數據源
為您的醫療保健 AI 找到正確的電子健康記錄 (EHR) 數據
使用一流的訓練數據改進您的機器學習模型。 電子健康記錄或 EHR 是包含患者病史、診斷、處方、治療計劃、疫苗接種或免疫接種日期、過敏、放射學圖像(CT 掃描、MRI、X 射線)和實驗室測試等的醫療記錄。 我們現成的數據目錄使您可以輕鬆獲得值得信賴的醫療培訓數據。
現成的電子健康記錄 (EHR):
- 5.1 個專業的 31 萬個以上記錄和醫生音頻文件
- 用於訓練臨床 NLP 和其他 Document AI 模型的真實世界黃金標準病歷
- 元數據信息,例如 MRN(匿名)、入院日期、出院日期、住院天數、性別、患者類別、付款人、財務類別、狀態、出院處置、年齡、DRG、DRG 描述、$ 報銷、AMLOS、GMLOS、風險死亡率、疾病嚴重程度、石斑魚、醫院郵政編碼等。
- 來自美國各州和地區的醫療記錄 - 東北 (46%)、南部 (9%)、中西部 (3%)、西部 (28%)、其他 (14%)
- 屬於所有患者類別的醫療記錄 - 住院患者、門診患者(臨床、康復、經常性、外科日間護理)、急診。
- 屬於所有患者年齡組的病歷 <10 歲 (7.9%)、11-20 歲 (5.7%)、21-30 歲 (10.9%)、31-40 歲 (11.7%)、41-50 歲 (10.4%) ), 51-60 歲 (13.8%), 61-70 歲 (16.1%), 71-80 歲 (13.3%), 81-90 歲 (7.8%), 90 歲以上 (2.4%)
- 患者性別比例為 46%(男性)和 54%(女性)
- 符合 HIPAA 的符合安全港指南的 PII 編輯文檔
| 地點 | 文本文檔 |
|---|---|
| 東北 | 4,473,573 |
| South | 1,801,716 |
| 中西部 | 781,701 |
| 西部 | 1,509,109 |
| 主要診斷類別 | 文本文檔 |
|---|---|
| 酒精/藥物使用和酒精/藥物引起的有機精神障礙 | 48,717 |
| 總計包括所有內容(有和沒有 MDC 類別的情況) | 8,566,687 |
| 生成未報銷的案例(未指定 MDC) | 790,697 |
| 門診病例(未指定 MDC) | 1,980,606 |
| 使用 3M 等特種石斑魚的案例(未指定 MDC) | 1,619,682 |
| 與 MDC 合計 | 4,175,702 |
| 酒精/藥物使用或誘發的精神障礙 | 48,717 |
| 伯恩斯 | 444 |
| 眼 | 3,549 |
| 男性生殖系統 | 9,230 |
| 人類免疫缺陷病毒感染 | 12,422 |
| 骨髓增生性疾病和疾病,低分化腫瘤 | 15,620 |
| 影響健康狀況和其他與衛生服務聯繫的因素 | 21,294 |
| 女性生殖系統 | 17,010 |
| 耳鼻喉 | 22,987 |
| 多重重大創傷 | 27,902 |
| 循環系統 | 589,730 |
| 血液、造血器官和免疫系統疾病 | 48,990 |
| 藥物的傷害、中毒和毒性作用 | 64,097 |
| 皮膚、皮下組織和乳房 | 89,577 |
| 肝膽系統和胰腺 | 127,172 |
| 內分泌、營養和代謝疾病和障礙 | 142,808 |
| 新生兒和其他新生兒疾病起源於圍產期 | 163,605 |
| 懷孕、分娩和產褥期 | 165,303 |
| 腎臟和泌尿道 | 209,561 |
| 精神疾病和障礙 | 282,501 |
| 神經系統 | 316,243 |
| 消化系統 | 346,369 |
| 肌肉骨骼系統和結締組織 | 329,344 |
| 呼吸系統 | 561,983 |
| 傳染病和寄生蟲病 | 559,244 |
我們處理所有類型的數據許可,即文本、音頻、視頻或圖像。 數據集由 ML 的醫學數據集組成:醫師聽寫數據集、醫師臨床筆記、醫學對話數據集、醫學轉錄數據集、醫患對話、醫學文本數據、醫學圖像 - CT 掃描、MRI、超聲(收集的基礎定制要求) .
EHR 資料集在 AI/ML 中的實際應用
- 疾病預測與診斷:訓練人工智慧模型預測糖尿病、癌症和心血管疾病等疾病。
- 臨床決策支持:透過向 AI 系統提供豐富的患者病史和實驗室結果來增強決策能力。
- 個性化醫學:使用人口統計和診斷數據來推薦個人化的治療方案。
- 醫療保健自動化:使用在 EHR 資料集上訓練的 NLP 工具自動執行預約安排或計費等管理任務。
為什麼選擇 Shaip 作為 EHR 資料集?
專家勞動力
熟練的專業人員確保資料註釋準確且高品質。
監管合規
完全符合 HIPAA 和 GDPR 的去識別資料集。
可定制的解決方案
根據人口統計、專業或地區定制的資料集。
競爭力的價格
提供具有成本效益的解決方案,且不影響品質。
無偏差數據
嚴格的協議消除了偏見,確保了可靠的人工智慧結果。
快速且準確
簡化的流程確保快速交付多樣化、高品質的數據。
可用性和交付
數據、服務和解決方案的高網絡正常運行時間和準時交付。
全球勞動力
憑藉在岸和離岸資源池,我們可以根據各種用例的需要建立和擴展團隊。
人員、流程和平台
透過結合全球勞動力、強大的平台以及由 6 西格瑪黑帶設計的營運流程,Shaip 協助啟動最具挑戰性的 AI 計畫。
不能找到你想要的?
正在收集所有數據類型的新的現成醫療數據集
立即聯繫我們,免除您的醫療培訓數據收集後顧之憂
常見問題
1. EHR 資料集在 AI 中用於什麼?
EHR 資料集用於訓練疾病預測、臨床決策和個人化治療的 AI 模型。
2. EHR 資料如何在 AI/ML 專案中使用?
EHR 資料用於訓練 AI 模型,以實現臨床決策支援、疾病預測、個人化治療計劃和醫療保健自動化。
3. EHR 資料是否已去識別化?
是的,所有 EHR 資料都經過去識別化處理,以刪除個人識別資訊 (PII) 並遵守隱私法規。
4. EHR資料的關鍵組成部分是什麼?
EHR 資料包含患者人口統計、病史、診斷、治療計劃、實驗室檢查結果、放射影像(例如 CT、MRI、X 光)、處方和免疫接種記錄等詳細資訊。
5.資料是否符合HIPAA和其他法規?
是的,資料遵守 HIPAA、GDPR 和其他全球隱私標準,以確保安全和道德的使用。
6. EHR 資料集可以客製化嗎?
是的,資料集可以根據特定的醫學專業、地區、患者人口統計或專案要求進行客製化。
7. 數據可以整合到我的AI模型嗎?
是的,資料集以標準格式(例如 JSON、CSV)提供,以便輕鬆整合到 AI 和 ML 工作流程中。
8. 如何保證數據品質?
數據經過嚴格的驗證和品質檢查,以確保準確性、一致性和可靠性。
9. EHR 資料集的成本是多少?
費用取決於資料量、客製化程度和項目範圍等因素。請填寫「聯絡我們」表格,告知您的特定需求,以便我們為您提供最優報價。
10. EHR 資料集的交付時間表是什麼?
交付時間根據專案規模和複雜性而有所不同,但旨在滿足商定的期限。
11. EHR 資料集如何改善醫療保健 AI 解決方案?
EHR 資料集使 AI 系統能夠提供更好的診斷、預測見解和個人化治療,從而改善患者的治療效果和醫療效率。
12. 我可以獲得客製化的 EHR 資料集嗎?
是的,Shaip 根據專業、年齡層、地理位置或專案要求提供客製化的 EHR 資料集。