許可用於 AI 和 ML 模型的高質量醫療保健/醫療數據
現成的醫療保健/醫療數據集可快速啟動您的醫療保健 AI 項目
插入您今天缺少的數據源
用於機器學習的醫療和保健數據集
醫師聽寫音頻數據
我們的醫療保健去識別資料集包括 31 個專業的音訊文件,由醫生口述,描述患者的臨床狀況以及基於臨床環境中醫患接觸的護理計劃。
現成的醫師聽寫音頻文件:
- 來自 257,977 個專業的 31 小時真實醫生聽寫語音資料集,用於訓練醫療保健語音模型
- 從電話聽寫 (54.3%)、數字錄音機 (24.9%)、語音麥克風 (5.4%)、智能手機 (2.7%) 和未知 (12.7%) 等各種設備捕獲的聽寫音頻
- 遵循 HIPAA 安全港指南的 PII 編輯音頻和成績單
轉錄病歷
轉錄病歷是指醫病對話、醫療報告和醫療評估的記錄。它有助於記錄患者的病史,以便日後就診,並作為醫生的參考依據。它有助於評估患者的當前狀況並提出合適的治療方案。
現成的轉錄醫療記錄:
- 轉錄來自 257,977 個專業的 31 小時真實世界醫師聽寫,以訓練醫療保健語音模型
- 從各種工作類型轉錄的醫療記錄,如手術報告、出院總結、會診記錄、入院記錄、ED 記錄、臨床記錄、放射學報告等。
- 遵循 HIPAA 安全港指南的 PII 編輯音頻和成績單
電子健康記錄 (EHR)
電子健康記錄或 EHR 是包含患者病史、診斷、處方、治療計劃、疫苗接種或免疫接種日期、過敏、放射學圖像(CT 掃描、MRI、X 射線)和實驗室測試等的醫療記錄。
現成的電子健康記錄 (EHR):
- 5.1 個專業的 31 萬個以上記錄和醫生音頻文件
- 用於訓練臨床 NLP 和其他 Document AI 模型的真實世界黃金標準病歷
- 元數據信息,例如 MRN(匿名)、入院日期、出院日期、住院天數、性別、患者類別、付款人、財務類別、狀態、出院處置、年齡、DRG、DRG 描述、$ 報銷、AMLOS、GMLOS、風險死亡率、疾病嚴重程度、石斑魚、醫院郵政編碼等。
- 來自美國各州和地區的醫療記錄 - 東北 (46%)、南部 (9%)、中西部 (3%)、西部 (28%)、其他 (14%)
- 屬於所有患者類別的醫療記錄 - 住院患者、門診患者(臨床、康復、經常性、外科日間護理)、急診。
- 屬於所有患者年齡組的病歷 <10 歲 (7.9%)、11-20 歲 (5.7%)、21-30 歲 (10.9%)、31-40 歲 (11.7%)、41-50 歲 (10.4%) ), 51-60 歲 (13.8%), 61-70 歲 (16.1%), 71-80 歲 (13.3%), 81-90 歲 (7.8%), 90 歲以上 (2.4%)
- 患者性別比例為 46%(男性)和 54%(女性)
- 符合 HIPAA 的符合安全港指南的 PII 編輯文檔
CT 掃描圖像數據集
醫生使用 CT 掃描影像來診斷和檢測患者體內的異常或正常狀況。 在電腦影像處理診斷中,CT掃描影像經歷了複雜的階段,即擷取、影像增強、重要特徵提取、感興趣區域(ROI)識別、結果解釋等。
Shaip 提供對研究和醫學診斷至關重要的高品質 CT 掃描影像資料集。 我們的資料集包括從真實患者收集並使用最先進技術處理的數千張高解析度影像。 這些數據集旨在幫助醫療專業人員和研究人員提高對各種醫療狀況的知識和理解,包括癌症、神經系統疾病和心血管疾病。
MRI 圖像數據集
電腦視覺模型旨在從數位影像和影片中獲取有意義的資訊。 它允許廣泛使用醫療保健影像數據來提供更好的疾病診斷、治療和預測。 它可以使用圖像序列、紋理、形狀和輪廓資訊以及過去的知識中的上下文來產生有助於提高人類理解的 3D 和 4D 資訊。 與 CT 掃描一樣,MRI 也用於診斷和檢測患者體內的異常或正常狀況(即,識別身體各部位的疾病或損傷)。
Shaip 提供來自真實患者的高品質 MRI 影像資料集,並採用最先進的技術進行處理。
X 射線圖像數據集
X射線檢測用於驗證對象的內部結構和完整性。 可以在不同位置和不同能量級別生成測試對象的 X 射線圖像,以診斷和檢測患者身體的異常情況。
Shaip 提供對研究和醫學診斷必不可少的高質量 X 射線圖像數據集。 我們的數據集包括從真實患者那裡收集並使用最先進技術處理的數千張高分辨率圖像。 借助 Shaip,您可以獲得可靠且準確的醫療數據,以加強您的研究並改善患者的治療效果。
不能找到你想要的?
正在收集所有數據類型的新的現成醫療數據集
立即聯繫我們,免除您的醫療培訓數據收集後顧之憂
常見問題
1.什麼是醫療資料集?
醫療數據集包括用於訓練 AI 模型的醫療保健數據,例如醫生口述、轉錄記錄、EHR 和醫學影像(CT、MRI、X 光)。
2. 數據是否符合醫療保健法規?
是的,資料集符合 HIPAA 和 GDPR 等醫療保健法規,以確保資料使用安全和道德。
3. 資料集可以根據特定需求進行客製化嗎?
是的,資料集可以根據特定的專業、人口統計、資料格式和專案要求進行客製化。
4. 這些資料集的品質保證如何進行?
數據經過嚴格的品質檢查,包括由領域專家進行註釋,以確保準確性和可靠性。每個資料集都符合黃金標準要求。
5.這些資料集是否可擴充用於大型 AI/ML 專案?
是的,資料集是可擴展的,以滿足小型和大型專案的需求,包括數百萬筆記錄或數小時的音訊。
6. 這些資料集可以整合到現有的AI模型中嗎?
是的,資料集以可立即使用的格式(例如 JSON、CSV)提供,以便與現有的 AI 和 ML 工作流程無縫整合。
7. 醫療資料集的成本是多少?
費用取決於資料集類型、數量、客製化程度和交付時間等因素。請填寫「聯絡我們」表格,告知您的特定需求,以取得報價。
8. 交付資料集需要多久時間?
交付時間表根據專案複雜性和資料集大小而有所不同,但其結構可滿足您的專案期限。
9.為什麼醫療資料集對AI/ML很重要?
高品質的醫療資料集對於訓練人工智慧模型以提高準確性、自動化任務和增強醫療保健決策至關重要。