符合 HIPAA 標準的醫生聽寫音訊數據,用於醫療保健 AI
使用符合隱私和 HIPAA 法規的現成醫生口述音訊資料加速醫療保健 AI 創新。
插入您今天缺少的數據源
高品質醫療音訊資料集,協助打造更智慧的 AI 模型
我們去識別化的醫療保健資料集包含來自 31 個不同專業的音訊文件,由醫生精心錄製。這些錄音詳細描述了患者的臨床狀況和護理計劃,這些內容源自於醫院和臨床環境中真實的醫患互動。此資料集完全符合隱私法規,是訓練高級醫療保健 AI 模型的理想選擇。
| 其他麵條 | 患者音頻文件(播放時間以小時為單位) | 音頻文件總數 |
|---|---|---|
| 總額 | 257,977 | 5,172,766 |
| 男性 | 58,850 | 2,444,910 |
| 女性 | 113,406 | 1,290,900 |
| 未知 | 85,721 | 1,436,956 |
| 其他麵條 | 患者音頻文件(播放時間以小時為單位) | 音頻文件總數 |
|---|---|---|
| 總額 | 257,977 | 5,172,766 |
| 事故和緊急情況 | 9 | 359 |
| 過敏與免疫學 | 1152 | 22202 |
| 麻醉學 | 677 | 22280 |
| 麻醉藥 | 1 | 9 |
| 亞太廣播電台 | 163 | 1693 |
| 心髒病 | 67504 | 1566721 |
| 心胸 | 17 | 122 |
| 心胸外科 | 1 | 10 |
| 臨床血液學 | 0 | 2 |
| 結腸和直腸手術 | 7 | 162 |
| 大腸直腸外科醫生 | 45 | 984 |
| 重症醫學 | 220 | 4328 |
| 牙醫 | 1 | 65 |
| 皮膚科 | 771 | 23014 |
| 營養師 | 44 | 736 |
| 急救藥物 | 4911 | 112518 |
| 內分泌 | 205 | 7052 |
| ENT | 7010 | 175477 |
| 家庭醫學 | 1767 | 106733 |
| 胃腸病 | 1458 | 40365 |
| 一般用藥 | 140 | 5757 |
| 一般做法 | 41 | 1318 |
| 普外科 | 2038 | 71744 |
| 婦科 | 3269 | 103370 |
| 手外科 | 2 | 45 |
| 血液學 | 258 | 8125 |
| Hospitalist | 5931 | 142529 |
| 傳染病 | 493 | 14001 |
| 內科 | 15410 | 445591 |
| 介入心髒病學 | 1511 | 43035 |
| 母胎醫學 | 51 | 1355 |
| 新生兒科 | 1045 | 24760 |
| 腎臟病學 | 735 | 20334 |
| 神經內科 | 2269 | 63774 |
| 神經外科 | 462 | 11990 |
| 核醫學 | 2 | 23 |
| 婦產科 | 3562 | 122303 |
| 腫瘤 | 2938 | 82996 |
| 眼科 | 1316 | 41047 |
| 驗光 | 33 | 1066 |
| 骨科 | 5665 | 164483 |
| 耳鼻喉科 | 3433 | 100811 |
| 病理 | 166 | 4097 |
| 小兒肺科 | 4 | 40 |
| 兒科專科 | 35 | 682 |
| 小兒外科 | 2 | 23 |
| 儿科 | 877 | 9271 |
| 物理醫學與康復 | 1347 | 23523 |
| 物理治療師 | 114 | 1713 |
| 醫師助理。 | 6 | 38 |
| 足科手術 | 4 | 24 |
| 足療 | 473 | 12296 |
| 初級保健 | 651 | 20120 |
| 精神病 | 2120 | 60381 |
| 肺病 | 1290 | 35290 |
| 放射腫瘤學 | 239 | 6558 |
| 放射線學 | 3345 | 99641 |
| 風濕病 | 293 | 8729 |
| 重症加護病房 | 1 | 25 |
| 語言病理學 | 3 | 28 |
| 外科腫瘤學 | 217 | 5758 |
| 胸外科 | 107 | 3336 |
| 移植手術 | 61 | 1535 |
| 泌尿外科 | 3170 | 96934 |
| 上消化道手術 | 4 | 58 |
| 血管外科 | 19 | 156 |
| 血管/一般 | 9 | 268 |
| 傷口敷貼 | 15 | 211 |
| 其他麵條 | 患者音頻文件(播放時間以小時為單位) | 音頻文件總數 |
|---|---|---|
| 總額 | 257,977 | 5,172,766 |
| 蘋果手機 | 666 | 32,382 |
| 數碼錄音機 | 1,659 | 22,377 |
| 混合型 | 69,818 | 1,408,679 |
| 智能手機 | 51,533 | 1,306,405 |
| 語音麥克風 | 10,329 | 257,730 |
| 電話聽寫 | 120,867 | 2,071,557 |
| 未知 | 3,104 | 73,636 |
我們處理所有類型的數據許可,即文本、音頻、視頻或圖像。 數據集由 ML 的醫學數據集組成:醫師聽寫數據集、醫師臨床筆記、醫學對話數據集、醫學轉錄數據集、醫患對話、醫學文本數據、醫學圖像 - CT 掃描、MRI、超聲(收集的基礎定制要求) .
不能找到你想要的?
正在收集所有數據類型的新的現成醫療數據集
立即聯繫我們,免除您的醫療培訓數據收集後顧之憂
常見問題
1.什麼是醫生口述音頻資料?
醫師口述音訊資料包括醫師在會診或醫院就診期間描述病患的臨床狀況、治療計畫或病史的音訊檔案。
2.為什麼醫生口述音訊資料對 AI/ML 專案很重要?
這些數據對於訓練語音辨識、自然語言處理 (NLP) 和臨床文件自動化領域的 AI 模型至關重要。它有助於建立用於轉錄、分析和改進醫療文件工作流程的系統。
3. 有哪些類型的醫學音訊資料集?
該資料集涵蓋 257,977 個醫學專科的 31 小時真實醫生口述記錄。音訊使用各種設備錄製,包括電話、數位錄音機、智慧型手機和語音麥克風。
4. 醫療音頻資料是否經過去識別化處理?
是的,所有音訊檔案都經過去識別處理,刪除個人識別資訊 (PII),確保患者的隱私。
5. 資料集是否符合 HIPAA 和其他法規?
是的,資料集遵守 HIPAA 和安全港指南以及其他全球隱私標準。
6. 資料集可以自訂嗎?
是的,可以根據專案要求針對特定專業、人口統計或記錄設備類型自訂資料集。
7.這些資料集是否適用於大型專案?
當然。這些資料集非常龐大,包含數百萬個音訊文件,因此適合小型和大型 AI/ML 專案。
8. 數據如何融入AI模型?
醫療音訊資料和相應的記錄以標準格式提供,可無縫整合到語音辨識和自然語言處理 (NLP) 模型中。
9. 數據品質如何保證?
音訊資料經過嚴格的品質檢查,並由領域專家驗證註釋以確保準確性和可靠性。
10. 這些資料集是否適用於大型人工智慧專案?
費用取決於資料量、客製化程度和項目範圍等因素。請您填寫「聯絡我們」表格,告知您的特定需求,以便我們為您提供最優報價。
11. 這些資料集的交付時間表是什麼?
交付時間表根據專案的規模和複雜性而有所不同,但其結構是為了有效地滿足最後期限。
12.醫生口述音頻資料集如何改善醫療保健AI?
這些資料集增強了人工智慧在自動化臨床文件、提高轉錄準確性以及幫助醫療保健提供者做出更好決策方面的能力。