用於醫療保健 AI 的醫生聽寫音訊資料集
存取 257,977 個專業的 31 小時醫學音訊數據
插入您今天缺少的數據源
用於機器學習的醫生口述音訊資料集
我們的醫療保健去識別資料集包括 31 個不同專業的音訊文件,由醫生口述,描述患者的臨床狀況以及基於醫院/臨床環境中醫患接觸的護理計劃。
現成的醫師聽寫音頻文件:
- 來自 257,977 個專業的 31 小時真實世界醫療音訊資料集,用於訓練醫療保健 ASR 模型
- 從電話聽寫 (54.3%)、數字錄音機 (24.9%)、語音麥克風 (5.4%)、智能手機 (2.7%) 和未知 (12.7%) 等各種設備捕獲的聽寫音頻
- 遵循 HIPAA 安全港指南的 PII 編輯音頻和成績單
按性別劃分的醫療音訊數據
其他麵條 | 患者音頻文件(播放時間以小時為單位) | 音頻文件總數 |
---|---|---|
總額 | 257,977 | 5,172,766 |
男性 | 58,850 | 2,444,910 |
女性 | 113,406 | 1,290,900 |
未知 | 85,721 | 1,436,956 |
按專業劃分的醫療音訊數據
其他麵條 | 患者音頻文件(播放時間以小時為單位) | 音頻文件總數 |
---|---|---|
疼痛醫學 | 1 | 11 |
足科手術 | 4 | 24 |
整形外科 – 專業 | 13 | 183 |
醫師助理。 | 6 | 38 |
物理治療師 | 114 | 1713 |
物理醫學與康復 | 1347 | 23523 |
儿科 | 877 | 9271 |
小兒外科 | 2 | 23 |
兒科專科 | 35 | 682 |
小兒肺科 | 4 | 40 |
小兒牙科 | 15 | 420 |
病理 | 1143 | 43462 |
聚苯胺 | 10760 | 145960 |
足療 | 892 | 12056 |
疼痛管理 | 2 | 30 |
耳鼻喉科 | 995 | 19548 |
骨病 | 310 | 5566 |
骨科 | 4849 | 145053 |
骨科與運動醫學 | 149 | 3165 |
口腔外科 | 1 | 13 |
口腔頜面外科醫生 | 1 | 8 |
眼科 | 609 | 19299 |
手術護理 | 0 | 5 |
腫瘤 | 6816 | 82300 |
職業治療師 | 8 | 68 |
手術 | 14431 | 236788 |
傷口敷貼 | 15 | 211 |
血管/一般 | 9 | 268 |
血管外科 | 19 | 156 |
泌尿外科 | 3170 | 96934 |
上消化道手術 | 4 | 58 |
未知 | 42269 | 748054 |
創傷和骨科 | 140 | 1308 |
移植 | 3 | 32 |
胸外科 | 4 | 37 |
胸科醫學 | 5 | 27 |
外科專業 | 22 | 290 |
外科醫師助理 | 0 | 3 |
職業醫學 | 79 | 763 |
運動醫學 | 3 | 49 |
語言治療 | 29 | 327 |
風濕病 | 13 | 124 |
居民 | 46 | 641 |
復原 | 2515 | 30078 |
放射線學 | 10962 | 630983 |
肺的 | 3809 | 64368 |
心理治療(專業) | 50 | 229 |
精神病 | 8871 | 70269 |
初級保健就讀 | 1 | 7 |
預防醫學 | 21 | 191 |
牙科 | 55 | 1233 |
關於你的刊登物: | 26 | 313 |
胃腸病 | 3127 | 62158 |
家庭實踐 | 262 | 2498 |
家庭護士執業者 | 424 | 9018 |
家庭醫學科 | 13639 | 263480 |
內分泌 | 219 | 3212 |
急診室專家 | 30 | 378 |
緊急新聞 | 3675 | 62256 |
ED醫師助理 | 0 | 70 |
耳鼻喉 | 51 | 658 |
診斷放射學 | 255 | 7591 |
皮膚科 | 148 | 3474 |
一般牙科診所 | 2 | 25 |
重症監護 | 707 | 9645 |
臨床生理學 | 50 | 160 |
臨床血液學 | 0 | 2 |
心胸外科 | 1 | 10 |
心胸 | 17 | 122 |
心髒病 | 67504 | 1566721 |
亞太廣播電台 | 163 | 1693 |
麻醉藥 | 1 | 9 |
麻醉學 | 677 | 22280 |
過敏與免疫學 | 1152 | 22202 |
事故和緊急情況 | 9 | 359 |
IH-工業健康 | 73 | 945 |
產科/婦科 | 2424 | 42739 |
執業護士 - 家庭 | 9 | 113 |
護士執業 | 81 | 432 |
神經外科 | 86 | 755 |
神經內科 | 1476 | 17786 |
神經/腦外傷 | 173 | 1157 |
腎臟病學 | 2431 | 39821 |
藥物 | 5 | 122 |
醫學腫瘤學 | 16 | 67 |
內科、肺科、重症醫學和睡眠醫學 | 5 | 102 |
內科和腎內科 | 15 | 111 |
內科 | 42604 | 623072 |
總額 | 257,977 | 5,172,766 |
Hospitalist | 99 | 1493 |
臨終關懷和姑息治療 | 4 | 41 |
HIM | 0 | 19 |
血液學 – 腫瘤學 | 22 | 394 |
婦科 | 4 | 25 |
GI | 55 | 550 |
老年醫學 | 461 | 5323 |
普外科 | 237 | 2220 |
普通外科醫師 | 27 | 893 |
普通精神病學 | 3 | 36 |
一般用藥 | 30 | 327 |
按設備分類的醫療音訊數據
其他麵條 | 患者音頻文件(播放時間以小時為單位) | 音頻文件總數 |
---|---|---|
總額 | 257,977 | 5,172,766 |
蘋果手機 | 666 | 32,382 |
數碼錄音機 | 1,659 | 22,377 |
混合型 | 69,818 | 1,408,679 |
智能手機 | 51,533 | 1,306,405 |
語音麥克風 | 10,329 | 257,730 |
電話聽寫 | 120,867 | 2,071,557 |
未知 | 3,104 | 73,636 |
我們處理所有類型的數據許可,即文本、音頻、視頻或圖像。 數據集由 ML 的醫學數據集組成:醫師聽寫數據集、醫師臨床筆記、醫學對話數據集、醫學轉錄數據集、醫患對話、醫學文本數據、醫學圖像 - CT 掃描、MRI、超聲(收集的基礎定制要求) .
不能找到你想要的?
正在收集所有數據類型的新的現成醫療數據集
立即聯繫我們,免除您的醫療培訓數據收集後顧之憂
常見問題
1.什麼是醫生口述音頻資料?
醫師口述音訊資料包括醫師在會診或醫院就診期間描述病患的臨床狀況、治療計畫或病史的音訊檔案。
2.為什麼醫生口述音訊資料對 AI/ML 專案很重要?
這些數據對於訓練語音辨識、自然語言處理 (NLP) 和臨床文件自動化領域的 AI 模型至關重要。它有助於建立用於轉錄、分析和改進醫療文件工作流程的系統。
3. 有哪些類型的醫學音訊資料集?
該資料集涵蓋 257,977 個醫學專科的 31 小時真實醫生口述記錄。音訊使用各種設備錄製,包括電話、數位錄音機、智慧型手機和語音麥克風。
4. 醫療音頻資料是否經過去識別化處理?
是的,所有音訊檔案都經過去識別處理,刪除個人識別資訊 (PII),確保患者的隱私。
5. 資料集是否符合 HIPAA 和其他法規?
是的,資料集遵守 HIPAA 和安全港指南以及其他全球隱私標準。
6. 資料集可以自訂嗎?
是的,可以根據專案要求針對特定專業、人口統計或記錄設備類型自訂資料集。
7.這些資料集是否適用於大型專案?
當然。這些資料集非常龐大,包含數百萬個音訊文件,因此適合小型和大型 AI/ML 專案。
8. 數據如何融入AI模型?
醫療音訊資料和相應的記錄以標準格式提供,可無縫整合到語音辨識和自然語言處理 (NLP) 模型中。
9. 數據品質如何保證?
音訊資料經過嚴格的品質檢查,並由領域專家驗證註釋以確保準確性和可靠性。
10. 這些資料集是否適用於大型人工智慧專案?
費用取決於資料量、客製化程度和項目範圍等因素。請您填寫「聯絡我們」表格,告知您的特定需求,以便我們為您提供最優報價。
11. 這些資料集的交付時間表是什麼?
交付時間表根據專案的規模和複雜性而有所不同,但其結構是為了有效地滿足最後期限。
12.醫生口述音頻資料集如何改善醫療保健AI?
這些資料集增強了人工智慧在自動化臨床文件、提高轉錄準確性以及幫助醫療保健提供者做出更好決策方面的能力。