用於醫療保健 AI 的醫生聽寫音訊資料集

存取 257,977 個專業的 31 小時醫學音訊數據

醫生聽寫音頻資料集

插入您今天缺少的數據源

用於機器學習的醫生口述音訊資料集

我們的醫療保健去識別資料集包括 31 個不同專業的音訊文件,由醫生口述,描述患者的臨床狀況以及基於醫院/臨床環境中醫患接觸的護理計劃。

現成的醫師聽寫音頻文件:

  • 來自 257,977 個專業的 31 小時真實世界醫療音訊資料集,用於訓練醫療保健 ASR 模型
  • 從電話聽寫 (54.3%)、數字錄音機 (24.9%)、語音麥克風 (5.4%)、智能手機 (2.7%) 和未知 (12.7%) 等各種設備捕獲的聽寫音頻
  • 遵循 HIPAA 安全港指南的 PII 編輯音頻和成績單
按性別劃分的醫療音訊數據
其他麵條患者音頻文件(播放時間以小時為單位)音頻文件總數

總額

257,9775,172,766
男性58,8502,444,910
女性113,4061,290,900
未知85,7211,436,956
按專業劃分的醫療音訊數據
其他麵條患者音頻文件(播放時間以小時為單位)音頻文件總數
疼痛醫學111
足科手術424
整形外科 – 專業13183
醫師助理。638
物理治療師1141713
物理醫學與康復134723523
儿科8779271
小兒外科223
兒科專科35682
小兒肺科440
小兒牙科15420
病理114343462
聚苯胺10760145960
足療89212056
疼痛管理230
耳鼻喉科99519548
骨病3105566
骨科4849145053
骨科與運動醫學1493165
口腔外科113
口腔頜面外科醫生18
眼科60919299
手術護理05
腫瘤681682300
職業治療師868
手術14431236788
傷口敷貼15211
血管/一般9268
血管外科19156
泌尿外科317096934
上消化道手術458
未知42269748054
創傷和骨科1401308
移植332
胸外科437
胸科醫學527
外科專業22290
外科醫師助理03
職業醫學79763
運動醫學349
語言治療29327
風濕病13124
居民46641
復原251530078
放射線學10962630983
肺的380964368
心理治療(專業)50229
精神病887170269
初級保健就讀17
預防醫學21191
牙科551233
關於你的刊登物:26313
胃腸病312762158
家庭實踐2622498
家庭護士執業者4249018
家庭醫學科13639263480
內分泌2193212
急診室專家30378
緊急新聞367562256
ED醫師助理070
耳鼻喉51658
診斷放射學2557591
皮膚科1483474
一般牙科診所225
重症監護7079645
臨床生理學50160
臨床血液學02
心胸外科110
心胸17122
心髒病675041566721
亞太廣播電台1631693
麻醉藥19
麻醉學67722280
過敏與免疫學115222202
事故和緊急情況9359
IH-工業健康73945
產科/婦科242442739
執業護士 - 家庭9113
護士執業81432
神經外科86755
神經內科147617786
神經/腦外傷1731157
腎臟病學243139821
藥物5122
醫學腫瘤學1667
內科、肺科、重症醫學和睡眠醫學5102
內科和腎內科15111
內科42604623072

總額

257,9775,172,766
Hospitalist991493
臨終關懷和姑息治療441
HIM019
血液學 – 腫瘤學22394
婦科425
GI55550
老年醫學4615323
普外科2372220
普通外科醫師27893
普通精神病學336
一般用藥30327
按設備分類的醫療音訊數據
其他麵條患者音頻文件(播放時間以小時為單位)音頻文件總數

總額

257,9775,172,766
蘋果手機66632,382
數碼錄音機1,65922,377
混合型 69,8181,408,679
智能手機51,5331,306,405
語音麥克風10,329257,730
電話聽寫120,8672,071,557
未知3,10473,636

我們處理所有類型的數據許可,即文本、音頻、視頻或圖像。 數據集由 ML 的醫學數據集組成:醫師聽寫數據集、醫師臨床筆記、醫學對話數據集、醫學轉錄數據集、醫患對話、醫學文本數據、醫學圖像 - CT 掃描、MRI、超聲(收集的基礎定制要求) .

賽普聯絡我們

不能找到你想要的?

正在收集所有數據類型的新的現成醫療數據集 

立即聯繫我們,免除您的醫療培訓數據收集後顧之憂

  • 通過註冊,我同意 Shaip 隱私政策 服務條款 並同意接受來自 Shaip 的 B2B 營銷傳播。

醫師口述音訊資料包括醫師在會診或醫院就診期間描述病患的臨床狀況、治療計畫或病史的音訊檔案。

這些數據對於訓練語音辨識、自然語言處理 (NLP) 和臨床文件自動化領域的 AI 模型至關重要。它有助於建立用於轉錄、分析和改進醫療文件工作流程的系統。

該資料集涵蓋 257,977 個醫學專科的 31 小時真實醫生口述記錄。音訊使用各種設備錄製,包括電話、數位錄音機、智慧型手機和語音麥克風。

是的,所有音訊檔案都經過去識別處理,刪除個人識別資訊 (PII),確保患者的隱私。

是的,資料集遵守 HIPAA 和安全港指南以及其他全球隱私標準。

是的,可以根據專案要求針對特定專業、人口統計或記錄設備類型自訂資料集。

當然。這些資料集非常龐大,包含數百萬個音訊文件,因此適合小型和大型 AI/ML 專案。

醫療音訊資料和相應的記錄以標準格式提供,可無縫整合到語音辨識和自然語言處理 (NLP) 模型中。

音訊資料經過嚴格的品質檢查,並由領域專家驗證註釋以確保準確性和可靠性。

費用取決於資料量、客製化程度和項目範圍等因素。請您填寫「聯絡我們」表格,告知您的特定需求,以便我們為您提供最優報價。

交付時間表根據專案的規模和複雜性而有所不同,但其結構是為了有效地滿足最後期限。

這些資料集增強了人工智慧在自動化臨床文件、提高轉錄準確性以及幫助醫療保健提供者做出更好決策方面的能力。