符合 HIPAA 標準的醫生聽寫音訊數據,用於醫療保健 AI

使用符合隱私和 HIPAA 法規的現成醫生口述音訊資料加速醫療保健 AI 創新。

醫生聽寫音頻資料集

插入您今天缺少的數據源

高品質醫療音訊資料集,協助打造更智慧的 AI 模型

我們去識別化的醫療保健資料集包含來自 31 個不同專業的音訊文件,由醫生精心錄製。這些錄音詳細描述了患者的臨床狀況和護理計劃,這些內容源自於醫院和臨床環境中真實的醫患互動。此資料集完全符合隱私法規,是訓練高級醫療保健 AI 模型的理想選擇。

按性別劃分的醫療音訊數據
其他麵條 患者音頻文件(播放時間以小時為單位) 音頻文件總數
總額257,9775,172,766
男性58,8502,444,910
女性113,4061,290,900
未知85,7211,436,956
按專業劃分的醫療音訊數據
其他麵條 患者音頻文件(播放時間以小時為單位) 音頻文件總數
總額257,9775,172,766
事故和緊急情況9359
過敏與免疫學115222202
麻醉學67722280
麻醉藥19
亞太廣播電台1631693
心髒病675041566721
心胸17122
心胸外科110
臨床血液學02
結腸和直腸手術7162
大腸直腸外科醫生45984
重症醫學2204328
牙醫165
皮膚科77123014
營養師44736
急救藥物4911112518
內分泌2057052
ENT7010175477
家庭醫學1767106733
胃腸病145840365
一般用藥1405757
一般做法411318
普外科203871744
婦科3269103370
手外科245
血液學2588125
Hospitalist5931142529
傳染病49314001
內科15410445591
介入心髒病學151143035
母胎醫學511355
新生兒科104524760
腎臟病學73520334
神經內科226963774
神經外科46211990
核醫學223
婦產科3562122303
腫瘤293882996
眼科131641047
驗光331066
骨科5665164483
耳鼻喉科3433100811
病理1664097
小兒肺科440
兒科專科35682
小兒外科223
儿科8779271
物理醫學與康復134723523
物理治療師1141713
醫師助理。638
足科手術424
足療47312296
初級保健65120120
精神病212060381
肺病129035290
放射腫瘤學2396558
放射線學334599641
風濕病2938729
重症加護病房125
語言病理學328
外科腫瘤學2175758
胸外科1073336
移植手術611535
泌尿外科317096934
上消化道手術458
血管外科19156
血管/一般9268
傷口敷貼15211
按設備分類的醫療音訊數據
其他麵條 患者音頻文件(播放時間以小時為單位) 音頻文件總數
總額257,9775,172,766
蘋果手機66632,382
數碼錄音機1,65922,377
混合型69,8181,408,679
智能手機51,5331,306,405
語音麥克風10,329257,730
電話聽寫120,8672,071,557
未知3,10473,636

我們處理所有類型的數據許可,即文本、音頻、視頻或圖像。 數據集由 ML 的醫學數據集組成:醫師聽寫數據集、醫師臨床筆記、醫學對話數據集、醫學轉錄數據集、醫患對話、醫學文本數據、醫學圖像 - CT 掃描、MRI、超聲(收集的基礎定制要求) .

賽普聯絡我們

不能找到你想要的?

正在收集所有數據類型的新的現成醫療數據集 

立即聯繫我們,免除您的醫療培訓數據收集後顧之憂

  • 通過註冊,我同意 Shaip 隱私政策 服務條款 並同意接受來自 Shaip 的 B2B 營銷傳播。

醫師口述音訊資料包括醫師在會診或醫院就診期間描述病患的臨床狀況、治療計畫或病史的音訊檔案。

這些數據對於訓練語音辨識、自然語言處理 (NLP) 和臨床文件自動化領域的 AI 模型至關重要。它有助於建立用於轉錄、分析和改進醫療文件工作流程的系統。

該資料集涵蓋 257,977 個醫學專科的 31 小時真實醫生口述記錄。音訊使用各種設備錄製,包括電話、數位錄音機、智慧型手機和語音麥克風。

是的,所有音訊檔案都經過去識別處理,刪除個人識別資訊 (PII),確保患者的隱私。

是的,資料集遵守 HIPAA 和安全港指南以及其他全球隱私標準。

是的,可以根據專案要求針對特定專業、人口統計或記錄設備類型自訂資料集。

當然。這些資料集非常龐大,包含數百萬個音訊文件,因此適合小型和大型 AI/ML 專案。

醫療音訊資料和相應的記錄以標準格式提供,可無縫整合到語音辨識和自然語言處理 (NLP) 模型中。

音訊資料經過嚴格的品質檢查,並由領域專家驗證註釋以確保準確性和可靠性。

費用取決於資料量、客製化程度和項目範圍等因素。請您填寫「聯絡我們」表格,告知您的特定需求,以便我們為您提供最優報價。

交付時間表根據專案的規模和複雜性而有所不同,但其結構是為了有效地滿足最後期限。

這些資料集增強了人工智慧在自動化臨床文件、提高轉錄準確性以及幫助醫療保健提供者做出更好決策方面的能力。