ASR 綜合醫療保健對話
透過綜合醫療保健對話實現環境技術開發
在臨床環境中收集和轉錄超過 2000 小時的音訊數據
在對話式人工智慧快速發展的領域中,值得注意的應用之一是在醫療保健領域,該領域利用技術來簡化提供者與患者之間的互動。 我們的客戶是醫療保健技術領域的領導者,他們向 Shaip 尋求增強其自動語音辨識 (ASR) 模型的要求,以便更好地理解和轉錄臨床環境中的多方對話。 由於隱私法規的限制,獲取現實世界的對話具有挑戰性; 因此,我們的想法是在醫療保健提供者和患者之間創建和記錄綜合而現實的互動。
體積
2,000 小時,或約 12,000 至 24,000 個體綜合交互作用 10 分鐘的平均持續時間。
目標
我們的主要目標是產生約 2,000 小時的錄音,轉化為 12,000 至 24,000 條精心製作的合成互動,體現性別、年齡、口音和醫療角色的多樣性。 這個全面且真實的資料集旨在模擬現實世界的臨床對話,在嚴格遵守 HIPAA 等隱私法規的情況下創建。 綜合互動作為豐富的資料集,有助於訓練和完善客戶的 ASR 模型,顯著提高其在臨床環境中處理現實世界對話的能力。
面臨的挑戰
符合法規
確保遵守 HIPAA 等隱私法,同時創建現實且全面的醫療保健互動可能具有挑戰性。
數據真實性與多樣性
製作準確模仿現實世界臨床對話的綜合交互,同時涵蓋廣泛的場景、口音、年齡和醫療角色,需要細緻的方法和深厚的領域知識。
質量保證
要實現高水準的轉錄準確性,例如目標 95% 的單字準確率 (WER) 和 90% 的標籤準確率 (TER),需要嚴格的品質保證流程。
技術能力
確保技術基礎設施(包括記錄和轉錄平台)能夠處理大量數據並保持品質是一項重大挑戰。
資源招募與培訓
招募具有醫學背景的人員進行角色扮演,並確保他們遵循現實場景,同時保持自然的對話流程可能非常具有挑戰性。 此外,培訓轉錄員遵守嚴格的品質指南需要大量的努力和專業知識。
方法/解決方案
音訊擷取與轉錄
- 場景創建: 發展反映成人家庭醫療實踐中遇到的常見非緊急情況的現實場景,例如高血壓、糖尿病和疼痛管理。
- 角色扮演: 招募具有醫學背景的人員扮演醫療保健提供者和患者的角色,遵循提供的場景並模擬現實世界的臨床對話。
- 記錄: 利用 Shaip Work 行動應用程式擷取音頻,確保參與者在性別、年齡、口音和專業背景方面的多樣性。
驗證和轉錄
- 執行驗證腳本以確保音訊檔案的準確性和品質。
- 轉錄在 Bhasha 平台上進行,遵循提供的具體指南,並確保逐字文本轉錄和精確的分類。
- 帶註釋的元數據,包括說話者 ID、年齡、性別、母語和醫療培訓/經驗,這對於客戶的模型培訓目的至關重要。
質量保證
- CQA 和 PMO 進行的全面品質檢查確保了 95% 的單字準確率 (WER) 和 90% 的標籤準確率 (TER) 的轉錄品質目標。
資料傳送
- 以清晰、有組織的方式建立資料並分批交付,以及詳細的批次註釋和培養目錄。
- 確保所有資料(包括音訊檔案、轉錄和元資料)均按照客戶的規範進行準確標記和格式化。
反饋與迭代
與客戶建立強大的回饋循環,以識別任何缺陷,確保進行修正並提供完整、準確的資料集。
主要成就
- 成功收集和轉錄 2000 小時的全面醫療保健互動。
- 快速且準確的轉錄以及極高的準確率,為客戶增強 ASR 模型的目標做出了重大貢獻。
- 展現了 Shaip 處理大型、複雜專案的能力,以及對品質和準確性一絲不苟的態度。
結果
Shaip 精心執行的專案產生了豐富的資料集,為增強客戶的 ASR 模型做出了重大貢獻。 綜合互動創造了臨床對話的真實表現,幫助客戶為醫療保健環境實現更強大、更可靠的語音服務。 透過結構化且協調良好的方法,Shaip 確保在規定的時間內成功交付複雜的項目,鞏固了其在管理醫療保健領域大型對話式人工智慧項目方面的專業知識。
我們與 Shaip 的合作極大地推進了我們在醫療保健領域的環境技術和對話式人工智慧計畫。 他們在創建和轉錄合成醫療保健對話方面的專業知識提供了堅實的基礎,展示了合成數據在克服監管挑戰方面的潛力。 與 Shaip 一起,我們克服了這些障礙,現在距離實現直覺醫療保健解決方案的願景又更近了一步。