關鍵短語/提示音頻採集
案例研究:車載語音激活系統的關鍵短語收集
汽車行業對車載語音激活系統的需求不斷增長,重新定義了我們與移動車輛的互動方式。
汽車行業迅速採用了語音激活系統,福特、特斯拉和寶馬等主要廠商在其車輛中集成了先進的語音識別功能。 到 2022 年,預計超過 50% 的新車將配備語音識別功能。 這些集成旨在提高安全性,讓駕駛員能夠心無旁騖地操作導航、娛樂和通信功能。
預計到 1 年,汽車語音識別的市場價值將超過 2023 億美元,這表明對免提智能車內交互的需求不斷增長。
車用電子應用
研究表明,到 2022 年,73% 的駕駛員將使用車內語音助手。
2.01年汽車語音識別系統市場規模為2021億美元,預計到3.51年將達到2027億美元,複合年增長率約為8.07%。
真實世界的解決方案
為聲控系統提供動力的數據
汽車中的聲控系統增強了安全性和便利性。 它們允許駕駛員在手不離開方向盤或眼睛不離開路面的情況下訪問導航、打電話、發送短信和控制音樂。 通過響應口頭命令,這些系統可以減少分心,促進多任務處理,並確保持續專注於駕駛。
該客戶是對話智能領域的全球領導者,提供語音人工智能解決方案,讓企業能夠為客戶提供令人難以置信的對話體驗。 他們正在與領先的汽車公司合作,使用品牌關鍵詞訓練他們的聲控系統,並且需要 Shaip 在音頻數據收集方面的專業知識。
面臨的挑戰
- 眾包採購: 在全球範圍內招募 2800 多名每種語言的母語人士。
- 數據採集: 在設定的時間範圍內以 200 種語言提供超過 12 萬條提示。
- 上下文和意圖識別:為了正確理解用戶請求,系統需要針對同一關鍵詞的不同變體進行訓練。
- 背景噪聲處理: 解決現實世界的背景噪聲,以提高 ML 模型的準確性。
- 減少偏差: 獲取來自不同人群的語音樣本以確保包容性.
- 音頻規格: 16khz 16bits PCM,單聲道,單聲道,WAV; 沒有處理。
- 錄音環境: 錄音應具有乾淨的音頻,沒有背景噪音或乾擾。 使用正常語音錄製的關鍵短語。
- 質量檢查: 所有語音錄音都將接受質量評估和驗證,只有經過驗證的語音錄音才會被交付。 如果 Shaip 不符合商定的質量標準,Shaip 將重新提供數據,無需額外費用
解決方案
Shaip 憑藉其在對話式 AI 領域的專業知識,使客戶能夠:
- 數據採集: 在規定的時間內以 208 種全球語言從 12 位發言者那裡收集了 2800k 個關鍵短語/品牌提示
- 不同的口音和方言: 從世界各地招募了精通所需口音和方言的專家。
- 上下文和意圖識別:每位發言者的任務是記錄 20 種不同變體的關鍵短語,使 ML 模型能夠根據上下文和意圖準確掌握用戶請求。
- 背景噪聲處理:為了確保原始的音頻質量,我們確保在噪音水平低於 40dB 的寧靜環境中捕獲關鍵短語,並且沒有電視、廣播、音樂、語音或街道聲音等背景干擾。
- 減少偏差: 為了最大限度地減少偏見,我們聘請了來自不同地區的個人,並保持了人口代表性的平衡,其中男性佔 50%,女性佔 50%,年齡組涵蓋 18 歲至 60 歲。
- 錄音指南: 關鍵短語以一致、正常的語音模式捕獲,沒有任何變化,例如快或慢的節奏。 開頭和結尾都有 2 秒的靜音,以確保演講的任何部分都不會被無意剪掉。
- 錄音格式: 音頻使用單通道以 16kHz、16 位 PCM 單聲道錄製,並保存為 WAV 文件格式。 音頻保持未經處理,這意味著沒有應用壓縮、混響或均衡器。
- 質量: 每個語音錄音都經過嚴格的質量檢查和驗證。 僅交付通過此評估的錄音。 任何未達到商定的質量標準的文件都會被重新記錄並提供,且不收取任何額外費用
結果
高質量的品牌關鍵詞音頻數據或語音提示將使汽車公司及其客戶能夠:
- 品牌和標識: 具有特定品牌短語的語音提示可幫助公司在用戶和品牌之間建立直接且難忘的聯繫,從而增強品牌回憶。
- 易於使用: 語音命令使駕駛員可以更輕鬆地與車輛互動,而無需將手離開方向盤或眼睛離開道路,從而提高道路安全性。
- 功能: 語音命令使訪問和控制汽車功能更加直觀。 無論是導航、媒體播放還是氣候控制。
- 與其他系統集成: 許多語音激活系統與智能手機、智能家居設備和其他物聯網設備集成。 例如,用戶可以在接近家時要求他們的汽車打開家裡的燈。
- 競爭優勢:提供先進的語音激活系統可以成為一個賣點和一個差異化因素。 買家在考慮購買新車時會尋找最新的技術。
- 面向未來: 隨著技術的發展和物聯網越來越融入日常生活,擁有強大的聲控系統使汽車公司能夠更好地適應未來的技術。
- 收入機會: 額外的盈利機會,即語音系統提供推薦或集成電子商務體驗(如訂餐或查找附近的服務),可以提供聯營收入。
當我們開始為汽車行業採購語音提示時,面臨著很多挑戰。 捕捉言語、口音和語氣的多樣性對於代表我們客戶的全球客戶至關重要。 Shaip 不僅作為供應商脫穎而出,而且作為真正的合作夥伴。 他們致力於確保來自不同地區的多樣化聲音值得讚揚。 他們不僅僅是收集聲音; 他們掌握了我們項目需求的細微差別,保證了一流的錄音。 他們對音頻採集標準的完美遵守展示了他們的專業精神和對項目的奉獻精神。