最值得信賴的 AI 語音數據收集服務

使用我們的音頻和語音數據收集服務,使用高質量的對話數據訓練您的 NLP 模型、VA、TTS 原型等

音訊資料擷取

發現無瓶頸的音訊資料管道

特色客戶

專業音訊/語音資料擷取服務

任何科目。 任何場景。

在 Shaip,我們的專長在於創建專為各種 AI/ML 要求而設計的高品質語音資料集。我們提供廣泛的語言和不同環境的記錄,使我們的資料集全面且適應性強。氧我們的重點是在盡可能短的時間內為模型提供最大量的自訂語音資料。 與我們一起,您可以期待: 

語音採集
  • 策劃高品質的多語言音訊/語音數據以提高準確性
  • 最高可能的領域特異性目標多樣化場景 格局
  •  擴展您的 ML 模型以適應不同的人口統計和垂直行業
  • 錄音環境: 工作室品質, 具有水晶般清晰的音頻和最小的背景噪音,以及 自然環境,其中錄音結合了環境聲音來模仿現實世界的情況。

100+

國家

55K+

演講時間數據

250+

項目

60+

語言(100多種方言)

8 / 16 / 44 / 48 kHz

採樣率

我們的專長

對齊音訊資料以獲得更聰明的 NLP 模型

Shaip 提供 100 多種語言的端到端語音/音頻數據收集服務,使支持語音的技術能夠迎合全球不同的受眾群體。 我們可以從事任何範圍和規模的項目; 從許可現有的現成音頻數據集到管理自定義音頻數據收集,再到音頻轉錄和註釋。 無論您的語音數據採集項目有多大,我們都可以根據您的需求定制音頻採集服務,以構建針對方言、音調和語言的高質量 NLP 數據集。 從我們廣泛的語音數據集和音頻數據收集資源中進行選擇,以實現支持語音的智能設置。

獨白演講

獨白演講集

它專注於處理來自單一說話者的語音。利用腳本提示輸入單通道音訊文件,確保捕捉到特定於該人的獨特語音模式、語氣和細微差別。

對話演講

對話演講
保養系列

兩人互動,透過雙通道檔案和轉錄資源複製現實世界的對話和多語言接觸的對話。

多方對話

團體/多方
對話

多人討論,捕捉團體動態、重疊、語調變化,準確訓練語音模型。

自然語言表達

自然語言話語集

訓練人工智慧使用多樣化、豐富且真實的話語來識別具有相似含義的短語或喚醒詞,以實現高級自然語言處理和理解。

聲學語音

聲學數據
保養系列

我們可以專業錄製工作室品質的音訊數據,無論是在餐廳、辦公室或家庭,或來自各種環境和語言,同時涵蓋更廣泛的聲學範圍(綜合聲音數據集)。

自動語音識別

自動語音識別 (ASR)

通過訪問來自廣泛人口統計數據的最先進的多樣化語音/音頻數據集,提高自動語音識別 (ASR) 系統的準確性。

自然語言表達

多語言語音/音頻訓練數據

我們遍佈全球的熟練語言專業人員提供各種語言和方言的多語言音訊/語音資料。這項努力促進了全球溝通並消除了語言障礙,有助於打造更具包容性和更有效的人工智慧解決方案。

數位虛擬助理

文本到語音轉換
(語音合成)

在我們全球員工的幫助下建立文字轉語音 (TTS) 多語言模型,他們幫助您收集 150 多種語言和方言的語音數據,以增強您的 AI 模型,從車載控製到聊天機器人和學習解決方案,高品質的音訊數據。

呼叫中心錄音

呼叫中心
錄音

代理商與客戶之間的真實交流,支援西班牙語、德語、美式英語、孟加拉語、日語、中文、印地語等多種語言。

成功案例

對話式 AI 資料集,包含 3 種語言的超過 8 小時的數據

為了建立一個印度語言的多語言平台,該客戶與 Shaip 合作,收集、分割和轉錄多種印度語言的大型資料集。這將有助於開發有效的語音模型,為客戶的創新新平台提供動力。

問題: 以 3,000 種印度語言收集超過 8 小時的音訊數據,進行分段和轉錄以開發自動語音辨識。

解決方案: 我們提供資料收集、分段、轉錄,並提供帶有元資料的 JSON 檔案。我們為客戶的語音技術專案大規模收集了 3000 種印度語言的 8 小時的音訊資料。

語音資料收集案例研究

選擇 Shaip 作為您值得信賴的語音數據收集合作夥伴的原因

員工

員工

專門和訓練有素的團隊:

  • 30,000 多名數據創建、標籤和 QA 協作者
  • 有資質的項目管理團隊
  • 經驗豐富的產品開發團隊
  • 人才庫採購和入職團隊
過程

過程

通過以下方式確保最高的流程效率:

  • 穩健的 6 Sigma Stage-Gate 工藝
  • 一個由 6 Sigma 黑帶組成的專門團隊——關鍵流程負責人和質量合規
  • 持續改進和反饋循環
平台

平台

獲得專利的平台具有以下優勢:

  • 基於網絡的端到端平台
  • 無可挑剔的品質
  • 更快的 TAT
  • 無縫交付

現成的語音/音頻數據集

更多資訊語言數據集取樣率數據集類型總音頻時數簡要說明數據集描述音頻頻道錄音平台WER(%)音頻格式轉錄格式用例使用者數量CTA
發言en_US_CC_8非裔美國人白話非裔美國人白話EN_US8千赫呼叫中心211非裔美國人方言呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:612,男性:1242,未知:12
發言en_US_MA_16非裔美國人白話非裔美國人白話EN_US16千赫媒體音頻154非裔美國人民間媒體數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:151,男性:150,未知:10
發言南非荷蘭語_GC_8南非荷蘭語南非荷蘭語AF_ZA8千赫一般對話368南非荷蘭語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,在非洲說南非荷蘭語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:502,男性:390,未知:2
發言南非荷蘭語_MA_16南非荷蘭語南非荷蘭語AF_ZA16千赫媒體音頻658南非荷蘭語媒體文件可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:750,男性:1278,未知:52
發言阿拉伯語_GC_8阿拉伯語阿拉伯語ar_AE8千赫一般對話292阿拉伯語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,來自海灣國家的阿拉伯語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:171,男性:534,未知:1
發言阿拉伯語_SM_48阿拉伯語阿拉伯語AR-SA48千赫腳本獨白1,947阿拉伯語腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 838 男 1209 未知 78
發言阿薩姆語_CC_8阿薩姆阿薩姆語(籌備中) 作為_IN呼叫中心60阿薩姆語(正在籌備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿薩姆語_GC阿薩姆阿薩姆語(籌備中) 作為_IN一般對話100阿薩姆語(管道中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿薩姆語_MA阿薩姆阿薩姆語(籌備中) 作為_IN媒體音頻40阿薩姆語(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉語_CC_8孟加拉孟加拉語(籌備中) bn_IN呼叫中心60孟加拉語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉語_GC孟加拉孟加拉語(籌備中) bn_IN一般對話100孟加拉語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉語_MA孟加拉孟加拉語(籌備中) bn_IN媒體音頻40孟加拉語(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波士頓_CC_8波士頓英語波士頓英語EN_US8千赫呼叫中心177波士頓呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:605,男性:711,未知:0
發言波士頓_GC_8波士頓英語波士頓英語EN_US8千赫一般對話32Boston General Conversation 數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:53,男性:83,未知:0
發言波士頓_MA_16波士頓英語波士頓英語EN_US16千赫媒體音頻93波士頓媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:43,男性:181,未知:2
發言加拿大人_SM_48加拿大法語加拿大法語FR-CA48千赫腳本獨白1,222加拿大法語單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 974 男 631 未知 1
發言中文_CC_8中文英文中文英文EN_US8千赫呼叫中心169中國呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:1790 人,男性:523 人,未知:13 人
發言中文_MA_16中文英文中文英文EN_US16千赫媒體音頻249中文媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:126 人,男性:346 人,未知:6 人
發言簡體中文_SM_48中文簡體中文簡體ZH-CN48千赫腳本獨白2,762中文簡體單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1920 男 1535 未知 270
發言繁體中文_SM_48中文繁體中文繁體zh-TW48千赫腳本獨白1,028中文繁體單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1069 男 262 未知 3
發言丹麥文_GC_8丹麥丹麥達_DK8千赫一般對話372丹麥語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:311,男性:417,未知:0
發言丹麥語_MA_16丹麥丹麥達_DK16千赫媒體音頻664丹麥媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:369,男性:864,未知:27
發言丹麥語_SM_48丹麥丹麥DA-DK48千赫腳本獨白2,579丹麥語劇本獨白單句錄音,通常在 5 到 30 秒範圍內,來自丹麥的丹麥語單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1551 男 1233 未知 42
發言英語深南_CC_8英語深南英語深南EN_US8千赫呼叫中心151英文深南呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女221,男1004,未知7
發言英語深南_GC_8英語深南英語深南EN_US8千赫一般對話56英語 Deep South General Conversation 數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 99,男 31,未知 0
發言英語 Deep South_MA_16英語深南英語深南EN_US16千赫媒體音頻266英文深南傳媒音頻資料可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 204,男 356,未知 21
發言德國_CC_8德語德語德德8千赫呼叫中心64德國呼叫中心數據 “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,單聲道桌面WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性 478 男性 1440 未知 0
發言德國_IVR_8德語德語德德8千赫 IVR200德國 IVR 數據人對機器。 一種 IVR 類型的流程,其中有 TTS 提示(例如“我可以為您提供什麼幫助”),然後是自發的人工響應單聲道桌面WAV。 .jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 女 10115 男 8750 未知 0
發言古吉拉特語_CC_8古吉拉特語古吉拉特語(籌備中) gu_IN呼叫中心60古吉拉特語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言古吉拉特語_GC古吉拉特語古吉拉特語(籌備中) gu_IN一般對話100古吉拉特語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言古吉拉特語_MA古吉拉特語古吉拉特語(籌備中) gu_IN媒體音頻40古吉拉特語(籌備中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言希伯來語_一般對話_8希伯來語希伯來語他_IL8千赫一般對話399希伯來語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,以色列希伯來語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女414,男399,未知1
發言希伯來語_MA_16希伯來語希伯來語他_IL16千赫媒體音頻427希伯來媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女361,男513,未知13
發言印地語_MA_16印度語印度語嗨_IN16千赫媒體音頻219印地語媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女83,男309,未知0
發言印地語_SM_48印度語印度語HI-IN48千赫腳本獨白2,867印地語腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1977 男 1864 未知 147
發言HINGLISH_CC_8興力士興力士汞輸入8千赫呼叫中心208英語呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女822,男1262,未知0
發言HINGLISH_MA_16興力士興力士汞輸入16千赫媒體音頻216HINGLISH 媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性 75 人,男性 380 人,未知 0 人
發言西班牙裔_CC_8西班牙裔英語西班牙裔英語EN_US8千赫呼叫中心212西班牙呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女822,男1262,未知0
發言西班牙裔_MA_16西班牙裔英語西班牙裔英語EN_US16千赫媒體音頻155西班牙呼叫媒體音頻可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女140,男219,未知5
發言印度尼西亞語_GC_8印度尼西亞印度尼西亞id_ID8千赫一般對話496印度尼西亞語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,印尼語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女524,男454,未知2
發言印度尼西亞語_MA_16印度尼西亞印度尼西亞id_ID16千赫媒體音頻643印尼媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女746,男1507,未知129
發言愛爾蘭人_GC_8愛爾蘭愛爾蘭en_IE8千赫一般對話192愛爾蘭語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 213 男 153 未知 0
發言日本人_SM_48日文日文JA-JP48千赫腳本獨白2,335日本腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1460 男 1221 未知 194
發言卡納達語_CC_8卡納達語卡納達語(籌備中) kn_IN呼叫中心60卡納達語(籌備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言卡納達語_GC卡納達語卡納達語(籌備中) kn_IN一般對話100卡納達語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言卡納達語_MA卡納達語卡納達語(籌備中) kn_IN媒體音頻40卡納達語(籌備中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言韓文_CC_8韓語韓語ko_KR8千赫呼叫中心107韓國呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女1086,男210,未知4
發言韓語_MA_16韓語韓語ko_KR16千赫媒體音頻204韓國媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性 70 男性 303,未知 25
發言韓國人_SM_48韓語韓語KO-KR48千赫腳本獨白1,955韓國腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1195 男 1134 未知 122
發言馬來語_GC_8馬來語馬來語ms_我的8千赫一般對話266馬來語通用對話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,馬來西亞馬來語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女316,男176,未知0
發言馬來語_MA_16馬來語馬來語ms_我的16千赫媒體音頻344馬來媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 236,男 626,未知 47
發言馬拉雅拉姆語_CC_8馬拉雅拉姆語馬拉雅拉姆語(籌備中) 毫升_IN呼叫中心60馬拉雅拉姆語(正在籌備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉雅拉姆語_GC馬拉雅拉姆語馬拉雅拉姆語(籌備中) 毫升_IN一般對話100馬拉雅拉姆語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉雅拉姆語_MA馬拉雅拉姆語馬拉雅拉姆語(籌備中) 毫升_IN媒體音頻40Malayalam (In Pipeline) 媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉地語_CC_8馬拉馬拉地語(籌備中) 先生_IN呼叫中心60馬拉地語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉地語_GC馬拉馬拉地語(籌備中) 先生_IN一般對話100馬拉地語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉地語_MA馬拉馬拉地語(籌備中) 先生_IN媒體音頻40馬拉地語(籌備中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言墨西哥人_SM_48西班牙語(墨西哥)西班牙語(墨西哥)ES-MX48千赫腳本獨白1,492墨西哥西班牙語腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1016 男 1069 未知 95
發言荷蘭_SM_48荷蘭人荷蘭人NL-NL48千赫腳本獨白1,205荷蘭腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1285 男 531 未知 3
發言紐約英語_CC_8紐約英語紐約英語EN_US8千赫呼叫中心103紐約英語呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女610,男532,未知0
發言紐約英語_GC_8紐約英語紐約英語EN_US8千赫一般對話107紐約英語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女118,男114,未知0
發言紐約英語_MA_16紐約英語紐約英語EN_US16千赫媒體音頻140紐約英語媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女66,男230,未知11
發言新西蘭_GC_8新西蘭英語 新西蘭英語 zh_NZ8千赫一般對話148新西蘭英語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女167,男121,未知4
發言新西蘭_MA_16新西蘭英語 新西蘭英語 zh_NZ16千赫媒體音頻400新西蘭英語媒體音頻可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女367,男678,未知26
發言奧里亞語_CC_8奧里亞語奧里亞語(籌備中) 或_IN呼叫中心60Oriya(籌備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言奧里亞語_GC奧里亞語奧里亞語(籌備中) 或_IN一般對話100Oriya(管道中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言奧里亞語_MA奧里亞語奧里亞語(籌備中) 或_IN媒體音頻40Oriya(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波蘭語_MA_16波蘭語波蘭語pl_PL16千赫媒體音頻269波蘭媒體音頻可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 173 男 354 未知 6
發言波蘭語Poland_SM_48波蘭文(波蘭)波蘭文(波蘭)PL-PL48千赫腳本獨白1,482Polish Poland - 劇本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1324 男 701 未知 24
發言旁遮普_CC_8旁遮普旁遮普語(籌備中) 旁遮普呼叫中心60旁遮普語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言旁遮普文_GC旁遮普旁遮普語(籌備中) 旁遮普一般對話100旁遮普語(管道中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言旁遮普語_MA旁遮普旁遮普語(籌備中) 旁遮普 媒體音頻40旁遮普語(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言俄羅斯人_SM_48俄語俄語RU-RU48千赫腳本獨白2,398俄羅斯腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1689 男 1937 未知 214
發言蘇格蘭_GC_8蘇格蘭語(英語口音)蘇格蘭語(英語口音)zh_AB8千赫一般對話292蘇格蘭通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女285,男260,未知3
發言新加坡_CC_8新加坡英語新加坡英語zh_SG8千赫呼叫中心218新加坡呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女2139,男884,未知21
發言新加坡_MA_16新加坡英語新加坡英語zh_SG16千赫媒體音頻247新加坡媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女160,男455,未知37
發言南非英語_CC_8南非英語南非英語zh_ZA8千赫呼叫中心261南非英語呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1274 男 935 未知 1
發言南非英語_MA_16南非英語南非英語zh_ZA16千赫媒體音頻251南非英語媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女235,男432,未知36
發言斯瓦希里語_CC_8斯瓦希裡斯瓦希裡sw_KE8千赫呼叫中心230斯瓦希里語呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女611,男833,未知0
發言斯瓦希里語_MA_16斯瓦希裡斯瓦希裡sw_KE16千赫媒體音頻265斯瓦希里語媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女118,男493,未知25
發言瑞典語_CC_8瑞典瑞典sv_SE8千赫呼叫中心250瑞典呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女1581,男727,未知2
發言瑞典語_MA_16瑞典瑞典sv_SE16千赫媒體音頻278瑞典媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女195,男500,未知21
發言泰米爾語_CC_8泰米爾人泰米爾語(籌備中) 塔_IN呼叫中心60泰米爾語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰米爾語_GC泰米爾人泰米爾語(籌備中) 塔_IN一般對話100泰米爾語(籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰米爾語_MA泰米爾人 泰米爾語(籌備中) 塔_IN媒體音頻40泰米爾語(籌備中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語_GC_8泰盧固語泰盧固語TE_IN8千赫一般對話553泰盧固語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女574,男564,未知0
發言泰盧固語_MA_16泰盧固語泰盧固語TE_IN16千赫媒體音頻648泰盧固媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女207,男963,未知2
發言泰盧固語_CC_8泰盧固語泰盧固語(籌備中) TE_IN呼叫中心30泰盧固語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語_GC泰盧固語泰盧固語(籌備中) TE_IN一般對話50泰盧固語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語_MA泰盧固語泰盧固語(籌備中) TE_IN媒體音頻20泰盧固語(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰文_GC_8泰語泰語th_TH8千赫一般對話183泰語一般會話兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,朋友之間使用的非正式記錄雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女338,男96,未知8
發言泰語_MA_8泰語泰語th_TH16千赫媒體音頻173泰媒音頻可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女143,男502,未知26
發言土耳其語 Turkey_SM_48土耳其土耳其土耳其土耳其TR-TR48千赫腳本獨白2,027土耳其土耳其單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1561 男 1241 未知 31
發言越南語_GC_8越南語越南語en_VN8千赫一般對話295越南語通用會話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,北部(例如,河內)、中部和南部(例如,胡志明市)。雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女400,男380,未知數2
發言越南語_MA_16越南語越南語en_VN16千赫媒體音頻257越南媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女249,男200,未知數45
發言威爾士_GC_8威爾士語(英語口音)威爾士語(英語口音)en_WL8千赫一般對話278威爾士通用會話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女270,男324,未知0
發言英國英語_WW_16英國英語英國英語zh_cn16千赫醒來的話200音箱喚醒詞英國英語關鍵詞收集數據
  • 200音箱
  • 每個演講者 4 個獨特的關鍵短語
  • 每個獨特的關鍵短語 25-30 個重複的關鍵短語記錄
  • 每個獨特的關鍵詞 25-30 個音頻文件
  • 每個說話者總共記錄了 120 條話語
1通道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模性別:50% 男性,50% 女性,+/- 10%。

提供的服務

專家音頻數據收集並不是全面的 AI 設置的全員操作。 在 Shaip,您甚至可以考慮以下服務,使模型比平時更廣泛:

文字資料採集

文本數據收集
服務

Shaip 認知數據收集服務的真正價值在於,它為組織提供了解鎖在非結構化數據中發現的關鍵信息的鑰匙

影像資料擷取

影像數據收集服務

確保您的計算機視覺模型準確識別每張圖像,以無縫訓練未來的下一代 AI 模型

視訊數據擷取

視頻數據收集服務

現在專注於計算機視覺和 NLP,以訓練您的模型以完美識別對象、個人、威懾和其他視覺元素

賽普聯絡我們

想要構建自己的音頻數據集?

與我們的內部語音數據收集專家聯繫,建立最適合您要求的音頻存儲庫

  • 通過註冊,我同意 Shaip 隱私權政策服務條款 並同意接受來自 Shaip 的 B2B 營銷傳播。

ML 模型的語音數據收集是指收集口語錄音的過程。 該集合有助於訓練和完善機器學習算法,特別是那些以理解和處理人類聲音為中心的算法。

當旨在收集自動語音識別 (ASR) 的音頻數據時,您應該首先定義項目的特定需求,包括所需的語言、口音和語音類型。 設置這些參數後,請確保您獲得尊重用戶隱私的所有必要權限。 然後,使用適當的錄音設備或軟件捕獲清晰的音頻樣本。 每個錄音都應仔細註釋其轉錄或其他相關元數據,並系統存儲以便輕鬆訪問。

機器學習中的語音數據集對於訓練、測試和驗證專門用於識別、轉錄或解釋口語的模型至關重要。 此類數據集為從語音助手和轉錄服務到語音生物識別技術的無數應用程序鋪平了道路。

為了從不同的語言和口音中收集精確的數據,與所需語言背景的母語人士的合作至關重要。 旨在獲得多樣化且具有代表性的樣本,以涵蓋廣泛的人口統計差異。 在統一環境下使用標準化錄音設備,確保音頻一致性。 重要的是,用詳細的轉錄和元數據註釋每個數據片段,表示特定的語言和口音。