高質量的音頻/語音/語音數據集來訓練您的會話 AI 模型 

多種語言的現成語音/語音/音頻數據集,可快速啟動您的自動語音識別 (ASR) 模型

語音數據集

插入您今天缺少的音頻數據目錄

詳細資料語言數據集採樣率數據集類型總音頻時數簡要說明數據集描述音頻頻道錄音平台WER(%)音頻格式轉錄格式用例使用者數量CTA
發言en_US_CC_8非裔美國人白話非裔美國人白話EN_US8千赫呼叫中心211非裔美國人方言呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:612,男性:1242,未知:12
發言en_US_MA_16非裔美國人白話非裔美國人白話EN_US16千赫媒體音頻154非裔美國人民間媒體數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:151,男性:150,未知:10
發言南非荷蘭語_GC_8南非荷蘭語南非荷蘭語af_ZA8千赫一般對話368南非荷蘭語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,在非洲說南非荷蘭語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:502,男性:390,未知:2
發言南非荷蘭語_MA_16南非荷蘭語南非荷蘭語af_ZA16千赫媒體音頻658南非荷蘭語媒體文件可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:750,男性:1278,未知:52
發言阿拉伯語_GC_8阿拉伯語阿拉伯語ar_AE8千赫一般對話292阿拉伯語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,來自海灣國家的阿拉伯語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:171,男性:534,未知:1
發言阿拉伯語_SM_48阿拉伯語阿拉伯語AR-SA48千赫腳本獨白1,947阿拉伯語腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 838 男 1209 未知 78
發言阿薩姆語_CC_8阿薩姆阿薩姆語(籌備中) 作為_IN呼叫中心60阿薩姆語(正在籌備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿薩姆語_GC阿薩姆阿薩姆語(籌備中) 作為_IN一般對話100阿薩姆語(管道中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿薩姆語_MA阿薩姆阿薩姆語(籌備中) 作為_IN媒體音頻40阿薩姆語(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉語_CC_8孟加拉孟加拉語(籌備中) bn_IN呼叫中心60孟加拉語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉語_GC孟加拉孟加拉語(籌備中) bn_IN一般對話100孟加拉語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉語_MA孟加拉孟加拉語(籌備中) bn_IN媒體音頻40孟加拉語(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波士頓_CC_8波士頓英語波士頓英語EN_US8千赫呼叫中心177波士頓呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:605,男性:711,未知:0
發言波士頓_GC_8波士頓英語波士頓英語EN_US8千赫一般對話32Boston General Conversation 數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:53,男性:83,未知:0
發言波士頓_MA_16波士頓英語波士頓英語EN_US16千赫媒體音頻93波士頓媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:43,男性:181,未知:2
發言加拿大人_SM_48加拿大法語加拿大法語FR-CA48千赫腳本獨白1,222加拿大法語單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 974 男 631 未知 1
發言中文_CC_8中文英文中文英文EN_US8千赫呼叫中心169中國呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:1790 人,男性:523 人,未知:13 人
發言Chinese_MA_16中文英文中文英文EN_US16千赫媒體音頻249中文媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:126 人,男性:346 人,未知:6 人
發言簡體中文_SM_48中文簡體中文簡體ZH-CN48千赫腳本獨白2,762中文簡體單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1920 男 1535 未知 270
發言繁體中文_SM_48中文繁體中文繁體zh-TW48千赫腳本獨白1,028中文繁體單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1069 男 262 未知 3
發言丹麥文_GC_8丹麥丹麥da_DK8千赫一般對話372丹麥語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:311,男性:417,未知:0
發言丹麥語_MA_16丹麥丹麥da_DK16千赫媒體音頻664丹麥媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性:369,男性:864,未知:27
發言丹麥語_SM_48丹麥丹麥DA-DK48千赫腳本獨白2,579丹麥語劇本獨白單句錄音,通常在 5 到 30 秒範圍內,來自丹麥的丹麥語單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1551 男 1233 未知 42
發言英語深南_CC_8英語深南英語深南EN_US8千赫呼叫中心151英文深南呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女221,男1004,未知7
發言英語深南_GC_8英語深南英語深南EN_US8千赫一般對話56英語 Deep South General Conversation 數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 99,男 31,未知 0
發言英語 Deep South_MA_16英語深南英語深南EN_US16千赫媒體音頻266英文深南傳媒音頻資料可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 204,男 356,未知 21
發言German_CC_8德語德語德德8千赫呼叫中心64德國呼叫中心數據 “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,單聲道桌面WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性 478 男性 1440 未知 0
發言German_IVR_8德語德語德德8千赫 IVR200德國 IVR 數據人對機器。 一種 IVR 類型的流程,其中有 TTS 提示(例如“我可以為您提供什麼幫助”),然後是自發的人工響應單聲道桌面WAV。 .jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 女 10115 男 8750 未知 0
發言古吉拉特語_CC_8古吉拉特語古吉拉特語(籌備中) gu_IN呼叫中心60古吉拉特語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言古吉拉特語_GC古吉拉特語古吉拉特語(籌備中) gu_IN一般對話100古吉拉特語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言古吉拉特語_MA古吉拉特語古吉拉特語(籌備中) gu_IN媒體音頻40古吉拉特語(籌備中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言Hebrew_General Conversation_8希伯來語希伯來語他_IL8千赫一般對話399希伯來語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,以色列希伯來語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女414,男399,未知1
發言希伯來語_MA_16希伯來語希伯來語他_IL16千赫媒體音頻427希伯來媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女361,男513,未知13
發言印地語_MA_16印度語印度語輸入16千赫媒體音頻219印地語媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女83,男309,未知0
發言印地語_SM_48印度語印度語HI-IN48千赫腳本獨白2,867印地語腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1977 男 1864 未知 147
發言HINGLISH_CC_8興力士興力士汞輸入8千赫呼叫中心208英語呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女822,男1262,未知0
發言HINGLISH_MA_16興力士興力士汞輸入16千赫媒體音頻216HINGLISH 媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性 75 人,男性 380 人,未知 0 人
發言西班牙裔_CC_8西班牙裔英語西班牙裔英語EN_US8千赫呼叫中心212西班牙呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女822,男1262,未知0
發言Hispanic_MA_16西班牙裔英語西班牙裔英語EN_US16千赫媒體音頻155西班牙呼叫媒體音頻可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女140,男219,未知5
發言印度尼西亞語_GC_8印度尼西亞印度尼西亞id_ID8千赫一般對話496印度尼西亞語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,印尼語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女524,男454,未知2
發言Indonesian_MA_16印度尼西亞印度尼西亞id_ID16千赫媒體音頻643印尼媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女746,男1507,未知129
發言Irish_GC_8愛爾蘭愛爾蘭en_IE8千赫一般對話192愛爾蘭語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 213 男 153 未知 0
發言日本人_SM_48日本日本JA-JP48千赫腳本獨白2,335日本腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1460 男 1221 未知 194
發言卡納達語_CC_8卡納達語卡納達語(籌備中) kn_IN呼叫中心60卡納達語(籌備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言卡納達語_GC卡納達語卡納達語(籌備中) kn_IN一般對話100卡納達語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言卡納達語_MA卡納達語卡納達語(籌備中) kn_IN媒體音頻40卡納達語(籌備中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言韓文_CC_8韓語韓語ko_KR8千赫呼叫中心107韓國呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女1086,男210,未知4
發言韓語_MA_16韓語韓語ko_KR16千赫媒體音頻204韓國媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女性 70 男性 303,未知 25
發言韓國人_SM_48韓語韓語KO-KR48千赫腳本獨白1,955韓國腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1195 男 1134 未知 122
發言馬來語_GC_8馬來語馬來語ms_我的8千赫一般對話266馬來語通用對話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,馬來西亞馬來語雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女316,男176,未知0
發言馬來語_MA_16馬來語馬來語ms_我的16千赫媒體音頻344馬來媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 236,男 626,未知 47
發言馬拉雅拉姆語_CC_8馬拉雅拉姆語馬拉雅拉姆語(籌備中) 毫升_IN呼叫中心60馬拉雅拉姆語(正在籌備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉雅拉姆語_GC馬拉雅拉姆語馬拉雅拉姆語(籌備中) 毫升_IN一般對話100馬拉雅拉姆語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉雅拉姆語_MA馬拉雅拉姆語馬拉雅拉姆語(籌備中) 毫升_IN媒體音頻40Malayalam (In Pipeline) 媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉地語_CC_8馬拉馬拉地語(籌備中) 先生_IN呼叫中心60馬拉地語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉地語_GC馬拉馬拉地語(籌備中) 先生_IN一般對話100馬拉地語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉地語_MA馬拉馬拉地語(籌備中) 先生_IN媒體音頻40馬拉地語(籌備中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言墨西哥人_SM_48西班牙語(墨西哥)西班牙語(墨西哥)ES-MX48千赫腳本獨白1,492墨西哥西班牙語腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1016 男 1069 未知 95
發言荷蘭_SM_48荷蘭人荷蘭人NL-NL48千赫腳本獨白1,205荷蘭腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1285 男 531 未知 3
發言紐約英語_CC_8紐約英語紐約英語EN_US8千赫呼叫中心103紐約英語呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女610,男532,未知0
發言紐約英語_GC_8紐約英語紐約英語EN_US8千赫一般對話107紐約英語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女118,男114,未知0
發言紐約英語_MA_16紐約英語紐約英語EN_US16千赫媒體音頻140紐約英語媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女66,男230,未知11
發言新西蘭_GC_8新西蘭英語 新西蘭英語 zh_NZ8千赫一般對話148新西蘭英語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女167,男121,未知4
發言新西蘭_MA_16新西蘭英語 新西蘭英語 zh_NZ16千赫媒體音頻400新西蘭英語媒體音頻可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女367,男678,未知26
發言奧里亞語_CC_8奧里亞語奧里亞語(籌備中) 或_IN呼叫中心60Oriya(籌備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言奧里亞語_GC奧里亞語奧里亞語(籌備中) 或_IN一般對話100Oriya(管道中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言奧里亞語_MA奧里亞語奧里亞語(籌備中) 或_IN媒體音頻40Oriya(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波蘭語_MA_16波蘭語波蘭語pl_PL16千赫媒體音頻269波蘭媒體音頻可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 173 男 354 未知 6
發言波蘭語Poland_SM_48波蘭文(波蘭)波蘭文(波蘭)PL-PL48千赫腳本獨白1,482Polish Poland - 劇本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1324 男 701 未知 24
發言旁遮普_CC_8旁遮普旁遮普語(籌備中) 旁遮普呼叫中心60旁遮普語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言旁遮普文_GC旁遮普旁遮普語(籌備中) 旁遮普一般對話100旁遮普語(管道中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言旁遮普語_MA旁遮普旁遮普語(籌備中) 旁遮普 媒體音頻40旁遮普語(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言俄羅斯人_SM_48俄語俄語RU-RU48千赫腳本獨白2,398俄羅斯腳本獨白單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1689 男 1937 未知 214
發言蘇格蘭_GC_8蘇格蘭語(英語口音)蘇格蘭語(英語口音)zh_AB8千赫一般對話292蘇格蘭通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女285,男260,未知3
發言新加坡_CC_8新加坡英語新加坡英語zh_SG8千赫呼叫中心218新加坡呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女2139,男884,未知21
發言新加坡_MA_16新加坡英語新加坡英語zh_SG16千赫媒體音頻247新加坡媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女160,男455,未知37
發言南非英語_CC_8南非英語南非英語zh_ZA8千赫呼叫中心261南非英語呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1274 男 935 未知 1
發言南非英語_MA_16南非英語南非英語zh_ZA16千赫媒體音頻251南非英語媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女235,男432,未知36
發言斯瓦希里語_CC_8斯瓦希裡斯瓦希裡sw_KE8千赫呼叫中心230斯瓦希里語呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女611,男833,未知0
發言斯瓦希里語_MA_16斯瓦希裡斯瓦希裡sw_KE16千赫媒體音頻265斯瓦希里語媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女118,男493,未知25
發言瑞典語_CC_8瑞典瑞典sv_SE8千赫呼叫中心250瑞典呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女1581,男727,未知2
發言瑞典語_MA_16瑞典瑞典sv_SE16千赫媒體音頻278瑞典媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女195,男500,未知21
發言泰米爾語_CC_8泰米爾人泰米爾語(籌備中) ta_IN呼叫中心60泰米爾語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰米爾語_GC泰米爾人泰米爾語(籌備中) ta_IN一般對話100泰米爾語(籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰米爾語_MA泰米爾人 泰米爾語(籌備中) ta_IN媒體音頻40泰米爾語(籌備中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語_GC_8泰盧固語泰盧固語te_IN8千赫一般對話553泰盧固語通用會話數據兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女574,男564,未知0
發言泰盧固語_MA_16泰盧固語泰盧固語te_IN16千赫媒體音頻648泰盧固媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女207,男963,未知2
發言泰盧固語_CC_8泰盧固語泰盧固語(籌備中) te_IN呼叫中心30泰盧固語(準備中)呼叫中心數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語_GC泰盧固語泰盧固語(籌備中) te_IN一般對話50泰盧固語(正在籌備中)一般對話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語_MA泰盧固語泰盧固語(籌備中) te_IN媒體音頻20泰盧固語(管道中)媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰文_GC_8泰語泰語th_TH8千赫一般對話183泰語一般會話兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,朋友之間使用的非正式記錄雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女338,男96,未知8
發言泰語_MA_8泰語泰語th_TH16千赫媒體音頻173泰媒音頻可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女143,男502,未知26
發言土耳其語 Turkey_SM_48土耳其土耳其土耳其土耳其TR-TR48千赫腳本獨白2,027土耳其土耳其單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女 1561 男 1241 未知 31
發言越南語_GC_8越南語越南語vi_VN8千赫一般對話295越南語通用會話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,北部(例如,河內)、中部和南部(例如,胡志明市)。雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女400,男380,未知數2
發言Vietnamese_MA_16越南語越南語vi_VN16千赫媒體音頻257越南媒體音頻數據可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道網絡採購5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女249,男200,未知數45
發言威爾士_GC_8威爾士語(英語口音)威爾士語(英語口音)en_WL8千赫一般對話278威爾士通用會話數據“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模女270,男324,未知0
發言英國英語_WW_16英國英語英國英語en_uk16千赫醒來的話200音箱喚醒詞英國英語關鍵詞收集數據
  • 200音箱
  • 每個演講者 4 個獨特的關鍵短語
  • 每個獨特的關鍵短語 25-30 個重複的關鍵短語記錄
  • 每個獨特的關鍵詞 25-30 個音頻文件
  • 每個說話者總共記錄了 120 條話語
1通道手機應用程序5.0WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模性別:50% 男性,50% 女性,+/- 10%。

Ground Truth 音頻和語音數據可加速您的對話式 AI 開發

憑藉超過 40 萬小時的音頻數據集/語音數據集,Shaip 可以幫助您使用高質量的語音數據集擴展您的會話 AI 模型。 黃金標準語音數據集以多種語言和方言、人口統計、說話者特徵、對話類型、環境和場景收集。 如果你找不到你要找的東西? – Shaip 可以幫助您處理任何性別、年齡、語言或設置的任何語音數據集。

我們支持的語言數據集很少: 我們擁有所有主要語言和方言的數據集。 我們最受歡迎的一些語言包括:

南非語語音數據集

阿拉伯語語音數據集

加拿大語音數據集

中文語音數據集

丹麥語語音數據集

英語語音數據集

德語語音數據集

希伯來語語音數據集

印尼語語音數據集

愛爾蘭語音數據集

日語語音數據集

韓語語音數據集

墨西哥語音數據集

波蘭語語音數據集

俄語語音數據集

蘇格蘭語音數據集

西班牙語語音數據集

瑞典語語音數據集

泰語語音數據集

土耳其語語音數據集

越南語語音數據集

數據集描述

呼叫中心對話 8khz: 無腳本的合成電話對話:“代理”和“客戶”

通用對話 8khz: 2 人之間的即興電話交談

媒體和播客 16khz: 公共領域音視頻採訪、播客等1-5人

話語/腳本獨白 16khz: 根據提示錄製 

聯繫我們

不能找到你想要的?

正在收集所有數據類型的新現成音頻和語音數據集 

立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂

  • 通過註冊,我同意 Shaip 隱私權政策條款及細則 並同意接受來自 Shaip 的 B2B 營銷傳播。