高質量的音頻/語音/語音數據集來訓練您的會話 AI 模型 

多種語言的現成語音/語音/音頻數據集,可快速啟動您的自動語音識別 (ASR) 模型

語音數據集

插入您今天缺少的音頻數據目錄

詳細資料語言數據集採樣率數據集類型總音頻時數總演講時數數據集描述音頻頻道錄音平台WER(%)音頻格式轉錄格式用例CTA
發言非裔美國人非裔美國人白話8千赫呼叫中心214211“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言非裔美國人非裔美國人白話16千赫媒體音頻159149可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言南非荷蘭語南非荷蘭語8千赫一般對話368404兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,在非洲說南非荷蘭語雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言南非荷蘭語南非荷蘭語16千赫媒體音頻658615可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿拉伯語阿拉伯語8千赫一般對話293297兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,來自海灣國家的阿拉伯語雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波士頓波士頓8千赫呼叫中心177175“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波士頓波士頓8千赫一般對話3232兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波士頓波士頓16千赫媒體音頻9393可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言中文英文中文英文8千赫呼叫中心169130“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言中文英文中文英文16千赫媒體音頻249236可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言丹麥丹麥8千赫一般對話372395兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言丹麥丹麥16千赫媒體音頻664603可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言英語英語16千赫媒體音頻109可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言英語深南英語深南8千赫呼叫中心151149“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言英語深南英語深南8千赫一般對話5656兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言英語深南英語深南16千赫媒體音頻266248可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言希伯來語希伯來語8千赫一般對話399397兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,以色列希伯來語雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言希伯來語希伯來語16千赫媒體音頻427400可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言興力士興力士8千赫呼叫中心208185“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言興力士興力士16千赫媒體音頻216219可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言西班牙裔英語西班牙裔英語8千赫呼叫中心212209“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言西班牙裔英語西班牙裔英語16千赫媒體音頻155150可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言印度英語印度英語16千赫媒體音頻13787可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言印度尼西亞印度尼西亞8千赫一般對話496598兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,印尼語雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言印度尼西亞印度尼西亞16千赫媒體音頻643610可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言愛爾蘭愛爾蘭8千赫一般對話192180兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言韓語韓語8千赫呼叫中心107103“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言韓語韓語16千赫媒體音頻204197可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬來語馬來語8千赫一般對話266302兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,馬來西亞馬來語雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬來語馬來語16千赫媒體音頻344305可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言新西蘭英語 新西蘭英語 8千赫一般對話148142兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言新西蘭英語 新西蘭英語 16千赫媒體音頻400400可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言紐約英語紐約英語8千赫呼叫中心103103“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言紐約英語紐約英語8千赫一般對話107106兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言紐約英語紐約英語16千赫媒體音頻140140可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波蘭語波蘭語16千赫媒體音頻269255可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言蘇格蘭的蘇格蘭的8千赫一般對話292267兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言新加坡英語新加坡英語8千赫呼叫中心218194“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言新加坡英語新加坡英語16千赫媒體音頻247240可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言南非英語南非英語8千赫呼叫中心261204“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言南非英語南非英語16千赫媒體音頻251245可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言西班牙語西班牙語16千赫媒體音頻32可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言斯瓦希裡斯瓦希裡8千赫呼叫中心184165“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言斯瓦希裡斯瓦希裡8千赫呼叫中心4644“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言斯瓦希裡斯瓦希裡16千赫媒體音頻203191可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言斯瓦希裡斯瓦希裡16千赫媒體音頻6258可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言瑞典瑞典8千赫呼叫中心250224“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言瑞典瑞典16千赫媒體音頻278255可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語泰盧固語8千赫一般對話553582兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, 雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語泰盧固語16千赫媒體音頻648599可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰語泰語8千赫一般對話183201兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,朋友之間使用的非正式記錄雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰語泰語16千赫媒體音頻173167可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言越南語越南語8千赫一般對話295293“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,北部(例如,河內)、中部和南部(例如,胡志明市)。雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言越南語越南語16千赫媒體音頻257248可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言威爾士語威爾士語8千赫一般對話278299“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言印度英語印度英語8千赫呼叫中心200200“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語 泰盧固語 NA呼叫中心3030“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰米爾人 泰米爾人 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言卡納達語 卡納達語 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉雅拉姆語 馬拉雅拉姆語 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉 孟加拉 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言古吉拉特語 古吉拉特語 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉 馬拉 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿薩姆 阿薩姆 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言奧里亞語 奧里亞語 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言旁遮普 旁遮普 NA呼叫中心6060“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語 泰盧固語 NA一般對話5050“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰米爾人 泰米爾人 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言卡納達語 卡納達語 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉雅拉姆語 馬拉雅拉姆語 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉 孟加拉 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言古吉拉特語 古吉拉特語 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉 馬拉 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿薩姆 阿薩姆 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言奧里亞語 奧里亞語 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言旁遮普 旁遮普 NA一般對話100100“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰盧固語 泰盧固語 NA媒體音頻2020可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言泰米爾人 泰米爾人 NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言卡納達語 卡納達語 NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉雅拉姆語 馬拉雅拉姆語 NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言孟加拉 孟加拉 NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言古吉拉特語 古吉拉特語 NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言馬拉 馬拉 NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿薩姆 阿薩姆 NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言奧里亞語 奧里亞語 NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言旁遮普旁遮普NA媒體音頻4040可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘NA桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言英語美國英語美國48千赫腳本獨白54單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言西班牙語 西班牙西班牙語 西班牙48千赫腳本獨白108單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言墨西哥的墨西哥的48千赫腳本獨白1,4921,228單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言加拿大的加拿大的48千赫腳本獨白1,2221,049單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言荷蘭荷蘭48千赫腳本獨白1,2051,021單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言波蘭語 波蘭波蘭語 波蘭48千赫腳本獨白1,4821,266單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言土耳其土耳其土耳其土耳其48千赫腳本獨白2,0271,735單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言中文繁體中文繁體48千赫腳本獨白1,028891單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言阿拉伯語阿拉伯語48千赫腳本獨白1,9471,594單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言丹麥丹麥48千赫腳本獨白2,5792,041單句錄音,通常在 5 到 30 秒範圍內,來自丹麥的丹麥語單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言印度語印度語8千赫呼叫中心122131“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言印度語印度語16千赫媒體音頻219202可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘單聲道桌面5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言印度語印度語48千赫腳本獨白2,8672,105單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言日本日本48千赫腳本獨白2,3352,029單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言韓語韓語48千赫腳本獨白1,9551,548單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言俄語俄語48千赫腳本獨白2,3982,046單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言中文簡體中文簡體48千赫腳本獨白2,7622,181單段錄音,通常在 5 到 30 秒範圍內單聲道手機應用程序5WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
發言德語德語8千赫呼叫中心640“代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,雙重桌面WAV。.jsonASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模

Ground Truth 音頻和語音數據可加速您的對話式 AI 開發

憑藉超過 40 萬小時的音頻數據集/語音數據集,Shaip 可以幫助您使用高質量的語音數據集擴展您的會話 AI 模型。 黃金標準語音數據集以多種語言和方言、人口統計、說話者特徵、對話類型、環境和場景收集。 如果你找不到你要找的東西? – Shaip 可以幫助您處理任何性別、年齡、語言或設置的任何語音數據集。

我們支持的語言數據集很少: 我們擁有所有主要語言和方言的數據集。 我們最受歡迎的一些語言包括:

南非語語音數據集

阿拉伯語語音數據集

加拿大語音數據集

中文語音數據集

丹麥語語音數據集

英語語音數據集

德語語音數據集

希伯來語語音數據集

印尼語語音數據集

愛爾蘭語音數據集

日語語音數據集

韓語語音數據集

墨西哥語音數據集

波蘭語語音數據集

俄語語音數據集

蘇格蘭語音數據集

西班牙語語音數據集

瑞典語語音數據集

泰語語音數據集

土耳其語語音數據集

越南語語音數據集

數據集描述

呼叫中心對話 8khz: 無腳本的合成電話對話:“代理”和“客戶”

通用對話 8khz: 2 人之間的即興電話交談

媒體和播客 16khz: 公共領域音視頻採訪、播客等1-5人

話語/腳本獨白 16khz: 根據提示錄製 

聯繫我們

不能找到你想要的?

正在收集所有數據類型的新現成音頻和語音數據集 

立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂

  • 通過註冊,我同意 Shaip 隱私政策條款及細則 並同意接受來自 Shaip 的 B2B 營銷傳播。