高質量的音頻/語音/語音數據集來訓練您的會話 AI 模型
多種語言的現成語音/語音/音頻數據集,可快速啟動您的自動語音識別 (ASR) 模型
插入您今天缺少的音頻數據目錄
目錄
詳細資料 | 語料庫 ID(唯一) | 關鍵詞 | 語言數據集 | 語言代碼 | 採樣率 | 數據集類型 | 總音頻時數 | 簡要說明 | 數據集描述 | 音頻頻道 | 錄音平台 | WER(%) | 音頻格式 | 轉錄格式 | 用例 | 使用者數量 | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
en_US_CC_8 | 非裔美國人白話 | 非裔美國人白話 | EN_US | 8千赫 | 呼叫中心 | 211 | 非裔美國人方言呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:612,男性:1242,未知:12 | 聯繫我們 | |
en_US_MA_16 | 非裔美國人白話 | 非裔美國人白話 | EN_US | 16千赫 | 媒體音頻 | 154 | 非裔美國人民間媒體數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:151,男性:150,未知:10 | 聯繫我們 | |
南非荷蘭語_GC_8 | 南非荷蘭語 | 南非荷蘭語 | af_ZA | 8千赫 | 一般對話 | 368 | 南非荷蘭語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,在非洲說南非荷蘭語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:502,男性:390,未知:2 | 聯繫我們 | |
南非荷蘭語_MA_16 | 南非荷蘭語 | 南非荷蘭語 | af_ZA | 16千赫 | 媒體音頻 | 658 | 南非荷蘭語媒體文件 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:750,男性:1278,未知:52 | 聯繫我們 | |
阿拉伯語_GC_8 | 阿拉伯語 | 阿拉伯語 | ar_AE | 8千赫 | 一般對話 | 292 | 阿拉伯語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,來自海灣國家的阿拉伯語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:171,男性:534,未知:1 | 聯繫我們 | |
阿拉伯語_SM_48 | 阿拉伯語 | 阿拉伯語 | AR-SA | 48千赫 | 腳本獨白 | 1,947 | 阿拉伯語腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 838 男 1209 未知 78 | 聯繫我們 | |
阿薩姆語_CC_8 | 阿薩姆 | 阿薩姆語(籌備中) | 作為_IN | 呼叫中心 | 60 | 阿薩姆語(正在籌備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
阿薩姆語_GC | 阿薩姆 | 阿薩姆語(籌備中) | 作為_IN | 一般對話 | 100 | 阿薩姆語(管道中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
阿薩姆語_MA | 阿薩姆 | 阿薩姆語(籌備中) | 作為_IN | 媒體音頻 | 40 | 阿薩姆語(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
孟加拉語_CC_8 | 孟加拉 | 孟加拉語(籌備中) | bn_IN | 呼叫中心 | 60 | 孟加拉語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
孟加拉語_GC | 孟加拉 | 孟加拉語(籌備中) | bn_IN | 一般對話 | 100 | 孟加拉語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
孟加拉語_MA | 孟加拉 | 孟加拉語(籌備中) | bn_IN | 媒體音頻 | 40 | 孟加拉語(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
波士頓_CC_8 | 波士頓英語 | 波士頓英語 | EN_US | 8千赫 | 呼叫中心 | 177 | 波士頓呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:605,男性:711,未知:0 | 聯繫我們 | |
波士頓_GC_8 | 波士頓英語 | 波士頓英語 | EN_US | 8千赫 | 一般對話 | 32 | Boston General Conversation 數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:53,男性:83,未知:0 | 聯繫我們 | |
波士頓_MA_16 | 波士頓英語 | 波士頓英語 | EN_US | 16千赫 | 媒體音頻 | 93 | 波士頓媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:43,男性:181,未知:2 | 聯繫我們 | |
加拿大人_SM_48 | 加拿大法語 | 加拿大法語 | FR-CA | 48千赫 | 腳本獨白 | 1,222 | 加拿大法語 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 974 男 631 未知 1 | 聯繫我們 | |
中文_CC_8 | 中文英文 | 中文英文 | EN_US | 8千赫 | 呼叫中心 | 169 | 中國呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:1790 人,男性:523 人,未知:13 人 | 聯繫我們 | |
Chinese_MA_16 | 中文英文 | 中文英文 | EN_US | 16千赫 | 媒體音頻 | 249 | 中文媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:126 人,男性:346 人,未知:6 人 | 聯繫我們 | |
簡體中文_SM_48 | 中文簡體 | 中文簡體 | ZH-CN | 48千赫 | 腳本獨白 | 2,762 | 中文簡體 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1920 男 1535 未知 270 | 聯繫我們 | |
繁體中文_SM_48 | 中文繁體 | 中文繁體 | zh-TW | 48千赫 | 腳本獨白 | 1,028 | 中文繁體 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1069 男 262 未知 3 | 聯繫我們 | |
丹麥文_GC_8 | 丹麥 | 丹麥 | da_DK | 8千赫 | 一般對話 | 372 | 丹麥語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:311,男性:417,未知:0 | 聯繫我們 | |
丹麥語_MA_16 | 丹麥 | 丹麥 | da_DK | 16千赫 | 媒體音頻 | 664 | 丹麥媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:369,男性:864,未知:27 | 聯繫我們 | |
丹麥語_SM_48 | 丹麥 | 丹麥 | DA-DK | 48千赫 | 腳本獨白 | 2,579 | 丹麥語劇本獨白 | 單句錄音,通常在 5 到 30 秒範圍內,來自丹麥的丹麥語 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1551 男 1233 未知 42 | 聯繫我們 | |
英語深南_CC_8 | 英語深南 | 英語深南 | EN_US | 8千赫 | 呼叫中心 | 151 | 英文深南呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女221,男1004,未知7 | 聯繫我們 | |
英語深南_GC_8 | 英語深南 | 英語深南 | EN_US | 8千赫 | 一般對話 | 56 | 英語 Deep South General Conversation 數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 99,男 31,未知 0 | 聯繫我們 | |
英語 Deep South_MA_16 | 英語深南 | 英語深南 | EN_US | 16千赫 | 媒體音頻 | 266 | 英文深南傳媒音頻資料 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 204,男 356,未知 21 | 聯繫我們 | |
German_CC_8 | 德語 | 德語 | 德德 | 8千赫 | 呼叫中心 | 64 | 德國呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 單聲道 | 桌面 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性 478 男性 1440 未知 0 | 聯繫我們 | ||
German_IVR_8 | 德語 | 德語 | 德德 | 8千赫 | IVR | 200 | 德國 IVR 數據 | 人對機器。 一種 IVR 類型的流程,其中有 TTS 提示(例如“我可以為您提供什麼幫助”),然後是自發的人工響應 | 單聲道 | 桌面 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 10115 男 8750 未知 0 | 聯繫我們 | ||
古吉拉特語_CC_8 | 古吉拉特語 | 古吉拉特語(籌備中) | gu_IN | 呼叫中心 | 60 | 古吉拉特語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
古吉拉特語_GC | 古吉拉特語 | 古吉拉特語(籌備中) | gu_IN | 一般對話 | 100 | 古吉拉特語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
古吉拉特語_MA | 古吉拉特語 | 古吉拉特語(籌備中) | gu_IN | 媒體音頻 | 40 | 古吉拉特語(籌備中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
Hebrew_General Conversation_8 | 希伯來語 | 希伯來語 | 他_IL | 8千赫 | 一般對話 | 399 | 希伯來語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,以色列希伯來語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女414,男399,未知1 | 聯繫我們 | |
希伯來語_MA_16 | 希伯來語 | 希伯來語 | 他_IL | 16千赫 | 媒體音頻 | 427 | 希伯來媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女361,男513,未知13 | 聯繫我們 | |
印地語_MA_16 | 印度語 | 印度語 | 輸入 | 16千赫 | 媒體音頻 | 219 | 印地語媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女83,男309,未知0 | 聯繫我們 | |
印地語_SM_48 | 印度語 | 印度語 | HI-IN | 48千赫 | 腳本獨白 | 2,867 | 印地語腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1977 男 1864 未知 147 | 聯繫我們 | |
HINGLISH_CC_8 | 興力士 | 興力士 | 汞輸入 | 8千赫 | 呼叫中心 | 208 | 英語呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女822,男1262,未知0 | 聯繫我們 | |
HINGLISH_MA_16 | 興力士 | 興力士 | 汞輸入 | 16千赫 | 媒體音頻 | 216 | HINGLISH 媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性 75 人,男性 380 人,未知 0 人 | 聯繫我們 | |
西班牙裔_CC_8 | 西班牙裔英語 | 西班牙裔英語 | EN_US | 8千赫 | 呼叫中心 | 212 | 西班牙呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女822,男1262,未知0 | 聯繫我們 | |
Hispanic_MA_16 | 西班牙裔英語 | 西班牙裔英語 | EN_US | 16千赫 | 媒體音頻 | 155 | 西班牙呼叫媒體音頻 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女140,男219,未知5 | 聯繫我們 | |
印度尼西亞語_GC_8 | 印度尼西亞 | 印度尼西亞 | id_ID | 8千赫 | 一般對話 | 496 | 印度尼西亞語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,印尼語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女524,男454,未知2 | 聯繫我們 | |
Indonesian_MA_16 | 印度尼西亞 | 印度尼西亞 | id_ID | 16千赫 | 媒體音頻 | 643 | 印尼媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女746,男1507,未知129 | 聯繫我們 | |
Irish_GC_8 | 愛爾蘭 | 愛爾蘭 | en_IE | 8千赫 | 一般對話 | 192 | 愛爾蘭語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 213 男 153 未知 0 | 聯繫我們 | |
日本人_SM_48 | 日本 | 日本 | JA-JP | 48千赫 | 腳本獨白 | 2,335 | 日本腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1460 男 1221 未知 194 | 聯繫我們 | |
卡納達語_CC_8 | 卡納達語 | 卡納達語(籌備中) | kn_IN | 呼叫中心 | 60 | 卡納達語(籌備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
卡納達語_GC | 卡納達語 | 卡納達語(籌備中) | kn_IN | 一般對話 | 100 | 卡納達語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
卡納達語_MA | 卡納達語 | 卡納達語(籌備中) | kn_IN | 媒體音頻 | 40 | 卡納達語(籌備中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
韓文_CC_8 | 韓語 | 韓語 | ko_KR | 8千赫 | 呼叫中心 | 107 | 韓國呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女1086,男210,未知4 | 聯繫我們 | |
韓語_MA_16 | 韓語 | 韓語 | ko_KR | 16千赫 | 媒體音頻 | 204 | 韓國媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性 70 男性 303,未知 25 | 聯繫我們 | |
韓國人_SM_48 | 韓語 | 韓語 | KO-KR | 48千赫 | 腳本獨白 | 1,955 | 韓國腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1195 男 1134 未知 122 | 聯繫我們 | |
馬來語_GC_8 | 馬來語 | 馬來語 | ms_我的 | 8千赫 | 一般對話 | 266 | 馬來語通用對話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,馬來西亞馬來語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女316,男176,未知0 | 聯繫我們 | |
馬來語_MA_16 | 馬來語 | 馬來語 | ms_我的 | 16千赫 | 媒體音頻 | 344 | 馬來媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 236,男 626,未知 47 | 聯繫我們 | |
馬拉雅拉姆語_CC_8 | 馬拉雅拉姆語 | 馬拉雅拉姆語(籌備中) | 毫升_IN | 呼叫中心 | 60 | 馬拉雅拉姆語(正在籌備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
馬拉雅拉姆語_GC | 馬拉雅拉姆語 | 馬拉雅拉姆語(籌備中) | 毫升_IN | 一般對話 | 100 | 馬拉雅拉姆語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
馬拉雅拉姆語_MA | 馬拉雅拉姆語 | 馬拉雅拉姆語(籌備中) | 毫升_IN | 媒體音頻 | 40 | Malayalam (In Pipeline) 媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
馬拉地語_CC_8 | 馬拉 | 馬拉地語(籌備中) | 先生_IN | 呼叫中心 | 60 | 馬拉地語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
馬拉地語_GC | 馬拉 | 馬拉地語(籌備中) | 先生_IN | 一般對話 | 100 | 馬拉地語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
馬拉地語_MA | 馬拉 | 馬拉地語(籌備中) | 先生_IN | 媒體音頻 | 40 | 馬拉地語(籌備中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
墨西哥人_SM_48 | 西班牙語(墨西哥) | 西班牙語(墨西哥) | ES-MX | 48千赫 | 腳本獨白 | 1,492 | 墨西哥西班牙語腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1016 男 1069 未知 95 | 聯繫我們 | |
荷蘭_SM_48 | 荷蘭人 | 荷蘭人 | NL-NL | 48千赫 | 腳本獨白 | 1,205 | 荷蘭腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1285 男 531 未知 3 | 聯繫我們 | |
紐約英語_CC_8 | 紐約英語 | 紐約英語 | EN_US | 8千赫 | 呼叫中心 | 103 | 紐約英語呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女610,男532,未知0 | 聯繫我們 | |
紐約英語_GC_8 | 紐約英語 | 紐約英語 | EN_US | 8千赫 | 一般對話 | 107 | 紐約英語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女118,男114,未知0 | 聯繫我們 | |
紐約英語_MA_16 | 紐約英語 | 紐約英語 | EN_US | 16千赫 | 媒體音頻 | 140 | 紐約英語媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女66,男230,未知11 | 聯繫我們 | |
新西蘭_GC_8 | 新西蘭英語 | 新西蘭英語 | zh_NZ | 8千赫 | 一般對話 | 148 | 新西蘭英語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女167,男121,未知4 | 聯繫我們 | |
新西蘭_MA_16 | 新西蘭英語 | 新西蘭英語 | zh_NZ | 16千赫 | 媒體音頻 | 400 | 新西蘭英語媒體音頻 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女367,男678,未知26 | 聯繫我們 | |
奧里亞語_CC_8 | 奧里亞語 | 奧里亞語(籌備中) | 或_IN | 呼叫中心 | 60 | Oriya(籌備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
奧里亞語_GC | 奧里亞語 | 奧里亞語(籌備中) | 或_IN | 一般對話 | 100 | Oriya(管道中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
奧里亞語_MA | 奧里亞語 | 奧里亞語(籌備中) | 或_IN | 媒體音頻 | 40 | Oriya(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
波蘭語_MA_16 | 波蘭語 | 波蘭語 | pl_PL | 16千赫 | 媒體音頻 | 269 | 波蘭媒體音頻 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 173 男 354 未知 6 | 聯繫我們 | |
波蘭語Poland_SM_48 | 波蘭文(波蘭) | 波蘭文(波蘭) | PL-PL | 48千赫 | 腳本獨白 | 1,482 | Polish Poland - 劇本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1324 男 701 未知 24 | 聯繫我們 | |
旁遮普_CC_8 | 旁遮普 | 旁遮普語(籌備中) | 旁遮普 | 呼叫中心 | 60 | 旁遮普語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
旁遮普文_GC | 旁遮普 | 旁遮普語(籌備中) | 旁遮普 | 一般對話 | 100 | 旁遮普語(管道中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
旁遮普語_MA | 旁遮普 | 旁遮普語(籌備中) | 旁遮普 | 媒體音頻 | 40 | 旁遮普語(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
俄羅斯人_SM_48 | 俄語 | 俄語 | RU-RU | 48千赫 | 腳本獨白 | 2,398 | 俄羅斯腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1689 男 1937 未知 214 | 聯繫我們 | |
蘇格蘭_GC_8 | 蘇格蘭語(英語口音) | 蘇格蘭語(英語口音) | zh_AB | 8千赫 | 一般對話 | 292 | 蘇格蘭通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女285,男260,未知3 | 聯繫我們 | |
新加坡_CC_8 | 新加坡英語 | 新加坡英語 | zh_SG | 8千赫 | 呼叫中心 | 218 | 新加坡呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女2139,男884,未知21 | 聯繫我們 | |
新加坡_MA_16 | 新加坡英語 | 新加坡英語 | zh_SG | 16千赫 | 媒體音頻 | 247 | 新加坡媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女160,男455,未知37 | 聯繫我們 | |
南非英語_CC_8 | 南非英語 | 南非英語 | zh_ZA | 8千赫 | 呼叫中心 | 261 | 南非英語呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1274 男 935 未知 1 | 聯繫我們 | |
南非英語_MA_16 | 南非英語 | 南非英語 | zh_ZA | 16千赫 | 媒體音頻 | 251 | 南非英語媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女235,男432,未知36 | 聯繫我們 | |
斯瓦希里語_CC_8 | 斯瓦希裡 | 斯瓦希裡 | sw_KE | 8千赫 | 呼叫中心 | 230 | 斯瓦希里語呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女611,男833,未知0 | 聯繫我們 | |
斯瓦希里語_MA_16 | 斯瓦希裡 | 斯瓦希裡 | sw_KE | 16千赫 | 媒體音頻 | 265 | 斯瓦希里語媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女118,男493,未知25 | 聯繫我們 | |
瑞典語_CC_8 | 瑞典 | 瑞典 | sv_SE | 8千赫 | 呼叫中心 | 250 | 瑞典呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女1581,男727,未知2 | 聯繫我們 | |
瑞典語_MA_16 | 瑞典 | 瑞典 | sv_SE | 16千赫 | 媒體音頻 | 278 | 瑞典媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女195,男500,未知21 | 聯繫我們 | |
泰米爾語_CC_8 | 泰米爾人 | 泰米爾語(籌備中) | ta_IN | 呼叫中心 | 60 | 泰米爾語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
泰米爾語_GC | 泰米爾人 | 泰米爾語(籌備中) | ta_IN | 一般對話 | 100 | 泰米爾語(籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
泰米爾語_MA | 泰米爾人 | 泰米爾語(籌備中) | ta_IN | 媒體音頻 | 40 | 泰米爾語(籌備中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
泰盧固語_GC_8 | 泰盧固語 | 泰盧固語 | te_IN | 8千赫 | 一般對話 | 553 | 泰盧固語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女574,男564,未知0 | 聯繫我們 | |
泰盧固語_MA_16 | 泰盧固語 | 泰盧固語 | te_IN | 16千赫 | 媒體音頻 | 648 | 泰盧固媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女207,男963,未知2 | 聯繫我們 | |
泰盧固語_CC_8 | 泰盧固語 | 泰盧固語(籌備中) | te_IN | 呼叫中心 | 30 | 泰盧固語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
泰盧固語_GC | 泰盧固語 | 泰盧固語(籌備中) | te_IN | 一般對話 | 50 | 泰盧固語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
泰盧固語_MA | 泰盧固語 | 泰盧固語(籌備中) | te_IN | 媒體音頻 | 20 | 泰盧固語(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯繫我們 | ||||
泰文_GC_8 | 泰語 | 泰語 | th_TH | 8千赫 | 一般對話 | 183 | 泰語一般會話 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,朋友之間使用的非正式記錄 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女338,男96,未知8 | 聯繫我們 | |
泰語_MA_8 | 泰語 | 泰語 | th_TH | 16千赫 | 媒體音頻 | 173 | 泰媒音頻 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女143,男502,未知26 | 聯繫我們 | |
土耳其語 Turkey_SM_48 | 土耳其土耳其 | 土耳其土耳其 | TR-TR | 48千赫 | 腳本獨白 | 2,027 | 土耳其土耳其 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1561 男 1241 未知 31 | 聯繫我們 | |
越南語_GC_8 | 越南語 | 越南語 | vi_VN | 8千赫 | 一般對話 | 295 | 越南語通用會話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,北部(例如,河內)、中部和南部(例如,胡志明市)。 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女400,男380,未知數2 | 聯繫我們 | |
Vietnamese_MA_16 | 越南語 | 越南語 | vi_VN | 16千赫 | 媒體音頻 | 257 | 越南媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女249,男200,未知數45 | 聯繫我們 | |
威爾士_GC_8 | 威爾士語(英語口音) | 威爾士語(英語口音) | en_WL | 8千赫 | 一般對話 | 278 | 威爾士通用會話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女270,男324,未知0 | 聯繫我們 | |
英國英語_WW_16 | 英國英語 | 英國英語 | en_uk | 16千赫 | 醒來的話 | 200音箱 | 喚醒詞英國英語 | 關鍵詞收集數據
| 1通道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 性別:50% 男性,50% 女性,+/- 10%。 | 聯繫我們 |
Ground Truth 音頻和語音數據可加速您的對話式 AI 開發
憑藉超過 40 萬小時的音頻數據集/語音數據集,Shaip 可以幫助您使用高質量的語音數據集擴展您的會話 AI 模型。 黃金標準語音數據集以多種語言和方言、人口統計、說話者特徵、對話類型、環境和場景收集。 如果你找不到你要找的東西? – Shaip 可以幫助您處理任何性別、年齡、語言或設置的任何語音數據集。
我們支持的語言數據集很少: 我們擁有所有主要語言和方言的數據集。 我們最受歡迎的一些語言包括:
南非語語音數據集
阿拉伯語語音數據集
加拿大語音數據集
中文語音數據集
丹麥語語音數據集
英語語音數據集
德語語音數據集
希伯來語語音數據集
印尼語語音數據集
愛爾蘭語音數據集
日語語音數據集
韓語語音數據集
墨西哥語音數據集
波蘭語語音數據集
俄語語音數據集
蘇格蘭語音數據集
西班牙語語音數據集
瑞典語語音數據集
泰語語音數據集
土耳其語語音數據集
越南語語音數據集
數據集描述
呼叫中心對話 8khz: 無腳本的合成電話對話:“代理”和“客戶”
通用對話 8khz: 2 人之間的即興電話交談
媒體和播客 16khz: 公共領域音視頻採訪、播客等1-5人
話語/腳本獨白 16khz: 根據提示錄製
不能找到你想要的?
正在收集所有數據類型的新現成音頻和語音數據集
立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂