最值得信賴的 AI 語音數據收集服務
使用我們的音頻和語音數據收集服務,使用高質量的對話數據訓練您的 NLP 模型、VA、TTS 原型等
發現無瓶頸的音訊資料管道
特色客戶
專業音訊/語音資料擷取服務
任何科目。 任何場景。
在 Shaip,我們的專長在於創建專為各種 AI/ML 要求而設計的高品質語音資料集。我們提供廣泛的語言和不同環境的記錄,使我們的資料集全面且適應性強。氧我們的重點是在盡可能短的時間內為模型提供最大量的自訂語音資料。 與我們一起,您可以期待:
- 策劃高品質的多語言音訊/語音數據以提高準確性
- 最高可能的領域特異性目標多樣化場景 格局
- 擴展您的 ML 模型以適應不同的人口統計和垂直行業
- 錄音環境: 工作室品質, 具有水晶般清晰的音頻和最小的背景噪音,以及 自然環境,其中錄音結合了環境聲音來模仿現實世界的情況。
100+
55K+
演講時間數據
250+
項目
60+
語言(100多種方言)
8 / 16 / 44 / 48 kHz
採樣率
我們的專長
對齊音訊資料以獲得更聰明的 NLP 模型
Shaip 提供 100 多種語言的端到端語音/音頻數據收集服務,使支持語音的技術能夠迎合全球不同的受眾群體。 我們可以從事任何範圍和規模的項目; 從許可現有的現成音頻數據集到管理自定義音頻數據收集,再到音頻轉錄和註釋。 無論您的語音數據採集項目有多大,我們都可以根據您的需求定制音頻採集服務,以構建針對方言、音調和語言的高質量 NLP 數據集。 從我們廣泛的語音數據集和音頻數據收集資源中進行選擇,以實現支持語音的智能設置。
劇本獨白和即興演講
它專注於處理來自單一說話者的語音。利用腳本提示輸入單通道音訊文件,確保捕捉到特定於該人的獨特語音模式、語氣和細微差別。
腳本對話和即興演講
兩人互動,透過雙通道檔案和轉錄資源複製現實世界的對話和多語言接觸的對話。
團體/多方
對話
多人討論,捕捉團體動態、重疊、語調變化,準確訓練語音模型。
喚醒詞/關鍵短語/話語集合
訓練人工智慧使用多樣化、豐富且真實的話語來識別關鍵短語或喚醒詞或具有相似含義的話語,以實現高級自然語言處理和理解。
聲學數據
保養系列
我們可以專業錄製工作室品質的音訊數據,無論是在餐廳、辦公室或家庭,或來自各種環境和語言,同時涵蓋更廣泛的聲學範圍(綜合聲音數據集)。
自動語音識別 (ASR)
通過訪問來自廣泛人口統計數據的最先進的多樣化語音/音頻數據集,提高自動語音識別 (ASR) 系統的準確性。
多語言語音/音頻訓練數據
我們遍佈全球的熟練語言專業人員提供各種語言和方言的多語言音訊/語音資料。這項努力促進了全球溝通並消除了語言障礙,有助於打造更具包容性和更有效的人工智慧解決方案。
文本到語音轉換
(語音合成)
在我們全球員工的幫助下建立文字轉語音 (TTS) 多語言模型,他們幫助您收集 150 多種語言和方言的語音數據,以增強您的 AI 模型,從車載控製到聊天機器人和學習解決方案,高品質的音訊數據。
呼叫中心
對話
代理商與客戶之間的真實交流,支援西班牙語、德語、美式英語、孟加拉語、日語、中文、印地語等多種語言。
成功案例
對話式 AI 資料集,包含 3 種語言的超過 8 小時的數據
為了建立一個印度語言的多語言平台,該客戶與 Shaip 合作,收集、分割和轉錄多種印度語言的大型資料集。這將有助於開發有效的語音模型,為客戶的創新新平台提供動力。
問題: 以 3,000 種印度語言收集超過 8 小時的音訊數據,進行分段和轉錄以開發自動語音辨識。
解決方案: 我們提供資料收集、分段、轉錄,並提供帶有元資料的 JSON 檔案。我們為客戶的語音技術專案大規模收集了 3000 種印度語言的 8 小時的音訊資料。
選擇 Shaip 作為您值得信賴的語音數據收集合作夥伴的原因
我們的團隊
專門和訓練有素的團隊:
- 30,000 多名數據創建、標籤和 QA 協作者
- 有資質的項目管理團隊
- 經驗豐富的產品開發團隊
- 人才庫採購和入職團隊
過程
通過以下方式確保最高的流程效率:
- 穩健的 6 Sigma Stage-Gate 工藝
- 一個由 6 Sigma 黑帶組成的專門團隊——關鍵流程負責人和質量合規
- 持續改進和反饋循環
平台
獲得專利的平台具有以下優勢:
- 基於網絡的端到端平台
- 無可挑剔的品質
- 更快的 TAT
- 無縫交付
我們的團隊
專門和訓練有素的團隊:
- 30,000 多名數據創建、標籤和 QA 協作者
- 有資質的項目管理團隊
- 經驗豐富的產品開發團隊
- 人才庫採購和入職團隊
過程
通過以下方式確保最高的流程效率:
- 穩健的 6 Sigma Stage-Gate 工藝
- 一個由 6 Sigma 黑帶組成的專門團隊——關鍵流程負責人和質量合規
- 持續改進和反饋循環
平台
獲得專利的平台具有以下優勢:
- 基於網絡的端到端平台
- 無可挑剔的品質
- 更快的 TAT
- 無縫交付
現成的語音/音頻數據集
更多資訊 | 語料庫 ID(唯一) | 關鍵詞 | 語言數據集 | 語言代碼 | 取樣率 | 數據集類型 | 總音頻時數 | 簡要說明 | 數據集描述 | 音頻頻道 | 錄音平台 | WER(%) | 音頻格式 | 轉錄格式 | 用例 | 使用者數量 | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
紐約英語_GC_8 | 紐約英語 | 紐約英語 | EN_US | 8千赫 | 一般對話 | 107 | 紐約英語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女118,男114,未知0 | 聯絡我們 | |
俄羅斯人_SM_48 | 俄語 | 俄語 | RU-RU | 48千赫 | 腳本獨白 | 2,398 | 俄羅斯腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1689 男 1937 未知 214 | 聯絡我們 | |
旁遮普語_MA | 旁遮普 | 旁遮普語(籌備中) | 旁遮普 | 媒體音頻 | 40 | 旁遮普語(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
旁遮普文_GC | 旁遮普 | 旁遮普語(籌備中) | 旁遮普 | 一般對話 | 100 | 旁遮普語(管道中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
旁遮普_CC_8 | 旁遮普 | 旁遮普語(籌備中) | 旁遮普 | 呼叫中心 | 60 | 旁遮普語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
波蘭語Poland_SM_48 | 波蘭文(波蘭) | 波蘭文(波蘭) | PL-PL | 48千赫 | 腳本獨白 | 1,482 | Polish Poland - 劇本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1324 男 701 未知 24 | 聯絡我們 | |
波蘭語_MA_16 | 波蘭語 | 波蘭語 | pl_PL | 16千赫 | 媒體音頻 | 269 | 波蘭媒體音頻 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 173 男 354 未知 6 | 聯絡我們 | |
奧里亞語_MA | 奧里亞語 | 奧里亞語(籌備中) | 或_IN | 媒體音頻 | 40 | Oriya(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
奧里亞語_GC | 奧里亞語 | 奧里亞語(籌備中) | 或_IN | 一般對話 | 100 | Oriya(管道中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
奧里亞語_CC_8 | 奧里亞語 | 奧里亞語(籌備中) | 或_IN | 呼叫中心 | 60 | Oriya(籌備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
新西蘭_MA_16 | 新西蘭英語 | 新西蘭英語 | zh_NZ | 16千赫 | 媒體音頻 | 400 | 新西蘭英語媒體音頻 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女367,男678,未知26 | 聯絡我們 | |
新西蘭_GC_8 | 新西蘭英語 | 新西蘭英語 | zh_NZ | 8千赫 | 一般對話 | 148 | 新西蘭英語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女167,男121,未知4 | 聯絡我們 | |
紐約英語_MA_16 | 紐約英語 | 紐約英語 | EN_US | 16千赫 | 媒體音頻 | 140 | 紐約英語媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女66,男230,未知11 | 聯絡我們 | |
蘇格蘭_GC_8 | 蘇格蘭語(英語口音) | 蘇格蘭語(英語口音) | zh_AB | 8千赫 | 一般對話 | 292 | 蘇格蘭通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女285,男260,未知3 | 聯絡我們 | |
紐約英語_CC_8 | 紐約英語 | 紐約英語 | EN_US | 8千赫 | 呼叫中心 | 103 | 紐約英語呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女610,男532,未知0 | 聯絡我們 | |
荷蘭_SM_48 | 荷蘭人 | 荷蘭人 | NL-NL | 48千赫 | 腳本獨白 | 1,205 | 荷蘭腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1285 男 531 未知 3 | 聯絡我們 | |
墨西哥人_SM_48 | 西班牙語(墨西哥) | 西班牙語(墨西哥) | ES-MX | 48千赫 | 腳本獨白 | 1,492 | 墨西哥西班牙語腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1016 男 1069 未知 95 | 聯絡我們 | |
馬拉地語_MA | 馬拉 | 馬拉地語(籌備中) | 先生_IN | 媒體音頻 | 40 | 馬拉地語(籌備中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
馬拉地語_GC | 馬拉 | 馬拉地語(籌備中) | 先生_IN | 一般對話 | 100 | 馬拉地語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
馬拉地語_CC_8 | 馬拉 | 馬拉地語(籌備中) | 先生_IN | 呼叫中心 | 60 | 馬拉地語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
馬拉雅拉姆語_MA | 馬拉雅拉姆語 | 馬拉雅拉姆語(籌備中) | 毫升_IN | 媒體音頻 | 40 | Malayalam (In Pipeline) 媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
馬拉雅拉姆語_GC | 馬拉雅拉姆語 | 馬拉雅拉姆語(籌備中) | 毫升_IN | 一般對話 | 100 | 馬拉雅拉姆語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
馬拉雅拉姆語_CC_8 | 馬拉雅拉姆語 | 馬拉雅拉姆語(籌備中) | 毫升_IN | 呼叫中心 | 60 | 馬拉雅拉姆語(正在籌備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
馬來語_MA_16 | 馬來語 | 馬來語 | ms_我的 | 16千赫 | 媒體音頻 | 344 | 馬來媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 236,男 626,未知 47 | 聯絡我們 | |
馬來語_GC_8 | 馬來語 | 馬來語 | ms_我的 | 8千赫 | 一般對話 | 266 | 馬來語通用對話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,馬來西亞馬來語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女316,男176,未知0 | 聯絡我們 | |
泰盧固語_GC_8 | 泰盧固語 | 泰盧固語 | TE_IN | 8千赫 | 一般對話 | 553 | 泰盧固語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女574,男564,未知0 | 聯絡我們 | |
英國英語_WW_16 | 英國英語 | 英國英語 | zh_cn | 16千赫 | 醒來的話 | 200音箱 | 喚醒詞英國英語 | 關鍵詞收集數據
| 1通道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 性別:50% 男性,50% 女性,+/- 10%。 | 聯絡我們 | |
威爾士_GC_8 | 威爾士語(英語口音) | 威爾士語(英語口音) | en_WL | 8千赫 | 一般對話 | 278 | 威爾士通用會話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女270,男324,未知0 | 聯絡我們 | |
越南語_MA_16 | 越南語 | 越南語 | en_VN | 16千赫 | 媒體音頻 | 257 | 越南媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女249,男200,未知數45 | 聯絡我們 | |
越南語_GC_8 | 越南語 | 越南語 | en_VN | 8千赫 | 一般對話 | 295 | 越南語通用會話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘,北部(例如,河內)、中部和南部(例如,胡志明市)。 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女400,男380,未知數2 | 聯絡我們 | |
土耳其語 Turkey_SM_48 | 土耳其土耳其 | 土耳其土耳其 | TR-TR | 48千赫 | 腳本獨白 | 2,027 | 土耳其土耳其 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1561 男 1241 未知 31 | 聯絡我們 | |
泰語_MA_8 | 泰語 | 泰語 | th_TH | 16千赫 | 媒體音頻 | 173 | 泰媒音頻 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女143,男502,未知26 | 聯絡我們 | |
泰文_GC_8 | 泰語 | 泰語 | th_TH | 8千赫 | 一般對話 | 183 | 泰語一般會話 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,朋友之間使用的非正式記錄 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女338,男96,未知8 | 聯絡我們 | |
泰盧固語_MA | 泰盧固語 | 泰盧固語(籌備中) | TE_IN | 媒體音頻 | 20 | 泰盧固語(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
泰盧固語_GC | 泰盧固語 | 泰盧固語(籌備中) | TE_IN | 一般對話 | 50 | 泰盧固語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
泰盧固語_CC_8 | 泰盧固語 | 泰盧固語(籌備中) | TE_IN | 呼叫中心 | 30 | 泰盧固語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
泰盧固語_MA_16 | 泰盧固語 | 泰盧固語 | TE_IN | 16千赫 | 媒體音頻 | 648 | 泰盧固媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女207,男963,未知2 | 聯絡我們 | |
韓國人_SM_48 | 韓語 | 韓語 | KO-KR | 48千赫 | 腳本獨白 | 1,955 | 韓國腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1195 男 1134 未知 122 | 聯絡我們 | |
泰米爾語_MA | 泰米爾人 | 泰米爾語(籌備中) | 塔_IN | 媒體音頻 | 40 | 泰米爾語(籌備中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
泰米爾語_GC | 泰米爾人 | 泰米爾語(籌備中) | 塔_IN | 一般對話 | 100 | 泰米爾語(籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
泰米爾語_CC_8 | 泰米爾人 | 泰米爾語(籌備中) | 塔_IN | 呼叫中心 | 60 | 泰米爾語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
瑞典語_MA_16 | 瑞典 | 瑞典 | sv_SE | 16千赫 | 媒體音頻 | 278 | 瑞典媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女195,男500,未知21 | 聯絡我們 | |
瑞典語_CC_8 | 瑞典 | 瑞典 | sv_SE | 8千赫 | 呼叫中心 | 250 | 瑞典呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女1581,男727,未知2 | 聯絡我們 | |
斯瓦希里語_MA_16 | 斯瓦希裡 | 斯瓦希裡 | sw_KE | 16千赫 | 媒體音頻 | 265 | 斯瓦希里語媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女118,男493,未知25 | 聯絡我們 | |
斯瓦希里語_CC_8 | 斯瓦希裡 | 斯瓦希裡 | sw_KE | 8千赫 | 呼叫中心 | 230 | 斯瓦希里語呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女611,男833,未知0 | 聯絡我們 | |
南非英語_MA_16 | 南非英語 | 南非英語 | zh_ZA | 16千赫 | 媒體音頻 | 251 | 南非英語媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女235,男432,未知36 | 聯絡我們 | |
南非英語_CC_8 | 南非英語 | 南非英語 | zh_ZA | 8千赫 | 呼叫中心 | 261 | 南非英語呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1274 男 935 未知 1 | 聯絡我們 | |
新加坡_MA_16 | 新加坡英語 | 新加坡英語 | zh_SG | 16千赫 | 媒體音頻 | 247 | 新加坡媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女160,男455,未知37 | 聯絡我們 | |
新加坡_CC_8 | 新加坡英語 | 新加坡英語 | zh_SG | 8千赫 | 呼叫中心 | 218 | 新加坡呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女2139,男884,未知21 | 聯絡我們 | |
波士頓_CC_8 | 波士頓英語 | 波士頓英語 | EN_US | 8千赫 | 呼叫中心 | 177 | 波士頓呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:605,男性:711,未知:0 | 聯絡我們 | |
英語深南_CC_8 | 英語深南 | 英語深南 | EN_US | 8千赫 | 呼叫中心 | 151 | 英文深南呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女221,男1004,未知7 | 聯絡我們 | |
丹麥語_SM_48 | 丹麥 | 丹麥 | DA-DK | 48千赫 | 腳本獨白 | 2,579 | 丹麥語劇本獨白 | 單句錄音,通常在 5 到 30 秒範圍內,來自丹麥的丹麥語 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1551 男 1233 未知 42 | 聯絡我們 | |
丹麥語_MA_16 | 丹麥 | 丹麥 | 達_DK | 16千赫 | 媒體音頻 | 664 | 丹麥媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:369,男性:864,未知:27 | 聯絡我們 | |
丹麥文_GC_8 | 丹麥 | 丹麥 | 達_DK | 8千赫 | 一般對話 | 372 | 丹麥語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:311,男性:417,未知:0 | 聯絡我們 | |
繁體中文_SM_48 | 中文繁體 | 中文繁體 | zh-TW | 48千赫 | 腳本獨白 | 1,028 | 中文繁體 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1069 男 262 未知 3 | 聯絡我們 | |
簡體中文_SM_48 | 中文簡體 | 中文簡體 | ZH-CN | 48千赫 | 腳本獨白 | 2,762 | 中文簡體 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1920 男 1535 未知 270 | 聯絡我們 | |
中文_MA_16 | 中文英文 | 中文英文 | EN_US | 16千赫 | 媒體音頻 | 249 | 中文媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:126 人,男性:346 人,未知:6 人 | 聯絡我們 | |
中文_CC_8 | 中文英文 | 中文英文 | EN_US | 8千赫 | 呼叫中心 | 169 | 中國呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:1790 人,男性:523 人,未知:13 人 | 聯絡我們 | |
加拿大人_SM_48 | 加拿大法語 | 加拿大法語 | FR-CA | 48千赫 | 腳本獨白 | 1,222 | 加拿大法語 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 974 男 631 未知 1 | 聯絡我們 | |
波士頓_MA_16 | 波士頓英語 | 波士頓英語 | EN_US | 16千赫 | 媒體音頻 | 93 | 波士頓媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:43,男性:181,未知:2 | 聯絡我們 | |
波士頓_GC_8 | 波士頓英語 | 波士頓英語 | EN_US | 8千赫 | 一般對話 | 32 | Boston General Conversation 數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:53,男性:83,未知:0 | 聯絡我們 | |
英語深南_GC_8 | 英語深南 | 英語深南 | EN_US | 8千赫 | 一般對話 | 56 | 英語 Deep South General Conversation 數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 99,男 31,未知 0 | 聯絡我們 | |
孟加拉語_MA | 孟加拉 | 孟加拉語(籌備中) | bn_IN | 媒體音頻 | 40 | 孟加拉語(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
孟加拉語_GC | 孟加拉 | 孟加拉語(籌備中) | bn_IN | 一般對話 | 100 | 孟加拉語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
孟加拉語_CC_8 | 孟加拉 | 孟加拉語(籌備中) | bn_IN | 呼叫中心 | 60 | 孟加拉語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
阿薩姆語_MA | 阿薩姆 | 阿薩姆語(籌備中) | 作為_IN | 媒體音頻 | 40 | 阿薩姆語(管道中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
阿薩姆語_GC | 阿薩姆 | 阿薩姆語(籌備中) | 作為_IN | 一般對話 | 100 | 阿薩姆語(管道中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
阿薩姆語_CC_8 | 阿薩姆 | 阿薩姆語(籌備中) | 作為_IN | 呼叫中心 | 60 | 阿薩姆語(正在籌備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
阿拉伯語_SM_48 | 阿拉伯語 | 阿拉伯語 | AR-SA | 48千赫 | 腳本獨白 | 1,947 | 阿拉伯語腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 838 男 1209 未知 78 | 聯絡我們 | |
阿拉伯語_GC_8 | 阿拉伯語 | 阿拉伯語 | ar_AE | 8千赫 | 一般對話 | 292 | 阿拉伯語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,來自海灣國家的阿拉伯語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:171,男性:534,未知:1 | 聯絡我們 | |
南非荷蘭語_MA_16 | 南非荷蘭語 | 南非荷蘭語 | AF_ZA | 16千赫 | 媒體音頻 | 658 | 南非荷蘭語媒體文件 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:750,男性:1278,未知:52 | 聯絡我們 | |
南非荷蘭語_GC_8 | 南非荷蘭語 | 南非荷蘭語 | AF_ZA | 8千赫 | 一般對話 | 368 | 南非荷蘭語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,在非洲說南非荷蘭語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:502,男性:390,未知:2 | 聯絡我們 | |
en_US_MA_16 | 非裔美國人白話 | 非裔美國人白話 | EN_US | 16千赫 | 媒體音頻 | 154 | 非裔美國人民間媒體數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:151,男性:150,未知:10 | 聯絡我們 | |
HINGLISH_MA_16 | 興力士 | 興力士 | 汞輸入 | 16千赫 | 媒體音頻 | 216 | HINGLISH 媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性 75 人,男性 380 人,未知 0 人 | 聯絡我們 | |
韓語_MA_16 | 韓語 | 韓語 | ko_KR | 16千赫 | 媒體音頻 | 204 | 韓國媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性 70 男性 303,未知 25 | 聯絡我們 | |
韓文_CC_8 | 韓語 | 韓語 | ko_KR | 8千赫 | 呼叫中心 | 107 | 韓國呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女1086,男210,未知4 | 聯絡我們 | |
卡納達語_MA | 卡納達語 | 卡納達語(籌備中) | kn_IN | 媒體音頻 | 40 | 卡納達語(籌備中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
卡納達語_GC | 卡納達語 | 卡納達語(籌備中) | kn_IN | 一般對話 | 100 | 卡納達語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
卡納達語_CC_8 | 卡納達語 | 卡納達語(籌備中) | kn_IN | 呼叫中心 | 60 | 卡納達語(籌備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
日本人_SM_48 | 日文 | 日文 | JA-JP | 48千赫 | 腳本獨白 | 2,335 | 日本腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1460 男 1221 未知 194 | 聯絡我們 | |
愛爾蘭人_GC_8 | 愛爾蘭 | 愛爾蘭 | en_IE | 8千赫 | 一般對話 | 192 | 愛爾蘭語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 213 男 153 未知 0 | 聯絡我們 | |
印度尼西亞語_MA_16 | 印度尼西亞 | 印度尼西亞 | id_ID | 16千赫 | 媒體音頻 | 643 | 印尼媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女746,男1507,未知129 | 聯絡我們 | |
印度尼西亞語_GC_8 | 印度尼西亞 | 印度尼西亞 | id_ID | 8千赫 | 一般對話 | 496 | 印度尼西亞語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,印尼語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女524,男454,未知2 | 聯絡我們 | |
西班牙裔_MA_16 | 西班牙裔英語 | 西班牙裔英語 | EN_US | 16千赫 | 媒體音頻 | 155 | 西班牙呼叫媒體音頻 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女140,男219,未知5 | 聯絡我們 | |
西班牙裔_CC_8 | 西班牙裔英語 | 西班牙裔英語 | EN_US | 8千赫 | 呼叫中心 | 212 | 西班牙呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女822,男1262,未知0 | 聯絡我們 | |
en_US_CC_8 | 非裔美國人白話 | 非裔美國人白話 | EN_US | 8千赫 | 呼叫中心 | 211 | 非裔美國人方言呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性:612,男性:1242,未知:12 | 聯絡我們 | |
HINGLISH_CC_8 | 興力士 | 興力士 | 汞輸入 | 8千赫 | 呼叫中心 | 208 | 英語呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女822,男1262,未知0 | 聯絡我們 | |
印地語_SM_48 | 印度語 | 印度語 | HI-IN | 48千赫 | 腳本獨白 | 2,867 | 印地語腳本獨白 | 單段錄音,通常在 5 到 30 秒範圍內 | 單聲道 | 手機應用程序 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 1977 男 1864 未知 147 | 聯絡我們 | |
印地語_MA_16 | 印度語 | 印度語 | 嗨_IN | 16千赫 | 媒體音頻 | 219 | 印地語媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女83,男309,未知0 | 聯絡我們 | |
希伯來語_MA_16 | 希伯來語 | 希伯來語 | 他_IL | 16千赫 | 媒體音頻 | 427 | 希伯來媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女361,男513,未知13 | 聯絡我們 | |
希伯來語_一般對話_8 | 希伯來語 | 希伯來語 | 他_IL | 8千赫 | 一般對話 | 399 | 希伯來語通用會話數據 | 兩個人之間的即興電話交談。 大約。 音頻時長(範圍) - 15-60 分鐘,以色列希伯來語 | 雙重 | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女414,男399,未知1 | 聯絡我們 | |
古吉拉特語_MA | 古吉拉特語 | 古吉拉特語(籌備中) | gu_IN | 媒體音頻 | 40 | 古吉拉特語(籌備中)媒體音頻數據 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
古吉拉特語_GC | 古吉拉特語 | 古吉拉特語(籌備中) | gu_IN | 一般對話 | 100 | 古吉拉特語(正在籌備中)一般對話數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
古吉拉特語_CC_8 | 古吉拉特語 | 古吉拉特語(籌備中) | gu_IN | 呼叫中心 | 60 | 古吉拉特語(準備中)呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 桌面 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 聯絡我們 | ||||
德國_IVR_8 | 德語 | 德語 | 德德 | 8千赫 | IVR | 200 | 德國 IVR 數據 | 人對機器。 一種 IVR 類型的流程,其中有 TTS 提示(例如“我可以為您提供什麼幫助”),然後是自發的人工響應 | 單聲道 | 桌面 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 10115 男 8750 未知 0 | 聯絡我們 | ||
德國_CC_8 | 德語 | 德語 | 德德 | 8千赫 | 呼叫中心 | 64 | 德國呼叫中心數據 | “代理”和“客戶”之間的無腳本合成電話對話,大約。 音頻時長(範圍)5-15 分鐘, | 單聲道 | 桌面 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女性 478 男性 1440 未知 0 | 聯絡我們 | ||
英語 Deep South_MA_16 | 英語深南 | 英語深南 | EN_US | 16千赫 | 媒體音頻 | 266 | 英文深南傳媒音頻資料 | 可授權的公共領域音頻/視頻文件,例如採訪、播客等 - 1 到 5 人。 大約。 音頻時長(範圍)15-60 分鐘 | 單聲道 | 網絡採購 | 5.0 | WAV。 | .json | ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模 | 女 204,男 356,未知 21 | 聯絡我們 |
想要構建自己的音頻數據集?
與我們的內部語音數據收集專家聯繫,建立最適合您要求的音頻存儲庫
常見問題
ML 模型的語音數據收集是指收集口語錄音的過程。 該集合有助於訓練和完善機器學習算法,特別是那些以理解和處理人類聲音為中心的算法。
當旨在收集自動語音識別 (ASR) 的音頻數據時,您應該首先定義項目的特定需求,包括所需的語言、口音和語音類型。 設置這些參數後,請確保您獲得尊重用戶隱私的所有必要權限。 然後,使用適當的錄音設備或軟件捕獲清晰的音頻樣本。 每個錄音都應仔細註釋其轉錄或其他相關元數據,並系統存儲以便輕鬆訪問。
機器學習中的語音數據集對於訓練、測試和驗證專門用於識別、轉錄或解釋口語的模型至關重要。 此類數據集為從語音助手和轉錄服務到語音生物識別技術的無數應用程序鋪平了道路。
為了從不同的語言和口音中收集精確的數據,與所需語言背景的母語人士的合作至關重要。 旨在獲得多樣化且具有代表性的樣本,以涵蓋廣泛的人口統計差異。 在統一環境下使用標準化錄音設備,確保音頻一致性。 重要的是,用詳細的轉錄和元數據註釋每個數據片段,表示特定的語言和口音。