釋放泰米爾語語音資料集的強大功能,協助 ASR、TTS 和對話式 AI 的發展。 Shaip 提供優質的泰米爾語音訊資料集,用於訓練更聰明的語言模型。
標題(語言)
泰米爾語資料集
資料集類型
呼叫中心、一般對話、媒體資料、腳本獨白
國家
India
簡介
該數據集包括非腳本合成代理與客戶對話(5-15 分鐘)、自然人與人之間的電話對話(15-60 分鐘)以及帶有轉錄的媒體數據,為訓練和評估語音和語言技術提供了多樣化的語音數據。
用例
ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
| 數據集類型 | 採樣率 | 演讲嘉宾 | 渠道 | 全部小時數 | 發言者總數 |
|---|---|---|---|---|---|
| 呼叫中心 | 8千赫 | 2音箱 | 雙重 | 124:23:52 | 484 |
| 呼叫中心 | 16千赫 | 2音箱 | 單聲道 | 199:44:21 | 1,986 |
| 一般對話 | 8千赫 | 2音箱 | 雙重 | 101:42:05 | 440 |
| 一般對話 | 48千赫 | 2音箱 | 單聲道 | 80:21:16 | 141 |
| 媒體數據 | 16千赫 | 多個揚聲器 | 單聲道 | 43:07:01 | 32 |
| 腳本獨白 | 24千赫 | 單一揚聲器 | 單聲道 | 500:00:00 | 在請求 |
賦能團隊打造世界領先的人工智能產品。
立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂