Overview
標題(語言)
印地語資料集
資料集類型
呼叫中心、一般對話、媒體(Podcast)、腳本獨白
國家
India
簡介
我們提供 15 至 60 分鐘的兩人之間無腳本電話對話,以及可授權的公共領域音訊或視訊文件,例如 1 至 5 名參與者的訪談和播客。此外,單句錄音通常時長 5 至 30 秒,此外還提供腳本獨白資料。
用例
ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
數據集詳細信息
| 數據集類型 | 採樣率 | 演讲嘉宾 | 渠道 | 全部小時數 | 發言者總數 |
|---|---|---|---|---|---|
| 呼叫中心 | 8千赫 | 2音箱 | 雙重 | 70:45:51 | 在請求 |
| 呼叫中心 | 8千赫 | 2音箱 | 單聲道 | 20,000:00:00 | 在請求 |
| 呼叫中心 | 16千赫 | 2音箱 | 單聲道 | 29:17:20 | 261 |
| 呼叫中心 | 16千赫 | 2音箱 | 雙重 | 400:27:10 | 1200 |
| 一般對話 | 8千赫 | 2音箱 | 雙重 | 47:48:40 | 224 |
| 媒體數據 | 16千赫 | 多個揚聲器 | 單聲道 | 227:57:43 | 438 |
| 腳本獨白 | 48千赫 | 單一揚聲器 | 單聲道 | 2,866:00:00 | 3,988 |
| 腳本獨白 | 24千赫 | 單一揚聲器 | 單聲道 | 29,000:00:00 | 在請求 |
特色客戶
賦能團隊打造世界領先的人工智能產品。
不能找到你想要的?
正在收集所有數據類型的新現成數據集
立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂