標題(語言)
馬來語資料集
資料集類型
呼叫中心、一般對話、媒體資料(播客資料)
國家
馬來西亞、印尼、汶萊和新加坡
簡介
提供馬來西亞兩人之間用馬來語進行的無腳本電話對話,時長為 15 至 60 分鐘,以及可授權的公共領域音頻或視頻文件,例如 1 至 5 名參與者的採訪和播客,時長也為 15 至 60 分鐘。
用例
ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
| 數據集類型 | 採樣率 | 演讲嘉宾 | 渠道 | 全部小時數 | 發言者總數 |
|---|---|---|---|---|---|
| 一般對話 | 8千赫 | 2音箱 | 雙重 | 239:49:43 | 432 |
| 一般對話 | 48千赫 | 2音箱 | 單聲道 | 90:19:23 | 140 |
| 媒體數據 | 16千赫 | 多重揚聲器 | 單聲道 | 343:57:16 | 907 |
| 呼叫中心 | 8千赫 | 2音箱 | 單聲道 | 2,000:00:00 | 在請求 |
賦能團隊打造世界領先的人工智能產品。
立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂