標題(語言)
紐約英語語言資料集
資料集類型
呼叫中心、一般對話、媒體(Podcast)
國家
美國
簡介
該資料集提供多樣化的語音和媒體內容,包括非腳本的合成代理與客戶對話(5-15 分鐘)、人與人之間的電話對話(15-60 分鐘)、帶有轉錄的歌唱音頻、採訪、播客和腳本獨白,支持語音和語言技術的訓練和評估。
用例
ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模
| 數據集類型 | 採樣率 | 演讲嘉宾 | 渠道 | 全部小時數 | 發言者總數 |
|---|---|---|---|---|---|
| 呼叫中心 | 8千赫 | 2音箱 | 雙重 | 117:40:09 | 1,388 |
| 一般對話 | 8千赫 | 2音箱 | 雙重 | 156:42:48 | 510 |
| 音樂 | 16千赫 | 單一揚聲器 | 單聲道 | 135:14:18 | 288 |
賦能團隊打造世界領先的人工智能產品。
立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂