阿拉伯數據集

阿爾巴尼亞 阿爾巴尼亞

適用於人工智慧和語音模型的高品質阿拉伯語通用對話和文字轉語音 (TTS)

Overview

標題(語言)

阿拉伯語語言數據集

資料集類型

呼叫中心、一般對話、音樂、腳本獨白

國家

阿拉伯語

簡介

該資料集包括非腳本合成代理與客戶之間的電話對話(5-15 分鐘)、海灣阿拉伯語的自然人與人之間的電話對話(15-60 分鐘)以及帶有轉錄的歌唱音頻,為訓練和評估語音和語言技術提供了多樣化的語音數據。

用例

ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模

數據集詳細信息

數據集類型 採樣率 演讲嘉宾 渠道 全部小時數 發言者總數
呼叫中心 8千赫 2音箱 雙重 62:52:19 在請求
呼叫中心 8千赫 2音箱 單聲道 1,025:09:19 在請求
一般對話 8千赫 2音箱 雙重 254:16:34 626
音樂 48千赫 單一揚聲器 單聲道 03:17:21 10
腳本獨白 48千赫 單一揚聲器 單聲道 4,249:00:00 2,125
腳本獨白 24千赫 單一揚聲器 單聲道 2,300:00:00 在請求

特色客戶

賦能團隊打造世界領先的人工智能產品。

Amazon
Google
Microsoft微軟
賽普聯絡我們

不能找到你想要的?

正在收集所有數據類型的新現成數據集

立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂

  • 此字段是為了進行驗證,並應保持不變。
  • 通過註冊,我同意 Shaip 隱私政策 服務條款 並同意接受來自 Shaip 的 B2B 營銷傳播。