阿拉伯數據集

阿爾巴尼亞 阿爾巴尼亞

用於人工智慧和語音模型的高品質阿拉伯語一般對話和播客資料集

總覽

標題

阿拉伯語語言數據集

數據集類型

一般對話

完整看板介紹

兩個人之間的即興電話交談。 約音頻時長(範圍)——15-60 分鐘,來自海灣國家的阿拉伯語。

用例

ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模

數據集詳細信息

全部小時數

292

取樣率

8千赫

音頻頻道

雙重

錄音平台

桌面

音頻格式

WAV。

轉錄格式

.json

WER(%)

5

數據集人口統計

國家

阿拉伯語

語言

阿拉伯語

性別

女 838 男 1209 未知 78

使用者數量

706

年齡

18-50

總覽

標題

阿拉伯語語言數據集

數據集類型

TTS

完整看板介紹

單句錄音,往往在 5 到 30 秒範圍內。

用例

ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模

數據集詳細信息

全部小時數

1,947

取樣率

48千赫

音頻頻道

單聲道

錄音平台

行動應用程式

音頻格式

WAV。

轉錄格式

.json

WER(%)

5

數據集人口統計

國家

阿拉伯語

語言

阿拉伯語

性別

女 838 男 1209 未知 78

使用者數量

2,125

年齡

18-50

特色客戶

賦能團隊打造世界領先的人工智能產品。

Amazon
Google
Microsoft微軟
賽普聯絡我們

不能找到你想要的?

正在收集所有數據類型的新現成數據集

立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂

  • 通過註冊,我同意 Shaip 隱私政策 服務條款 並同意接受來自 Shaip 的 B2B 營銷傳播。
  • 此字段是為了進行驗證,並應保持不變。