印地語數據集

हिंदीडेटासेट

適用於 AI 和 ASR 模型的高品質印地語呼叫中心、一般對話和播客資料集

Overview

標題(語言)

印地語資料集

資料集類型

呼叫中心、一般對話、媒體(Podcast)、腳本獨白

國家

India

簡介

我們提供 15 至 60 分鐘的兩人之間無腳本電話對話,以及可授權的公共領域音訊或視訊文件,例如 1 至 5 名參與者的訪談和播客。此外,單句錄音通常時長 5 至 30 秒,此外還提供腳本獨白資料。

用例

ASR、虛擬助手、聊天機器人、會話 AI、語音分析、TTS、語言建模

數據集詳細信息

數據集類型 採樣率 演讲嘉宾 渠道 全部小時數 發言者總數
呼叫中心 8千赫 2音箱 雙重 70:45:51 在請求
呼叫中心 8千赫 2音箱 單聲道 20,000:00:00 在請求
呼叫中心 16千赫 2音箱 單聲道 29:17:20 261
呼叫中心 16千赫 2音箱 雙重 400:27:10 1200
一般對話 8千赫 2音箱 雙重 47:48:40 224
媒體數據 16千赫 多個揚聲器 單聲道 227:57:43 438
腳本獨白 48千赫 單一揚聲器 單聲道 2,866:00:00 3,988
腳本獨白 24千赫 單一揚聲器 單聲道 29,000:00:00 在請求

特色客戶

賦能團隊打造世界領先的人工智能產品。

Amazon
Google
Microsoft微軟
賽普聯絡我們

不能找到你想要的?

正在收集所有數據類型的新現成數據集

立即聯繫我們,讓您擺脫音頻/語音訓練數據收集的後顧之憂

  • 此字段是為了進行驗證,並應保持不變。
  • 通過註冊,我同意 Shaip 隱私權政策 以及 服務條款 並同意接受來自 Shaip 的 B2B 營銷傳播。