我們最擅長的
人工智能數據服務
數據採集 創建全球音訊、圖像、文字和視訊。
數據註釋和標籤 準確註解讓 AI/ML 思考更快
數據去標識化 保護敏感訊息,保護隱私
其他麵條
醫療保健AI 將複雜的數據轉化為可行的洞見。
對話式AI 使用多語言資料集本地化語音模型。
計算機視覺 一流的視覺訓練數據
生成式人工智能使用我們的優質訓練資料為您的 Gen AI 提供動力。
現成的數據目錄和許可
醫療數據集黃金標準,去識別化數據
醫生聽寫數據集
轉錄病歷
電子健康記錄 (EHR)
CT 掃描圖像數據集
X 射線圖像數據集
查看全部
計算機視覺數據集用於 ML 開發的圖像和視訊數據
銀行對賬單數據集
損壞的汽車圖像數據集
面部識別數據集
地標圖像數據集
工資單數據集
語音/音頻數據集以 50 多種語言轉錄和註釋資料。
紐約英語 | TTS
中文繁體 | 話語/喚醒詞
西班牙語(墨西哥) | 呼叫中心
加拿大法語 | 腳本獨白
阿拉伯語 | 一般對話
解決方案
行業
銀行與金融 改進機器學習模型以確保安全的使用者體驗
車用電子應用 自動駕駛車輛的準確訓練數據
電子商務 提高轉換率、訂單價值和收入
用例
命名實體識別提取非結構化資料中的關鍵訊息
人臉辨識簽到 透過臉部標誌自動偵測臉部
搜尋查詢優化 改善線上商店搜尋結果
文字轉語音 (TTS) 增強與全球 TTS 資料集的交互
內容審核服務 提升人工智慧信任度和品牌聲譽
光學字符識別(OCR) 以數位方式優化數據
多種語言的現成語音/語音/音頻數據集,可快速啟動您的自動語音識別 (ASR) 模型
呼叫中心、媒體音頻
編號時間: 365
查看更多
一般對話、媒體音頻
編號時間: 1,026
一般對話、TTS
編號時間: 2,239
呼叫中心、一般對話、媒體音頻
編號時間: 200
編號時間: 301
編號時間: 1,000
TTS
編號時間: 1,222
編號時間: 418
編號時間: 2,762
編號時間: 1,028
編號時間: 900
一般對話、媒體音訊、TTS
編號時間: 3,615
編號時間: 700
編號時間: 250
編號時間: 1,205
編號時間: 473
呼叫中心、IVR
編號時間: 264
編號時間: 826
編號時間: 3,126
編號時間: 424
編號時間: 367
編號時間: 1,139
一般對話
編號時間: 192
編號時間: 2,335
呼叫中心、媒體音訊、TTS
編號時間: 2,266
編號時間: 610
編號時間: 850
編號時間: 350
編號時間: 548
媒體音訊、TTS
編號時間: 1,751
編號時間: 2,398
編號時間: 292
編號時間: 465
編號時間: 512
編號時間: 1,492
編號時間: 495
編號時間: 528
編號時間: 1,201
編號時間: 356
編號時間: 2,027
歌唱音頻
編號時間: 20
編號時間: 552
喚醒詞/關鍵字
編號時間: 200音箱
編號時間: 10,000
編號時間: 2,000
編號時間:
編號時間: 40,000
編號時間: 278
語音/音頻數據集是音頻文件和相關數據的集合,主要用於與聲音相關的機器學習任務的訓練和測試。
此類數據集通常包括口語單詞、短語、環境聲音、音樂、註釋,有時還包括有關錄製條件的轉錄或元數據。
語音/音頻數據集訓練 AI 模型來識別、生成或轉換聲音模式,從而實現語音識別、聲音分類和音頻合成等任務。
通過高分辨率錄音、降噪、一致的標籤以及針對既定基準的驗證來確保質量。
這些數據集訓練語音助手或聊天機器人理解和生成人類語音,從而促進通過語音進行交互和命令執行。
元數據提供上下文,例如錄音條件或演講者人口統計數據,增強數據集的可用性並允許更精細的模型訓練和分析。