我們最擅長的
人工智能數據服務
數據採集 創建全球音訊、圖像、文字和視訊。
數據註釋和標籤準確註解讓 AI/ML 思考更快
數據許可現成的精選資料。更聰明的模型
其他麵條
醫療保健AI 將複雜的數據轉化為可行的洞見。
對話式AI 使用多語言資料集本地化語音模型。
計算機視覺 一流的視覺訓練數據
生成式人工智能使用我們的優質訓練資料為您的 Gen AI 提供動力。
現成的數據目錄和許可
醫療數據集黃金標準,去識別化數據
醫生聽寫數據集
轉錄病歷
電子健康記錄 (EHR)
CT 掃描圖像數據集
X 射線圖像數據集
查看全部
計算機視覺數據集用於機器學習的圖像和視訊數據
銀行對賬單數據集
損壞的汽車圖像數據集
面部識別數據集
地標圖像數據集
工資單數據集
語音/音頻數據集以 65 多種語言轉錄和註釋資料。
紐約英語
中文繁體
西班牙語(墨西哥)
加拿大法語
阿拉伯語
TTS
醒來的話
呼叫中心
腳本獨白
一般對話
Podcast
自發性對話
自發IVR
歌唱音頻
解決方案
行業
醫療保健 將複雜的數據轉化為可行的洞見。
技術 利用精準數據推動科技發展
電子商務 提高轉換率、訂單價值和收入
使用案例
生物特徵數據 高品質生物特徵資料集
人臉辨識簽到 透過臉部標誌自動偵測臉部
圖像標註服務 透過影像註解增強人工智慧
印度語數據 預先標記的印度語語音資料集
內容審核服務 提升人工智慧信任度和品牌聲譽
醫療數據標註 從非結構化資料中擷取實體
利用一流的工業機器影像和視訊資料集增強人工智慧模型。
邊界框、關鍵點
用例: 汽車關鍵點識別資料集
格式: 圖片
計數: 25k
註解: 可以
描述: 「汽車關鍵點辨識資料集」專為視覺娛樂和自動駕駛應用而設計,包含一系列從網路上收集的解析度為640 x 512像素的影像。該資料集採用邊界框來識別目標汽車,並標註了每輛車上的14個關鍵點,包括四個頂點、四個燈、四個車輪以及前左側的玻璃區域,為汽車建模和分析提供詳細數據。
語義分割
用例: 損壞的電路板零件分割資料集
計數: 1,000
描述: 「損壞的板材零件分割資料集」是為製造業,特別是木材和板材生產領域量身定制的利基集合。它具有從互聯網收集的高解析度影像,範圍從 3024 x 4032 到 2048 x 5750 像素。此資料集著重於各種類型的電路板損壞的語義分割,包括裂縫、昆蟲損壞和腐爛,有助於品質控制和製造過程。
用例: 保險索賠流程
格式: avi、mkv、mov、mp4、mp5
計數: 48366
註解: 沒有
描述: 360 度以正常、穩定的速度四處走動損壞的汽車視頻,頂部和底部始終可見 損壞:長度大於高爾夫球的划痕、凹痕、叮噹聲或裂縫 外板損壞:保險槓、擋泥板、四分之一面板、門、引擎蓋和行李箱 位置:亞洲、美國、加拿大和歐洲
錄音設備: 手機相機
錄音條件: 混合照明條件
格式: 。JPG
計數: 3958
描述: 490 多輛汽車和 3958 張汽車照片,帶有損壞汽車的註釋圖像(以及元資料)。涵蓋汽車的所有側面(每輛車 8 張照片)- 保險索賠流程用例。
分類
用例: 工業金屬冶煉火焰分類
計數: 41k
描述: 「工業金屬冶煉火焰分類資料集」是為工業領域設計的,收集了網路上收集的金屬冶煉火焰影像,所有影像的解析度為350 x 350像素。此資料集致力於將火焰影像分為10類,包括過度曝光、黑煙、火團、火花以及各種強度的跳渣和飛濺,為監測和優化冶煉過程提供關鍵資料。
二值分割
用例: 機器零件缺陷分割資料集
計數: 120k
描述: 「機器零件缺陷分割資料集」是為製造業設計的,由網路收集的影像組成,所有影像的解析度均為 1000 x 1000 像素。此資料集著重於二進制分割,以識別機器零件上的白色缺陷,提供清晰的註釋,突出顯示品質控制和檢查過程的關注領域。
語意分割、多邊形、關鍵點
用例: 機器零件分割資料集
計數: 2.3k
描述: 「機器零件分割資料集」是為製造業量身定制的,包含一系列從互聯網上收集的分辨率為 2048 x 1536 像素的圖像。此資料集專門從事語意分割、多邊形和關鍵點標註,重點在於機器零件X光影像中加工位置的輪廓標註,以便於製造過程中的精確分析和檢查。
多邊形、邊界框
用例: 鐵路線標籤資料集
計數: 3k
描述: 「鐵路線標籤資料集」專為工業應用量身定制,包含一系列從互聯網上收集的分辨率為 1920 x 1080 像素的圖像。此資料集專門使用多邊形註釋對鐵路線進行詳細標記,包括其轉彎和合併。此外,這些圖像中的火車都標有邊界框。該資料集特別關注從武漢收集的鐵路網絡,為鐵路線分析和列車檢測提供本地化背景。