我們最擅長的
人工智能數據服務
數據採集 創建全球音訊、圖像、文字和視訊。
數據註釋和標籤準確註解讓 AI/ML 思考更快
數據許可現成的精選資料。更聰明的模型
其他麵條
醫療保健AI 將複雜的數據轉化為可行的洞見。
對話式AI 使用多語言資料集本地化語音模型。
計算機視覺 一流的視覺訓練數據
生成式人工智能使用我們的優質訓練資料為您的 Gen AI 提供動力。
現成的數據目錄和許可
醫療數據集黃金標準,去識別化數據
醫生聽寫數據集
轉錄病歷
電子健康記錄 (EHR)
CT 掃描圖像數據集
X 射線圖像數據集
查看全部
計算機視覺數據集用於機器學習的圖像和視訊數據
銀行對賬單數據集
損壞的汽車圖像數據集
面部識別數據集
地標圖像數據集
工資單數據集
語音/音頻數據集以 65 多種語言轉錄和註釋資料。
紐約英語
中文繁體
西班牙語(墨西哥)
加拿大法語
阿拉伯語
TTS
醒來的話
呼叫中心
腳本獨白
一般對話
Podcast
自發性對話
自發IVR
歌唱音頻
解決方案
行業
醫療保健 將複雜的數據轉化為可行的洞見。
技術 利用精準數據推動科技發展
電子商務 提高轉換率、訂單價值和收入
使用案例
生物特徵數據 高品質生物特徵資料集
人臉辨識簽到 透過臉部標誌自動偵測臉部
圖像標註服務 透過影像註解增強人工智慧
印度語數據 預先標記的印度語語音資料集
內容審核服務 提升人工智慧信任度和品牌聲譽
醫療數據標註 從非結構化資料中擷取實體
存取高品質的綜合銀行對帳單、支票和薪資資料集,以進行準確的 AI/ML 模型訓練
合成銀行支票
用例: 光學字元辨識
格式: 。JPG
計數: 2023
註解: 沒有
描述: 銀行支票資料集(Document AI):合成銀行支票由人工產生的支票影像組成,旨在複製真實支票的外觀和內容。它包括各種元素,例如收款人姓名、金額、日期、簽名和支票號碼。此資料集用於訓練和評估文件 AI 系統的光學字元辨識 (OCR)、支票處理和自動資料擷取等任務,為模型開發提供受控環境,而無需擔心真實支票的隱私問題。
錄音條件: - 單擊的圖像 - 掃描的 - 網絡抓取工具
合成銀行對賬單
格式: .jpg, PNG
計數: 5366
描述: 銀行對帳單資料集(Document AI):合成銀行對帳單包括人工產生的銀行對帳單,旨在模擬真實的財務文件。它具有各種交易記錄、日期、金額和帳戶詳細信息,其結構反映了現實世界的格式和內容。此資料集用於訓練和評估文件人工智慧系統的光學字元辨識(OCR)、資料擷取和文件分析等任務,提供一個不受實際財務資料隱私問題影響的受控環境。
錄音條件: - 已掃描 - Bank_Statement - Web 抓取工具
邊框+文本
格式: 圖片
計數: 6k
註解: 可以
描述: 中國票據資料集包括各種類型票據的圖像或文字樣本,例如用中文書寫的發票、收據和報表。它具有多種格式和內容,包括項目描述、金額和日期。此資料集用於光學字元辨識 (OCR)、財務文件處理和自動資料擷取等任務。
計數: 2010
描述: 薪資資料集(Document AI):合成薪資單由人工產生的薪資影像組成,沒有任何註釋。它具有各種工資單格式和詳細信息,例如員工姓名、工資和日期,用於在 OCR 和文件處理等任務中培訓和測試文件 AI 系統。
錄音條件: - 已掃描 - 網頁抓取
用例: 文檔 AI
格式: HEIC(圖像)和 .mov(視頻)
計數: 23930
描述: 日語、韓語和俄語的帶有手寫文本的實時照片
錄音設備: iPhone 和 iPad 相機
錄音條件: - 強光/眩光 - 相機閃光燈開啟 - 彩色光 - 弱光,無相機閃光燈 - 正常