開放數據集

發現可幫助您訓練 ML 模型的開源數據集

開放資料集

幫助您開始使用 AI/ML 模型的開源數據集

您的 AI 和 ML 模型的輸出與您用來訓練它的數據一樣好 - 因此您應用於數據聚合以及標記和識別該數據的精度非常重要!

因此,如果您想開始一項新的 AI/ML 計劃,現在您很快就會意識到,尋找高質量的訓練數據將是您項目中更具挑戰性的方面之一,因為高質量的數據集是保持 AI/機器學習引擎正在運行。 我們積累了一份開放數據集列表,可以免費使用和訓練您未來的 AI/ML 模型。

專業化 數據類型 數據集名稱 行業/部門 註釋/用例 Link
+NLP 文本 亞馬遜評論 電子商務 情緒分析 Link
+NLP 文本 維基百科鏈接數據 一般說明 Link
+NLP 文本 斯坦福情緒樹庫 零售與娛樂空間 情緒分析 Link
+NLP 文本 Twitter 美國航空公司情緒 航空公司 情緒分析 Link
+CV 圖片 圖片網 一般說明 Link
+CV 圖片 谷歌的開放圖片 一般說明 Link
+NLP 文本 康乃爾電影對白 零售與娛樂空間 對話框 Link
+NLP 文本 馬可女士 一般說明 問題回答 Link
+NLP 文本 自然問題資料集 一般說明 問題回答 Link
+NLP 文本 資料庫百科 一般說明 知識圖 Link
+NLP 文本 雅戈 一般說明 知識圖 Link
+NLP 文本 遊離鹼 一般說明 知識圖 Link
+NLP 文本 本體筆記 一般說明 語意角色標籤 Link
+CV 圖片 COCO 一般說明 物體檢測 Link
+CV 圖片 帕斯卡VOC 一般說明 物體檢測 Link
+CV 圖片 風情 自動駕駛 語義分割 Link
+CV 圖片 MNIST 一般說明 數字分類 Link
+CV 圖片 時尚-MNIST 零售空間 影像分類 Link
+NLP 音頻 圖書館演講 一般說明 ASR Link
+NLP 音頻 TED-LIUM 一般說明 ASR Link
+NLP 音頻 時間 一般說明 音素識別 Link
+NLP 音頻 共同的聲音 一般說明 ASR Link
+NLP 音頻 名人之聲 一般說明 說話人識別 Link
+NLP 文本 維基百科垃圾場 一般說明 語言建模 Link
+NLP 文本 千兆字 新聞中心 語言建模 Link
+NLP 文本 IMDB評論 零售與娛樂空間 情緒分析 Link
+CV 視頻資料 動力學-700 一般說明 動作辨識 Link
+CV 視頻資料 UCF101 一般說明 動作辨識 Link
+CV 視頻資料 HMDB51 一般說明 動作辨識 Link
+CV 圖片 CASIA-WebFace 一般說明 人臉識別 Link
+NLP 文本 一般說明 閱讀理解 Link
+NLP 文本 多網路邏輯 一般說明 自然語言推理 Link
+NLP 文本 SNLI 一般說明 自然語言推理 Link
+CV 圖片 牛津花卉 102 植物學 細粒度分類 Link
+CV 圖片 CIFAR-10 一般說明 影像分類 Link
+CV 圖片 CIFAR-100 一般說明 影像分類 Link
+CV 圖片 VOC人員佈局 一般說明 姿勢估計 Link
+CV 圖片 MPII 人體姿勢 一般說明 姿勢估計 Link
+NLP 文本 20 個新聞群組 一般說明 文字分類 Link