計算機視覺

22+ 最受歡迎的計算機視覺開源數據集

人工智能算法的好壞取決於你提供給它的數據。

這既不是一個大膽的聲明,也不是一個非常規的聲明。 幾十年前,人工智能似乎有些牽強,但從那時起,人工智能和機器學習已經走了很長一段路。

計算機視覺 幫助計算機理解和解釋標籤和圖像。 當您使用正確類型的圖像訓練您的計算機時,它可以獲得檢測、理解和識別各種面部特徵、檢測疾病、駕駛自動駕駛汽車以及使用多維器官掃描挽救生命的能力。

計算機視覺市場預計將達到 $ 144.46十億 從 2028 年的 7.04 億美元到 2020 年,45.64 年至 2021 年間的複合年增長率為 2028%。

計算機視覺的一些用例是:

  • 醫學影像
  • 自動駕駛汽車
  • 面部和物體識別
  • 缺陷識別
  • 場景檢測

圖像數據集 你正在餵養和訓練你的機器學習和計算機視覺任務對於你的人工智能項目的成功至關重要。 很難獲得高質量的數據集。 根據項目的複雜性,可能需要幾天到幾週的時間才能獲得用於計算機視覺目的的可靠且相關的數據集。

在這裡,我們為您提供了一系列(為方便起見進行了分類)您可以立即使用的開源數據集。

計算機視覺數據集綜合列表

一般:

  1. 影像網 (鏈接)

    ImageNet 是一個廣泛使用的數據集,它包含驚人的 1.2 萬張圖像,分為 1000 個類別。 該數據集按照 WorldNet 層次結構進行組織,並分為三部分——訓練數據、圖像標籤和驗證數據。

  2. 動力學700 (鏈接)

    Kinetics 700 是一個巨大的高質量數據集,包含 650,000 個不同的人類動作類別的 700 多個剪輯。 每個集體訴訟都有大約 700 個視頻剪輯。 數據集中的剪輯具有人與對象和人與人的交互,這在識別視頻中的人類行為時被證明是非常有用的。

  3. CIFAR-10 (鏈接)

    CIFAR 10 是最大的計算機視覺數據集之一,擁有代表十個不同類別的 60000 張 32 x 32 彩色圖像。 每個類有大約 6000 張圖像用於訓練計算機視覺算法和機器學習。

面部識別:

面部識別

  1. 野外標記的面孔 (鏈接)

    Labeled Faced in the Wild 是一個龐大的數據集,包含從互聯網檢測到的近 13,230 人的 5,750 多張圖像。 這個人臉數據集旨在使研究不受約束的人臉檢測變得更容易。

  2. CASIA 網頁界面 (鏈接)

    CASIA Web face 是一個精心設計的數據集,有助於機器學習和科學研究無約束的面部識別。 它擁有近 494,000 個真實身份的 10,000 多張圖像,是人臉識別和驗證任務的理想選擇。

  3. UMD 人臉數據集 (鏈接)

    UMD 面對一個註釋良好的數據集,該數據集包含兩部分——靜止圖像和視頻幀。 該數據集有超過 367,800 個面部註釋和 3.7 萬個帶註釋的主題視頻幀。

手寫識別:

  1. MNIST 數據庫 (鏈接)

    MNIST 是一個包含 0 到 9 的手寫數字樣本的數據庫,它有 60,000 和 10,000 個訓練和測試圖像。 MNIST 於 1999 年發布,使得在深度學習中測試圖像處理系統變得更加容易。

  2. 人工字符數據集 (鏈接)

    顧名思義,人工字符數據集是人工生成的數據,以十個大寫字母描述英語語言結構。 它帶有超過 6000 張圖像。

讓我們今天討論一下您的 AI 訓練數據需求。

對象檢測:

  1. 可可女士 (鏈接)

    MS COCO 或 Common Objects in Context 是一個對象檢測和字幕數據集。

    它擁有超過 328,000 張具有關鍵點檢測、多對象檢測、字幕和分割掩碼註釋的圖像。 它帶有 80 個對像類別和每個圖像五個標題。

  2. 龍生(鏈接)

    LSUN 是大規模場景理解的縮寫,在 20 個對象和 10 個場景類別中擁有超過一百萬個標記圖像。 一些類別有接近 300,000 張圖像,其中 300 張圖像專門用於驗證,1000 張圖像用於測試數據。

  3. 家庭物品(鏈接)

    Home Objects 數據集包含來自房子周圍(廚房、客廳和浴室)的隨機對象的註釋圖像。 該數據集還包含一些帶註釋的視頻和 398 張用於測試的未註釋照片。

汽車:

  1. 城市景觀數據集 (鏈接)

    Cityscape 是查找從幾個城市的街景中記錄的各種視頻序列時要使用的數據集。 這些圖像是在不同的天氣和光照條件下長時間拍攝的。 註釋適用於 30 類圖像,分為 XNUMX 個不同類別。

  2. 巴克利深驅動 (鏈接)

    Barkley DeepDrive 專為自動駕駛車輛訓練而設計,擁有超過 100 萬個帶註釋的視頻序列。 根據不斷變化的道路和駕駛條件,它是自動駕駛汽車最有用的訓練數據之一。

  3. 馬普利亞 (鏈接)

    Mapillary 在全球擁有超過 750 億個街景和交通標誌,這對於訓練機器學習和 AI 算法中的視覺感知模型非常有用。 它允許您開發滿足各種照明和天氣條件和觀點的自​​動駕駛汽車。

醫學影像:

  1. Covid-19 開放研究數據集 (鏈接)

    這個原始數據集有大約 6500 個關於 AP/PA 胸部 X 射線的像素多邊形肺分割。 此外,還提供了 517 張 Covid-19 患者 X 光片的圖像,其標籤包含姓名、位置、入院細節、結果等。

  2. 100,000 次胸部 X 光片的 NIH 數據庫 (鏈接)

    NIH 數據庫是最廣泛的公開可用數據集之一,其中包含 100,000 張胸部 X 光圖像和對科學和研究界有用的相關數據。 它甚至有晚期肺部疾病患者的圖像。

  3. 數字病理學地圖集 (鏈接)

    Atlas of Digital Pathology 提供了多個組織病理學補丁圖像,總共超過 17,000 個,來自近 100 個不同器官的註釋幻燈片。 該數據集可用於開發計算機視覺和模式識別軟件。

場景識別:

場景識別

  1. 室內場景識別 (鏈接)

    Indoor Scene Recognition 是一個高度分類的數據集,包含近 15620 張物體和室內風景圖像,可用於機器學習和數據訓練。 它有超過 65 個類別,每個類別至少有 100 張圖像。

  2. x視圖 (鏈接)

    作為最著名的公開數據集之一,xView 包含來自各種複雜和大型場景的大量帶註釋的俯視圖像。 該數據集擁有大約 60 個類和超過一百萬個對象實例,其目的是使用衛星圖像提供更好的救災服務。

  3. 場所 (鏈接)

    麻省理工學院提供的數據集 Places 擁有來自 1.8 個不同場景類別的超過 365 萬張圖像。 每個類別中大約有 50 張圖像用於驗證,900 張圖像用於測試。 學習深度場景特徵以建立場景識別或視覺識別任務是可能的。

娛樂:

  1. IMDB WIKI 數據集 (鏈接)

    IMDB – Wiki 是最受歡迎的公共面孔數據庫之一,其中包含充分標記年齡、性別和姓名的面孔。 它還擁有大約 20 萬張名人面孔和 62 萬張來自維基百科的面孔。

  2. 名人面孔 (鏈接)

    Celeb Faces 是一個大型數據庫,包含 200,000 張帶註釋的名人圖像。 這些圖像帶有背景噪聲和姿勢變化,這使得它們對於訓練計算機視覺任務中的測試集很有價值。 這對於在面部識別、編輯、面部局部定位等方面實現更高的準確性非常有益。

現在您擁有大量開源圖像數據集來為您的人工智能機器提供動力。 您的 AI 和機器學習模型的結果主要取決於您提供和訓練它們的數據集的質量。 如果您希望您的 AI 模型做出準確的預測,它需要經過聚合、標記和標記的高質量數據集。 為了擴大您的計算機視覺系統的成功,您必須使用與您的項目願景相關的高質量圖像數據庫。 如果您正在尋找更多這樣的數據集 了解方案

社交分享

你也許也喜歡