案例研究:內容審核

30K+ 文檔 web 報廢和註釋內容審核
內容審核 - 橫幅
人們對人工智慧內容審核的需求日益增長,力求確保我們連接和交流的線上空間的安全。

隨著社群媒體使用量的不斷增長,網路霸凌問題已成為平台努力確保網路空間安全的一大障礙。令人震驚的是,38% 的個人每天都會遇到這種有害行為,這凸顯了對創新內容審核方法的迫切需求。如今,各組織都依賴人工智慧來主動解決網路霸凌這一長期存在的問題。

網絡安全:

Facebook 第四季度社區標準執行報告披露——對 4 萬條欺凌和騷擾內容採取行動,主動檢測率為 6.3%

教育程度:

2021 研究發現 36.5%美國 % 的學生年齡介於 12和17 年在他們上學期間曾經歷過網絡欺凌。

根據 2020 年的一份報告,4.07 年全球內容審核解決方案市場價值 2019 億美元,預計到 11.94 年將達到 2027 億美元,複合年增長率為 14.7%。

真實世界的解決方案

調節全球對話的數據

客戶正在為其雲端產品開發一個強大的自動內容審核機器學習模型,為此他們正在尋找能夠為他們提供準確訓練資料的特定領域供應商。

利用我們在自然語言處理 (NLP) 方面的廣泛知識,我們協助客戶收集、分類和註釋了 30,000 多份英語和西班牙語文檔,以構建自動內容審核機器學習模型,分為有毒、成人或色情內容類別。

現實世界的解決方案

問題

  • 從優先域中抓取 30,000 份西班牙語和英語文檔
  • 將收集到的內容分為短、中、長段
  • 將編譯後的數據標記為有毒、成人或露骨色情內容
  • 確保高質量的註釋,準確率至少為 90%。

解決方案

  • Web 從 BFSI、醫療保健、製造、零售中分別收集了 30,000 份西班牙語和英語文檔。 內容進一步分為短、中、長文檔 
  • 成功將分類內容標記為有毒、成人或露骨色情內容
  • 為了達到 90% 的質量,Shaip 實施了兩層質量控制流程:
    » 級別 1:質量保證檢查:100% 的文件進行驗證。
    » 級別 2:關鍵質量分析檢查:Shaips 的 CQA 團隊評估 15%-20% 的回顧性樣本。

結果

培訓數據有助於構建自動化內容審核 ML 模型,該模型可以產生多種有益於維護更安全的在線環境的結果。 一些主要成果包括:

  • 處理大量數據的效率
  • 確保統一執行適度政策的一致性
  • 適應不斷增長的用戶群和內容量的可擴展性
  • 實時審核可以識別和
    刪除生成的潛在有害內容
  • 通過減少對人類主持人的依賴來提高成本效益

將您的對話式 AI 應用程式開發速度提高 100%

告訴我們我們如何為您的下一個 AI 計劃提供幫助。