用於醫療保健領域高階人工智慧/機器學習應用的DICOM醫學影像資料集

匿名化 DICOM影像資料集 保留元資料(以及可選的放射學研究報告),以加速模型訓練、驗證和臨床研究。

Dicom圖像資料集

插入您今天缺少的數據源

專為現實世界人工智慧而建構的DICOM影像數據

Shaip 提供人工智慧就緒型產品 DICOM醫學影像資料集 旨在幫助醫療保健 AI 團隊建立、訓練和驗證強大的診斷、分流和決策支援模型——使用保留臨床價值的去識別化資料。

資料集快照

  • 研究總數:10M +
  • 排名靠前的地區(依研究): 美國、巴西和印度
  • 所代表的模態: CR、CT、US、DX、MR、MG、OT、RF、NM、乳房X光攝影
  • 所代表的身體部位: 胸部、腹部、頭部、脊椎、頸部、心臟等等
DICOM影像數據

DICOM影像資料集的常見應用案例

訓練診斷成像人工智慧模型

訓練診斷成像人工智慧模型

  • 異常檢測
  • 疾病分類
  • 嚴重程度評分/分期
  • 分流優先級
  • 支援多模態開發
驗證和評估模型性能

驗證和評估模型性能

  • 在更廣泛的人群中評估模型準確性
  • 按模式/身體部位劃分的基準性能
  • 運行外部驗證以減少過擬合
提高模型在設備和站點上的穩健性

提高模型在設備和站點上的穩健性

  • 跨掃描器/供應商的測試通用性
  • 減少部署到新醫院時的性能下降
建構多模態人工智慧(影像+放射學報告)

建構多模態人工智慧(影像+放射學報告)

  • 從報告語言匯出弱標籤
  • 與報告敘述相符的訓練模型
  • 建立基於報告的分類和決策支援系統
臨床研究和隊列創建

臨床研究和隊列創建

  • 按方式/身體部位/時間篩選隊列
  • 支持回顧性研究
  • 在保持隱私控制的同時加快假設檢定速度
機器學習訓練的標註和真實標籤創建

機器學習訓練的標註和真實標籤創建

  • 分類標籤
  • 邊界框
  • 分割遮罩

您在 DICOM 影像資料集中收到的內容

1. DICOM像素資料(影像)

所有影像均已在像素層級進行匿名化處理:

  • 圖像上的文字已被塗黑或匿名化。
  • 當可以進行臉部重建時(例如,高解析度 CT),可能會引入“去容”偽影。

3. 研究報告(可選,如有)

由放射科醫生/醫生撰寫的非結構化敘述文本,採用安全港匿名化和相同的日期偏移方法。

2. DICOM 元資料(含安全港協定)

所有標準 DICOM 元資料保留以供交付,同時 HIPAA 安全港識別碼將被匿名化,包括:

  • 患者姓名已替換為患者 ID
  • 患者ID經加密哈希處理
  • 機構名稱已替換為別名
  • 日期在 365 天內發生變化(患者層面的一致性變化)。

4. 自訂元資料(可選增值功能)

可選的派生元資料可以包括:

  • 解析後的患者年齡
  • SNOMED標籤(來自報表)
  • 正面實體(來自報告)
  • 居住國家(地址所在國家)
  • 推斷種族/推斷族裔(衍生字段)

1. DICOM像素資料(影像)

所有影像均已在像素層級進行匿名化處理:

  • 圖像上的文字已被塗黑或匿名化。
  • 當可以進行臉部重建時(例如,高解析度 CT),可能會引入“去容”偽影。

2. DICOM 元資料(含安全港協定)

所有標準 DICOM 元資料保留以供交付,同時 HIPAA 安全港識別碼將被匿名化,包括:

  • 患者姓名已替換為患者 ID
  • 患者ID經加密哈希處理
  • 機構名稱已替換為別名
  • 日期在 365 天內發生變化(患者層面的一致性變化)。

3. 研究報告(可選,如有)

由放射科醫生/醫生撰寫的非結構化敘述文本,採用安全港匿名化和相同的日期偏移方法。

4. 自訂元資料(可選增值功能)

可選的派生元資料可以包括:

  • 解析後的患者年齡
  • SNOMED標籤(來自報表)
  • 正面實體(來自報告)
  • 居住國家(地址所在國家)
  • 推斷種族/推斷族裔(衍生字段)

以隱私為先的DICOM去識別化方法

該資料集採用加密哈希和假名化技術,在遵守 HIPAA 法規的同時,保留臨床實用性並保護敏感資料。

像素級保護

必要時將烙印文字進行塗改/匿名化處理及污損處理。

元資料保護

安全港識別碼已匿名化,而標準 DICOM 元資料得以保留。

日期轉換

為了維持研究間的時間關係,日期在 365 天的範圍內,以患者為單位進行調整。

人口基數

某些欄位的值被限制/下限,以降低重新識別的風險(例如,年齡、體重、尺寸和一些種族值)。

賽普聯絡我們

不能找到你想要的?

正在收集所有數據類型的新的現成醫療數據集 

立即聯繫我們,免除您的醫療培訓數據收集後顧之憂

  • 通過註冊,我同意 Shaip 隱私政策 服務條款 並同意接受來自 Shaip 的 B2B 營銷傳播。

DICOM 影像資料集是以 DICOM 標準儲存的醫學影像研究集合,包括像素資料和臨床元數據,通常用於訓練和驗證醫療保健 AI 模型。

根據許可範圍,它可以包括 DICOM 像素資料、保留的(去識別化的)DICOM 元資料、可選的研究報告和可選的增值自訂元資料。

是的。影像會在像素層級進行匿名化處理,包括將影像上的文字進行編輯/匿名化,並在必要時進行影像去污處理。

標準 DICOM 元資料在傳輸過程中得以保留,而 HIPAA 安全港識別碼則被匿名化(例如,病患/機構識別碼和日期)。

日期可以在 365 天內進行調整,在患者層面保持一致,以保持各研究之間的相對時間。

如果研究報告(非結構化敘述文本)可用且獲得許可,則可以將其納入研究報告,但標識符需進行匿名化處理。

選項可以包括解析後的病患年齡、SNOMED 標籤、陽性實體、居住國家/地區和其他衍生欄位。

是的—分享您的目標範圍和篩選條件,Shaip 將根據可用性提出最合適的資料集切片。

請透過「聯絡我們」表單提交您的需求。我們的團隊將確認產品可用性、範圍、授權條款和交付方式。