用於醫療保健領域高階人工智慧/機器學習應用的DICOM醫學影像資料集
匿名化 DICOM影像資料集 保留元資料(以及可選的放射學研究報告),以加速模型訓練、驗證和臨床研究。
插入您今天缺少的數據源
專為現實世界人工智慧而建構的DICOM影像數據
Shaip 提供人工智慧就緒型產品 DICOM醫學影像資料集 旨在幫助醫療保健 AI 團隊建立、訓練和驗證強大的診斷、分流和決策支援模型——使用保留臨床價值的去識別化資料。
資料集快照
- 研究總數:10M +
- 排名靠前的地區(依研究): 美國、巴西和印度
- 所代表的模態: CR、CT、US、DX、MR、MG、OT、RF、NM、乳房X光攝影
- 所代表的身體部位: 胸部、腹部、頭部、脊椎、頸部、心臟等等
DICOM影像資料集的常見應用案例
訓練診斷成像人工智慧模型
- 異常檢測
- 疾病分類
- 嚴重程度評分/分期
- 分流優先級
- 支援多模態開發
驗證和評估模型性能
- 在更廣泛的人群中評估模型準確性
- 按模式/身體部位劃分的基準性能
- 運行外部驗證以減少過擬合
提高模型在設備和站點上的穩健性
- 跨掃描器/供應商的測試通用性
- 減少部署到新醫院時的性能下降
建構多模態人工智慧(影像+放射學報告)
- 從報告語言匯出弱標籤
- 與報告敘述相符的訓練模型
- 建立基於報告的分類和決策支援系統
臨床研究和隊列創建
- 按方式/身體部位/時間篩選隊列
- 支持回顧性研究
- 在保持隱私控制的同時加快假設檢定速度
機器學習訓練的標註和真實標籤創建
- 分類標籤
- 邊界框
- 分割遮罩
您在 DICOM 影像資料集中收到的內容
1. DICOM像素資料(影像)
所有影像均已在像素層級進行匿名化處理:
- 圖像上的文字已被塗黑或匿名化。
- 當可以進行臉部重建時(例如,高解析度 CT),可能會引入“去容”偽影。
3. 研究報告(可選,如有)
由放射科醫生/醫生撰寫的非結構化敘述文本,採用安全港匿名化和相同的日期偏移方法。
2. DICOM 元資料(含安全港協定)
所有標準 DICOM 元資料保留以供交付,同時 HIPAA 安全港識別碼將被匿名化,包括:
- 患者姓名已替換為患者 ID
- 患者ID經加密哈希處理
- 機構名稱已替換為別名
- 日期在 365 天內發生變化(患者層面的一致性變化)。
4. 自訂元資料(可選增值功能)
可選的派生元資料可以包括:
- 解析後的患者年齡
- SNOMED標籤(來自報表)
- 正面實體(來自報告)
- 居住國家(地址所在國家)
- 推斷種族/推斷族裔(衍生字段)
1. DICOM像素資料(影像)
所有影像均已在像素層級進行匿名化處理:
- 圖像上的文字已被塗黑或匿名化。
- 當可以進行臉部重建時(例如,高解析度 CT),可能會引入“去容”偽影。
2. DICOM 元資料(含安全港協定)
所有標準 DICOM 元資料保留以供交付,同時 HIPAA 安全港識別碼將被匿名化,包括:
- 患者姓名已替換為患者 ID
- 患者ID經加密哈希處理
- 機構名稱已替換為別名
- 日期在 365 天內發生變化(患者層面的一致性變化)。
3. 研究報告(可選,如有)
由放射科醫生/醫生撰寫的非結構化敘述文本,採用安全港匿名化和相同的日期偏移方法。
4. 自訂元資料(可選增值功能)
可選的派生元資料可以包括:
- 解析後的患者年齡
- SNOMED標籤(來自報表)
- 正面實體(來自報告)
- 居住國家(地址所在國家)
- 推斷種族/推斷族裔(衍生字段)
以隱私為先的DICOM去識別化方法
該資料集採用加密哈希和假名化技術,在遵守 HIPAA 法規的同時,保留臨床實用性並保護敏感資料。
像素級保護
必要時將烙印文字進行塗改/匿名化處理及污損處理。
元資料保護
安全港識別碼已匿名化,而標準 DICOM 元資料得以保留。
日期轉換
為了維持研究間的時間關係,日期在 365 天的範圍內,以患者為單位進行調整。
人口基數
某些欄位的值被限制/下限,以降低重新識別的風險(例如,年齡、體重、尺寸和一些種族值)。
不能找到你想要的?
正在收集所有數據類型的新的現成醫療數據集
立即聯繫我們,免除您的醫療培訓數據收集後顧之憂
常見問題
1. 什麼是 DICOM 影像資料集?
DICOM 影像資料集是以 DICOM 標準儲存的醫學影像研究集合,包括像素資料和臨床元數據,通常用於訓練和驗證醫療保健 AI 模型。
2. 此 DICOM 影像資料集包含哪些內容?
根據許可範圍,它可以包括 DICOM 像素資料、保留的(去識別化的)DICOM 元資料、可選的研究報告和可選的增值自訂元資料。
3. 這些影像是否已匿名化?
是的。影像會在像素層級進行匿名化處理,包括將影像上的文字進行編輯/匿名化,並在必要時進行影像去污處理。
4. DICOM 元資料是否保留?
標準 DICOM 元資料在傳輸過程中得以保留,而 HIPAA 安全港識別碼則被匿名化(例如,病患/機構識別碼和日期)。
5. 日期是如何處理的?
日期可以在 365 天內進行調整,在患者層面保持一致,以保持各研究之間的相對時間。
6. 是否包含放射線學/研究報告?
如果研究報告(非結構化敘述文本)可用且獲得許可,則可以將其納入研究報告,但標識符需進行匿名化處理。
7. 可以使用哪些自訂元資料?
選項可以包括解析後的病患年齡、SNOMED 標籤、陽性實體、居住國家/地區和其他衍生欄位。
8. 我可以指定特定族群(治療方式、身體部位、地理位置等)嗎?
是的—分享您的目標範圍和篩選條件,Shaip 將根據可用性提出最合適的資料集切片。
9. 我如何獲得資料集的許可?
請透過「聯絡我們」表單提交您的需求。我們的團隊將確認產品可用性、範圍、授權條款和交付方式。