随着大数据时代的到来和计算机技术及设备的进步,深度学习尤其是深度卷积神经网络(convolutional neural network,CNN)在医学影像领域成为研究热点,在皮肤病影像领域也取得引人瞩目的进展。
为了评估 CNN 对皮肤疾病影像的分类能力,北京协和医院刘洁教授团队与北京航空航天大学宇航学院图像处理中心合作,以色素痣和脂溢性角化病为例,比较 CNN 与皮肤科医师诊断的准确率,并对 CNN 错误分类的皮肤镜图像进行分析,为未来研发能准确、有效识别在体皮肤病的智能诊断系统打下基础。
【关键词】痣,色素; 角化病,脂溢性; 皮肤镜检查; 神经网络(计算机); 人工智能; 深度卷积神经网络
研究团队
使用 5 094 幅色素痣和脂溢性角化病(SK)的皮肤镜图像对 CNN 网络 ResNet-50 通过迁移学习进行训练,建立 CNN 二分类模型,并应用该模型对 30 幅色素痣和 30 幅 SK 的皮肤镜图像进行自动分类。
同时,95 位经过皮肤镜培训的有经验的皮肤科医师结合临床皮损图片对上述 CNN 自动分类的 60 幅皮肤镜图像进行判读。比较二者的诊断准确率,并对错误分类的图像做进一步统计分析。
结果显示,CNN 自动分类模型对色素痣和 SK 的皮肤镜图像的分类准确率分别为 100%(30/30)和 76.67%(23/30),总准确率为 88.33%(53/60);95 位皮肤科医师的诊断准确率平均值分别为 82.98%(25.8/30)和 85.96%(24.9/30),总准确率为 84.47%(50.7/60)。
CNN 自动分类模型与 95 位皮肤科医师对色素痣和 SK 的诊断准确率差异无统计学意义(χ2 = 0.38,P > 0.05)。CNN 错误分类的皮肤镜图像被分为 3 类,即特殊类型(如皮损色素含量多、角化明显),具有典型特征但存在干扰因素,具有典型特征尚找不到错误分类的原因。
图 深度卷积神经网络错误诊断皮肤镜图像
1A:特殊类型,色素含量较多、角化明显,皮肤镜下特征显示不清晰; 1B:具有典型特征,但存在毛发干扰; 1C:具有典型特征,但因光线、角度等影响其特征不易识别; 1D:具有典型特征,尚找不到错误分类原因
综上,CNN 自动分类模型在色素痣和 SK 皮肤镜图像的二分类任务中的表现与有经验的皮肤科医师水平相当。CNN 错误分类的原因仍需皮肤科医师与人工智能专业人员共同探索。