1引言
1.1图像检索研究背景
在过去的近20年来,基于内容的视觉信息的检索(Content Based Visual ImageRetrieval, CBVIR)或基于内容的图像检索(Content Based Image Retrieval,CBIR)一直是计算机视觉领域的最热门的研究方向。随着互联网和多媒体技术的快速发展,视频图像呈现爆炸性的增长趋势,大容量存储设备和数字设备的普及,出现了许多海量存储数据库系统,这些存储系统将许多数据,如声音、图像以及视频等保存数据库系统中,使现代社会拥有了以往非常丰富的信息资源。然而,大部分的数据库系统并不能够对这些数据信息进行有效和高效的管理和运用,无法在需要时快读的找到相关数据信息,大量的信息淹没在数据库中。因此,如何快速、精准的从大量图像中查询到与之相关的图像成为当前研究重点之一。传统的检索技术大多是基于文本的精确匹配检索模式,检索前先用关键字对数据库中所有的图像进行有效的说明、标注,查询时根据查询图像的关键字查找相关图像。
这种方法在小数据量的图像库中进行检索是比较直接和有效的,但是随着数据库的爆炸性的增长,在很多大型数据库中使用传统的基于文本的检索越来越不能适应图像检索发展的要求。这种检索技术不仅费时费力,带有很强的主观性,而且有时用几个关键字也很难反映图像中丰富的视觉内容。为了克服传统基于文本的图像检索技术的缺陷,有效的管理和查询图像,人们幵始致力于一种新的图像检索技术的研究,基于内容的图像检索技术(Content Based ImageRetrieval, CBIR)应运而生。在CBIR系统中,使用各种图像处理技术,提取图像中的灰度、纹理、形状等一系列底层视觉特征组成高维特征向量,通过相似性度量实现目标图像的检索。但图像底层视觉特征和高层语义概念间存在巨大差距,同时用户感知的主观性与图像内容的多样性等问题也难以解决,这是图像检索研究领域目前最大的问题。CBIR的迅速发展必将推动特征提取、相关反馈、图像相似性度量以及数据库等与其相关的众多领域的技术的发展。它在医学领域的成功应用将会对临床诊断、治疗研究、医学交流以及医学教育等方面产生重大而深远的影响。所以如何利用CBIR技术和医学知识的结合来实现疾病诊断的智能化是当前医学领域研究的主要难题之
1.2 CBIR在医学领域的研究意义
在医疗领域中,大型医院中每天都会产生大量包含病人病变特征和解剖信息的医学图像,日内瓦大学附属医院放射科在2009年每天都会生产超过114000副影像,而对应2002年每天只能生产12000幅。一些医院管理机构比如Kaiser Permanente截止2009年已经储存了越700TB的影像数据⑴,还有一些大医院比如维也纳大学医院每天都能产生100GB医学影像,从这些医学影像中,医生可以很好总结出许多病变的规律,病变表现,是医生进行计算机辅助病情诊断CT(Computed Tomography),即电子计算机X射线断层扫描技术,它根据人体不同组织对X射线的吸收和通过率不同的缘故,利用精确准直的X射线束与灵敏度极高的探测器一同围绕人体的某一部位作一个接一个的断面扫描,每次扫描过程中由探测器接收穿过人体后的衰减X线信息,再由快速模/数(A/D)转换器将模拟量转换成数字量,然后输入电子计算机,经电子计算机高速计算,得出该层面各点的X线吸收系数值,用这些数据组成图像的矩阵。再经图像显示器将不同的数据用不同的灰度等级显示出来,这样该断面的解剖结构就可以清晰的显示在监视器上,也可利用多幅相机或激光相机把图像记录在照片上。肺部CT断层图像可以看成是将肺按照一定的层厚切成很多切片,每个切片形成一张CT图像。对人体被检查部位的断层或立体图像仔细观察,可以发现任何部位的细小病变。肺部癌症图像数据库联盟(Lung Imaging Database Consortium,LIDC)是美国癌症研究协会(National Cancer Institute,NCI)建立的一个肺部CT图像数据库,用于开发、研究和评价利用螺旋CT进行肺癌评估和诊断的计算机辅助诊断的方法。在该数据库的基础上,不同的研究者可以对比肺癌计算机辅助评估和诊断性能及其临床应用诊断价值,目前它的使用越来越广泛。目前LIDC数据库已完备,包括1010个病例的100多万张全肺CT图像(扫描层厚度1.25mm-3mm, 512像素*512像素)。每个病例包含一个文件夹,文件夹中包括100张~200张DICOM格式的全肺CT断层图像以及一个作为“金标准”的包含四名医疗专家诊断结果的XML格式标注文件。在注释文件中给出了四名医疗专家对每张CT片中出现的结节的注解,包括肺结节的主要病变特征,结节的位置,边缘轮廓等。
2.1 XML标注文件信息
XML即可扩展标记语言(Extensible Markup Language),是一种平台无关的表示数据的方法。简单地说,使用XML创建的数据可以被任何应用程序在任何平台上读取。甚至可以通过手动编码来编辑和创建XML文档。一方面,XML是被设计用来存储数据和交换的。XML看起来与HTML语言是很像的,都用标签、属性和值来完成,但XML不是用来显示信息的,而是用来存储和携带信息的。另一方面,XML可被容易地扩展和改编。你用XML来设计你自己的自定义标记语言,然后你用这些语言来描述你的信息。任何系统都可以通过XML解析器来读取XML数据,因此它的数据可以通行各处,而不用担心系统不支持的问题。XML语法简单,可以被所有的机器解读,又可以在各种平台上使用,使得XML有潜力成为一个通行四海皆可的标记
2.2医学mCOM标准简介
DICOM(Digital Imaging and Communication in Medicine)标准最初是由 ACR (the American College of Radiology)及NEMA(the National Electrical Manufacturers Association)于1983年组成的联合委员会起草,以后陆续发展成为医疗数字影像及相关信息的传输标准。DICOM标准指明了不同厂商需实现的硬件的接口,最小的软件命令集和数据格式的一致性集。DICOM标准的推出与实现,大大简化了医学影像信息交换的实现,推动了远程医疗系统、图像管理与通信系统(PACS)的研究与发展,由于DICOM的开放性与互联性,使得与其它医学应用系统(HIS、RIS等)的集成成为可能。
1引言……………………1
1.1图像检索研究背景……………………1
1.2 CBIR在医学领域的研究意义……………………1
1.3 CBIR国内外研究现状……………………3
1.4 CBIR医疗领域国内外研究现状……………………4
1.5本文研究背景…………………… 4
1.6本文主要研究内容及组织安排……………………6
2LIDC图像库介绍以及肿瘤ROI区域提取……………………9
2.1 XML标注文件信息……………………9
2.2医学DICOM标准简介……………………17
2.3肿瘤ROI图像提取……………………19
总结
CBIR的主要目标之一是弥合的人类感知和计算机之间的语义差距。由于医学图像的特殊性,以及放射科医生对于医疗影像判读的主观性,比如LIDC数据库中的四个专家标注并不完全一样,图像低层视觉特征和高层语义概念间存在巨大差距。这给CBIR系统应用于医疗领域带来了很大的困难。鉴于肺部肿瘤图像比较难以判读,本文使用LIDC图像库建立了包含876个肺部肿瘤图像(ROI)的实验图像库,针对病变肿瘤图像的特点,提取了包括大小、灰度、纹理、形状等67维的图像特征。然后使用这些图像特征设计了一个基于Adaboost特征选择的医学图像检索系统,系统根据肺部肿瘤图形的恶性程度分类,使用Adaboost算法设计强分类器,检索时用户可以把图像中疑似肿瘤区域标注出来,然后将提取的特征输入强分类器中,先分类,然后根据相似度进行检索。取得了平均0.755的平均准确率。验证了Boosting算法在图像检索系统应用中的可行性和有效性。
实验中也出现许多不足,主要是肿瘤ROI区域图像提取方式有待完善,肿瘤图像预处理不够精确,实验过程中发现专家标注的肿瘤轮廓有一定的主观性而且与真实肿瘤轮廓有误差。图像特征的选取不够完全描述一个肿瘤的详细特征,LIDC数据库为一个三维切片CT图像,每个病例都带有100?200个图像,而每个肿瘤只用中间一片二维图像来表示,没有任何三维特征,就会有很多信息损失。后续我们还将考虑以下几个方面:①针对三维切片CT图像,提取一些三维图像特征,包括三维形状特征,三维灰度分布等,保证图像特征的精确性。②鉴于LIDC数据库“一图多注”的现象,肿瘤边界难以确定,下一步工作可以尝试肿瘤R0I边界自动或半自动提取。
参考文献
[1] Northern, Kaiser Permanente. "Effect of a self-management program on patients with chronic disease." Effective Clinical Practice 4.6 (2001): 256-262
[2] McNitt-Gray, Michael F” et al. "A pattern http://sblunwen.com/yxyxx/classification approach to characterizing solitary pulmonary nodules imaged on high resolution CT: preliminary results.'1 Medical Physics 26 (1999): 880.
[3] McNitt-Gray, M. F.,et al. "The effects of co-occurrence matrix based texture parameters on the classification of solitary pulmonary nodules imaged on computed tomography." Computerized Medical Imaging and Graphics 23.6 (1999): 339-348.
[4] Lo,Shih-Chung B.,et al, "Classification of lung nodules in diagnostic CT: an approach based on 3 D vascular features, nodule density distribution, and shape features." Proceedings of SPIE. Vol. 5032. 2003.
[5] Mtlller,Henning, et al. "Evaluation axes for medical image retrieval systems: the imageCLEF experience." Proceedings of the 13th annual ACM international conference on Multimedia. ACM, 2005.
[6]郭彦铮,岳建华.基于内容的医学图像检索[J].医疗设备信息,2006,21(1):34-36,45.
[7]李殿赞.医学影像数据库的图像检索技术应用研究[D].重庆:重庆大学软件学院,2004.
[8] Tagare,Hemant D.,C. Carl Jaffe,and James Duncan. "Medical image databases content-based retrieval approach.'1 Journal of the American Medical Informatics Association 4.3 (1997): 184-198.
[9] Chu, Wesley W.? Alfonso F. C g rdenas5 and Ricky K. Taira. "KMeD: a knowledge-based multimedia medical distributed database system."Information Systems20.2 (1995): 75-96.
[10] Miiller, Henning, et al. "A reference data set for the evaluation of medical image retrieval systems." Computerized Medical Imaging and Graphics 28.6 (2004): 295-306.