第一章 绪论
1.1 课题研究的背景
在基因组研究被攻克后,脑研究、脑认知成为了下一个重要的研究目标。继欧盟提出脑计划[1]后,逐渐有更多的国家提出了脑研究计划。2013 年,由 15 个欧盟国家参与预期 10 年完成的“人类脑计划”开始实施,其主旨是通过模拟脑功能的方式实现人工智能[2]。2013 年,美国国家卫生研究院正式开始了“人脑连接计划”[3-4],旨在揭示神经通路和人体复杂的连接图谱来说明人类如何能够成为独立的个体。2014 年,日本开始了大型脑图谱计划[5],旨在挖掘更深层次的脑功能,提高诊断和治疗神经系统领域的疾病的效率。我国也于 2016 年正式提出了以“脑科学和脑启发智能”为主题的脑科学研究计划[6],旨在推动脑科学领域基础研究、生物生理医学以及基于脑启发人工智能的发展。
中国的脑研究计划包括脑认知,脑科重大疾病研究以及类脑人工智能的研究。其中脑认知作为所有脑研究计划的基础,主要研究方向为揭示脑认知活动的机制原理,涉及感知觉、注意力、记忆、语言、思维意识等。中科院选择了学习、感觉、抉择和情感作为主要的研究方向[7]。在清楚了解大脑活动的基础机制原理后,就可以更好的运用在人工智能的开发和疾病的研究中去。
本文研究的方向为视觉神经计算,属于感知觉研究中的视觉机制原理的研究[8]。1962 年,Wiesel 和 Hubel 在研究中将 V1 皮层区域细胞分成简单细胞和复杂细胞[9],并构建了 V1 简单细胞的感受野,也因此得到了 1981 年诺贝尔医学或生理学奖,为视觉神经计算领域提供了生物学基础。1982 年,Marr[10]首次提出了相对完善的视觉计算理论,被誉为视觉计算理论创始人。
...............................
1.2 研究的目的与意义
现有研究表明,人类大脑平均每天从各种途径接受外界信息近 1 亿条,而后筛选出近 1%的“有效信息”,并对筛选出的信息进行处理,以获得对外界事物的基本认知[16]。视觉系统作为主要的感觉系统处理并接收了近 7-8 成的信息,在接收了来自外界的信息后,视觉系统快速且准确的处理并识别出轮廓、颜色、位置等信息。完成这样复杂的信息处理,人脑的能耗也只有仅仅 10W 左右。如此高效、准确且低耗的特性,对现有计算机领域的信息筛选、微型电子机器人、人工智能的图像识别等方向均有重要意义。视觉神经计算的主要方向就是揭示人脑视觉系统的底层运算的机制原理,为以上研究提供理论基础[17]。
同时,对视觉系统的研究还对医学上的眼科疾病具有重要意义。人类对视觉系统的研究表明视觉系统由眼球收集来自外界的光学信息,经视网膜转换成电信号,由外侧膝状体经过信息统合整理后传递至大脑皮层,最终由大脑皮层完成最终的信息处理完成图像合成、目标识别等功能。目前人类对眼球及视网膜的研究已经相对完善,而更深层次的信息的筛选、传递、处理却尚未有定论。完善对视觉系统的研究,可以从更深层次,更多角度的去分析眼科疾病产生的原因。提出更为完善的治疗手段,甚至为一些现有医学技术无法治疗的疾病发现新的治疗方法。
本文的研究方向为弯角信息提取,是对视觉系统中基础的图像识别、图形认知的研究。弯角是轮廓特征中重要的支配点,传统研究中以相邻边缘位置信息为依据推测角顶点位置的方法具有局限性。对角附近区域的信息没有充分利用的同时角顶点位置也不符合错视觉心理学实验的结果。本文提出一种在不依据边缘位置信息条件下获得角顶点位置的计算方法。采用由简单细胞搭建的微分细胞模型,以二维的离散分布方式收集弯角区域的信息.并据此计算角顶点的位置,取得与心理学实验一致的结果,解释了角度变化对角顶点位置偏移的影响.并讨论不同对角顶点位置认知的影响。
...............................
第二章 相关技术介绍
2.1 人体视觉系统
人体视觉系统主要由三部分组成:光学采集部分、外侧膝状体部分、大脑视觉皮层部分。光学采集部分由眼球与视网膜组成,如图 2-1。
............................
2.2 经典感受野
1953 年,SW Kuffler[47]首次对外侧膝状体细胞的感受野进行了说明,经实验得,外侧膝状体下细胞的感受野反敏感性的空间分布成同心圆状。如图 2-2 所示。
图 2-2 中左侧为 on-center 型外侧膝状体细胞的感受野,中心部分产生兴奋信号,外环部分为抑制信号,内环与外环相互拮抗,相反的信号相互抵消。当光线刺激外环时,外环抑制信号输出减少,内环兴奋信号大于外环抑制信号,细胞输出兴奋信号的反应值,表现为对光线敏感。右侧为 off-center 型外侧膝状体细胞,内外环信号与 on-center 型细胞相反,表现为对暗信号敏感。感受野是细胞特性的表现,本文研究所使用的细胞模型沿用了经典的同心圆感受野模型,并使用拉普拉斯-高斯函数来模拟细胞遇到光、暗刺激时细胞的兴奋与抑制型输出。
...............................
第三章 细胞模型 ...................................... 15
3.1 空间对应关系建立 ....................................... 15
3.2 简单细胞模型 .................................. 18
第四章 弯角信息提取机制建立 ............................................... 24
4.1 基于初级视觉系统的弯角信息提取 ....................................... 24
4.2 基于初级视觉系统弯角信息提取机制建立过程 ............................................... 25
第五章 Müller-Lyre 错视觉与弯角信息提取机制 ...................................... 35
5.1 Müller-Lyre 错视觉介绍 ................................... 35
5.2 Müller-Lyre 错视觉相关实验 .............................. 36
第五章 Müller-Lyre 错视觉与弯角信息提取机制
5.1 Müller-Lyre 错视觉介绍
1979 年 Müller-Lyre 提出了这种几何错视觉现象,Müller-Lyre 发现在线段两端加上不同方向的角,会使得人体对等长线段的长度产生认知错误,如图 5-1。附加角开口向外的线段会比附加角开口向内的线段看起来长一些。最初中外的学者从视觉感受器的感受特征、大脑皮层信息处理机制、人类个体认知机制、几何图形的结构特征等方向进行了大量的研究,试图解开 Müller-Lyre 错视现象的心理学机制或生理学机制。尝试说明 Müller-Lyre 错视觉现象产生的原因,来架构一个对错视觉现象合理的科学解释。
而后相关的研究又引入了系统论、信息论,对错视现象从外部视觉感受器到内部视觉神经信息处理过程进行了系统的定量分析。Müller-Lyre 错视觉产生的根本原因在于图形的诱导,于是很多学者在图形的诱导方面做了大量的研究。产生Müller-Lyre 错视觉的图形主体在于附加在线段上不同方向的角,张铁中等人对角度与角的大小进行了相关研究,得出了结论角度较大的错觉量较小,图形较大的错觉量也同样较大。
............................
结论
在前期研究中,使用微分细胞为检测核心,依据图像的位置边缘信息,采取链式追踪的方式对边缘位置进行采集,在微分细胞识别出弯曲后,将弯曲程度最大的点作为角点。这样的角点计算方式,在生理学上难以想象的,缺乏说服力。本文研究,使用以简单细胞感受野为基础,搭建构成的微分细胞作为检测核心。依靠收集角附近区域的非边缘位置信息,利用微分细胞对弯曲的敏感以及角两边在角附近的相互影响,计算出角顶点位置信息。
首先,我们做了微分细胞的滤波实验。使用微分细胞对图像内每个像素点进行检测,将存在反应的点显示。实验结果表明,微分细胞对线段区域无反应,对角点及角附近区域存在反应,说明使用微分细胞来收集角点附近区域信息是可行的。之后,将微分细胞收集到的信息经过双线性插值函数处理后,进行阈值筛选,以确保微分细胞在非边缘区域仍旧保有方向选择的特性。将微分细胞以二维离散的方式,
分布在图像内进行检测。经过归一化后的微分细胞反应值作为权重,求得局部区域各微分细胞的重心位置,此位置定义为角顶点位置。经此过程,确定的角顶点位置向角开口方向发生偏移。偏移程度受角的度数影响。且在实验过程中发现,在使用较大解像度时,对图像检测效果减弱。分析原因,可能是较大解像度导致微分细胞在图像内分布稀疏,无法对图像进行有效的检测。据此,我们认为人体视觉系统在观测图像时,选取解像度可能与图像大小存在关联。
错视觉在一定程度反应了人体视觉系统的特征,为了验证弯角信息提取机制的可靠性及可能性。本文研究将弯角信息提取机制的实验数据与 Müller-Lyre 错视觉的图形诱导实验的数据进行了对比验证。发现,在弯角信息提取机制下角顶点位置的偏移量与 Müller-Lyre 错视觉的错觉量在受到角度影响时,发生改变的趋势相符。说明弯角信息提取机制在一定程度贴合人体视觉系统的特征,有存在的可能性。且在使用不同解像度对不同大小的 Müller-Lyre 错视觉图形进行检测时发现,不同解像度下角顶点位置发生的偏移与 Müller-Lyre 错视觉的错觉量在趋势上具有一致性。说明人体视觉系统在解像度选取时解像度与所对应的细胞感受野尺寸呈现正比的关系。
参考文献(略)