本文是一篇软件工程论文研究,本文简单的介绍了钙成像技术的发展以及钙离子指示剂的出现以及发展。着重于对第三个难点进行分析和研究,阐述了国内外研究现状以及意义。重点说明了面向钙成像数据的 AM算法,进一步来说就是将 AM 算法应用于神经元动作电位出现的时刻(即脉冲峰值时刻)的采样。针对于研究过程中可能出现的问题,本文主要做了如下的技术工作:(1)研究已有的采样方法,对其研究背景、研究意义以及研究现状作了详细地介绍,并且选择了 MCMC 算法作为脉冲峰值时刻采样的对比算法,从原理上详细地对贝叶斯以及贝叶斯采样算法做出了描述,分析了不同采样算法的优缺点。
第一章 绪论
1.1 课题背景
1.1.1 课题研究背景
钙成像技术是一种在神经科学领域中用于采集大规模数据的流行技术[1](包括离体实验[2]和在体实验[3-5])。细胞内钙离子是一类重要的信号分子且在传导过程中起着重要作用[6,7]。当第一个细胞兴奋时,会产生一个动作电位,此时,细胞外面的钙离子流入该细胞内部,使得该细胞分泌神经递质,神经递质又立即与相近的下一级神经细胞膜上的蛋白分子结合,促使这一级神经细胞产生新的动作电位[8]。神经信号就是按照这种方式向下传递,构成复杂的信号体系。在生物有机体中,钙离子会产生各类胞内信号,这些胞内信号在每种类型的细胞中都可能存在,且在各种不同的功能方面都有重要作用,例如对心肌细胞收缩的控制和从细胞增殖到细胞死亡整个细胞周期的调节等[9-11]。在静息状态下,多数神经元的胞内钙离子浓度为50-100nM,而当神经元活动的时候,胞内钙离子浓度能上升 10-100 倍,增加的钙离子对于包含有神经递质的突触囊泡的胞吐过程必不可少[12]。常理上而言,只有游离钙才具有生物学活性,细胞质内部的钙离子浓度是由钙离子的内外流平衡所决定的,同时也受钙结合蛋白的影响。细胞外部的钙离子内流的方式有很多种,包括离子型谷氨酰胺受体、烟碱型胆碱能受体和瞬时受体电位 C 型通道等。总的来说,神经元的活动与其内部的钙离子浓度密切相关,神经元在放电的时候会爆发出一个短暂的钙离子浓度高峰。神经元钙成像技术的原理就是借助钙离子浓度与神经元活动之间的严格对应关系,利用特殊的荧光染料或者蛋白质荧光探针(钙离子指示剂),将神经元当中的钙离子浓度通过荧光强度表现出来,从而达到检测神经元活动的目的[12]。其中,钙离子指示剂是通过和钙离子结合后改变荧光特性而发挥作用的,其大大增强了钙离子信号的检测能力。钙离子指示剂可以分为化学指示剂和基因编码指示剂两大类 [13]。
........................
1.2 国内外研究现状
国内外已经有不少学者提出了不少有效的方法来获取精确的钙离子脉 冲峰值时刻。在2008 年的时候,Greenberg 等人[32]使用动态规划算法来识别单个脉冲峰值。同年,Holekamp等人[33]将最优线性反卷积算法(例如维纳滤波器)应用于荧光轨迹观测数据,光从信号处理的角度来看,这种方法是可操作的,但却不能保证脉冲峰值一直为正数。Sasaki 等人[34]使用机器学习算法,也就是将主成分分析(Principal Components Analysis,PCA)和支持向量机(Support Vector Machine,SVM)结合起来构建了一种脉冲峰值检测算法。算法的训练集是数百个联合电生理信号和成像的数据,算法的最终目的是了解脉冲峰值对荧光观测轨迹的影响。2009 年,Vogelstein 和 colleagues[35]提出了一种基于生物物理模型的序列蒙特卡洛算法。其基本思路如下:首先构建感兴趣信号和成像过程的概率“前向模型”;然后,利用贯序的蒙特卡洛期望最大化框架来推断脉冲峰值时刻和钙离子瞬变。其中,贯序的蒙特卡洛期望最大化框架又被称之为粒子滤波平滑器(Particle Filter Smoother,PFS).
J. Vogelstein 等人[36]于 2010 年提出一种噪声约束反卷积的方法来获取脉冲峰值时刻。其大致思路如下,根据观测到的荧光轨迹的功率谱密度估计来寻找到最稀疏的非负神经元信号,从而使得数据能够拟合到期望的噪声水平。换而言之,这可以看作是一个没有局部最小值且可以有效求解的凸优化问题。与上述几个方法相比,该方法的特征如下:首先,其假定脉冲峰值为正。其次,算法效率高,处理 50000 个图像上的钙离子跟踪大概只需要一秒。同年,Benjamin 等人[37]提出了一种剥离算法来重建脉冲峰值序列。该算法的原理是先使用事件检测算法检测第一个事件,然后得出第一个脉冲峰值所出现的时刻,最后从荧光轨迹中减去在该时间点放置的钙瞬变值即可以重建脉冲峰值序列。
..............................
第二章 相关背景知识介绍
2.1贝叶斯统计方法
贝叶斯公式最早是在英国学者贝叶斯发表的《论有关机遇问题的求解》被提出的,其后,Laplace 重新定义了贝叶斯公式并对贝叶斯公式进行了更为清晰的阐述[41]。虽然贝叶斯方法与经典的概率统计方法有着很明显的区别,但是两者的思想却是可以相互借鉴、相互影响的,下面对贝叶斯方法进行了一些基本讨论。
统计推理的目的就是为了获取关于未知参数θ的全部值,而后验分布p(θ|x)恰好反映了目前对总体未知参数θ的全部认知[45,46],所以贝叶斯学派认为在得到未知参数θ的后验分布以后,统计推断的目标基本算是完成了。从形式上来看,贝叶斯统计推理是相当简单的,但是实际应用的过程中,观测数据 x 的边缘分布一般是不能用具体的函数解析式表示的。因此,后验分布p(θ|x)也不存在表达式,但却能求得p(θ|x)的核,这就导致了难以计算后验分布的精确值。所以,如何根据后验分布估计未知参数θ是贝叶斯统计需要解决的一个重要问题。
蒙特卡洛(Monte Carlo)方法,又叫做统计模拟方法或者统计试验,该方法于上世纪四十年代中期由冯诺伊曼等人率先提出。蒙特卡洛方法是可以在计算机上进行快速且大量的随机模拟统计实验,以此来计算在数学物理或者功能技术等方面难以直接用数学运算求解或使用其他方法依旧不能求解的一种近似计算方法,是一种有效的数值计算方法[47]。蒙特卡洛方法的基本原理是,事件的概率可以用大量实验中事件发生的频率来表示,当样本量非常大时,该事件发生的频率可以被认为就是其概率。基本思想是构建一个概率统计模型或随机过程,使得未知参数正好是问题的解,然后通过对模型或过程随机抽样来获得未知参数的统计性质,最终,得出所求问题的近似解并检验[48]。
.............................
2.2贝叶斯抽样方法基础知识
通过上面的介绍,我们将蒙特卡洛算法的主要步骤可以归结为以下三步:其一,构造概率过程。对于本身就有随机性的问题,主要是正确模拟该概率过程,而对于非随机性质的确定性问题,事先要构造好一个人为的概率过程,它的一些相关参数恰好是所求问题的解集,
也就是将非随机性质的问题转化为了随机性质的问题。其二,从已知概率分布中抽样。概率模型生成以后,由于各种概率模型均能够看作是由各式各样的概率分布构成的,因此产生已知概率分布的随机变量或随机向量就成为了实现蒙特卡洛模拟实验的基本手段,这也是蒙特卡洛算法被称为随机抽样的原因。最简单的概率分布是(0,1)上的均匀分布,随机数就是具有这种均匀分布的随机变量。用数学递推公式产生的随机数序列称之为伪随机数。其与真正的随机数或随机数序列有相近的性质,因此可以将其当作真正的随机数来使用。由已知分布随机抽取有各种各样的方法,但这些方法都是借助于随机序列来完成的,也就是说,都是以产生随机数为前提的。由此可见,随机数就是蒙特卡洛的基石,是实现蒙特卡洛模拟的基本工具。其三,建立各种估计量。实现模拟实验后,下一步就是要确定一个随机变量作为所求问题的解,即无偏估计。建立各种估计量就是对模拟实验的结果进行研究,从中得出问题所需的解。
以上是一个通过蒙特卡洛算法计算圆周率的具体做法,是为了把蒙特卡洛算法的具体思想表达清楚。蒙特卡洛算法另一个用途是计算积分,使用传统方法计算积分时,随着积分维度的不断增多,计算量以及计算时间也会迅速增加,此时由于蒙特卡洛算法与积分维数无关,因此其可以是一个很好的解决方法。从本质上来看,运用蒙特卡洛算法计算高维积分和计算圆周率的思想是很接近的。
.............................
第三章 面向钙成像数据的贝叶斯采样方法研究................................... 18
3.1基本模型 ............................. 18
3.1.1 钙动力学基本模型 .................................. 18
3.1.2 钙离子参数基本模型 ................................... 20
第四章 实验结果与分析 ................................... 28
4.1实验准备工作 ...................................... 28
4.1.1 实验环境配置 ............................ 28
4.1.2 实验的评价指标 ............................... 29
第五章 钙成像数据分析系统 ......................................... 34
5.1钙成像数据分析系统实现 ................................... 34
5.1.1 系统模型功能框架 ...................................... 34
5.1.2 具体操作步骤设计 ..................................... 34
第五章 钙成像数据分析系统
5.1钙成像数据分析系统实现
5.1.1 系统模型功能框架
通过上述几个章节的叙述,得出系统模块功能框架图如图 5.1 所示。
..............................
6.1总结
随着钙成像技术以及钙离子指示剂的日益发展和流行,原本悄无声息的神经元活动就变成了一幅斑斓闪烁的壮观影像,人们可以亲眼看见神经信号在神经网络之间往来穿梭。然而这些技术的发展也给数据的分析和研究带来了很多困难和挑战。现如今主要面临的挑战有如下三点:(1)如何识别光场中的每个神经元的感兴趣区域,换句话说就是如何从光场中找到每个神经元的空间足迹;(2)如何去除由于 3D 体积在二维成像平面上的投影或者三维成像方法中的空间分辨率不足所造成的空间上重叠的神经元;(3)如何从有噪声的钙成像数据中提取出精确的脉冲峰值时刻。
本文简单的介绍了钙成像技术的发展以及钙离子指示剂的出现以及发展。着重于对第三个难点进行分析和研究,阐述了国内外研究现状以及意义。重点说明了面向钙成像数据的 AM算法,进一步来说就是将 AM 算法应用于神经元动作电位出现的时刻(即脉冲峰值时刻)的采样。针对于研究过程中可能出现的问题,本文主要做了如下的技术工作:
(1)研究已有的采样方法,对其研究背景、研究意义以及研究现状作了详细地介绍,并且选择了 MCMC 算法作为脉冲峰值时刻采样的对比算法,从原理上详细地对贝叶斯以及贝叶斯采样算法做出了描述,分析了不同采样算法的优缺点。
(2)使用噪声反卷积方法从有噪声的钙成像数据中提取脉冲峰值并计算其对应的时刻,将计算得到的脉冲峰值时刻最为初始状态并使用 AM 算法对其进行重新采样。在迭代的过程中,同时对钙离子的相关参数(例如:幅度、初始浓度、时间常数等)进行了采样。
参考文献(略