本文是一篇软件工程论文,软件系统能最有效的利用计算机的时间和空间资源。各种软件无不把系统的时/空开销作为衡量软件质量的一项重要技术指标。很多场合,在追求时间有效性和空间有效性时会发生矛盾,这时不得不牺牲时间有效性换取空间有效性或牺牲空间有效性换取时间有效性。时/空折衷是经常采用的技巧。(以上内容来自百度百科)今天为大家推荐一篇软件工程论文,供大家参考。
第一章 引 言
情感分析(Sentiment Analysis)是自然语言处理(Natural Language Processing,NLP)领域的研究热点之一,旨在通过分析文本的内容信息挖掘其中的情感表达[1]。近年来,因深度学习方法在情感分析任务中无需依赖复杂的特征工程,以及可以有效解决不同类型情感分析任务等优点,如何利用深度学习方法挖掘文本中更深层次的情感信息,并将深度网络模型应用到不同类型的情感分析任务中,已得到越来越多研究人员的关注。
1.1 研究背景及意义
传统的情感分类方法主要有基于规则和基于机器学习两类。基于规则方法主要采用根据人工经验或者专家意见得到的情感词典、特征统计和情感模板等对文本进行情感分类[4,5]。基于机器学习的方法通过人工标注一部分数据构建训练集,并对训练集的数据进行特征提取和学习训练一个分类模型,最后将未知标签的测试样本输入到分类模型进行性能判别。在过去的研究工作中,基于传统机器学习构建的分类模型在普通句子情感分析任务中取得了许多突破性成果[6,7]。基于机器学习的方法在无需依赖复杂的人工规则的前提下取得了比规则统计更好的情感分类效果,在一定程度上降低了任务中的人工成本。但是这类方法通常仍需要依赖一些特征工程或依存句法分析等外部知识。在瞬息万变的社交网络平台,传统的情感分析任务已不能完全满足用户的需求,在新兴的社交文本中,开始涌现出短文本情感分析、长评论情感分析、特定目标(target)情感分析、基于方面(aspect)情感分析等一系列更深层次的情感分析任务[8-10]。张志琳等人[11]结合句子中的多种特征提出一种基于传统机器学习方法的中文微博情感分析模型。Qiu 等人[12]提出了一种用在特定目标情感分析的双向传播算法,通过情感词和目标词之间的特定关系判别特定目标的情感极性。Kiritchenko等人[13]使用一种结合多种特征的 SVM 分类模型用在基于方面情感分析任务。受限于传统机器学习方法无法充分挖掘文本中词语更深层次依赖关系等问题,这类基于传统机器学习的情感分类模型在更深层次的情感分析任务中的效果并不理想仍需要依赖大量的特征工程。
.........
1.2 研究现状
自 2002 年 Pang 等人[26]提出情感分析以来,有越来越多的研究人员开始关注社交文本的情感分析。在基于规则的情感分析模型中,Chesley 等人[27]使用动词和形容词在句子中的结构关系构建情感模板获取输入文本的情感信息,实现文本的情感分类。Joshi 等人[28]通过人工标注的 Twitter 情感信息,遍历并计算句子中的情感得分来判断句子的情感极性。这些基于规则的方法在情感分析任务中通过针对不同的数据集人工整理情感词典和分类规则,并根据词典和规则计算输入文本的情感得分,获取文本的情感识别结果。由于机器学习方法具有降低任务中人工成本的优势,越来越多学者使用机器学习方法来构建分类模型,自动获取社交文本的情感极性[29,30]。常用的基于机器学习的情感分类方法主要包括朴素贝叶斯、支持向量机(SVM)、决策树等。在情感分析任务中,这类方法通过对数据集的信息提取和特征构建,取得了比基于规则方法更好的分类效果。基于机器学习方法通过结合文本的一元词特征、二元词特征、词性特征、情感特征等,将文本中的词语映射为多维向量,并通过分类模型学习特征信息。常用的特征映射有 One-hot 表示方法,该方法把文本中的词语映射为多维向量,但忽略了词语之间的依赖关系和文本的语义关系。针对该问题,Bengio 等人[31]提出了用多维的实数向量来表示文本的词语,考虑了词与词之间的位置关系和语义信息,总结出基于神经网络来构建统计语言模型的框架,同时学习词向量的权重和概率模型的参数。2013 年,Mikolov 等人[32]提出了用 CBOW 和 Skip-gram 模型计算词向量的方法,该方法通过参数调整可以得到词与词之间的相似性,得到了学术界和工业界的高度关注。文献[29]在在线评论情感分析任务中使用了 3 种机器学习方法自动实现在线评论的情感极性判别,其中 3 种方法都取得了 80%以上的正确率。但是该论文提出的 3 种模型中,朴素贝叶斯模型的情感分析效果比 n-gram 和支持向量机模型要差,说明传统机器学习方法还是难以考虑句子中词语之间的依赖关系,所以朴素贝叶斯模型的分类效果并不理想。文献[30]通过训练多种机器学习模型,并将不同模型级联作为最终的情感分类模型来解决多语言的情感分析问题。该方法通过不同机器学习方法的组合有点,有效弥补了单一算法的不足,通过级联的方式获取输入文本的情感得分,得到最终的情感分类结果,这不仅可以有效提升情感分析的正确率,同时也降低了任务中的人工成本。
...........
第二章 背景知识
本章首先介绍 3 种本文需要解决的文本情感分析任务,以及其中的任务定义和难点分析;然后介绍深度网络方法的相关背景知识,并介绍结合 2 种传统深度网络模型在情感分析任务中的训练流程。
2.1 不同类型文本情感分析任务
早在 2000 年,情感分析就成为自然语言处理(NLP)中最活跃的研究热点之一[47-49],它在数据挖掘、文本挖掘、Web 挖掘和信息检索方面得到了广泛的研究。近年来,随着社交网络的繁荣发展,更深层次的情感分析任务开始得到研究和关注。本文将重点研究如今最热门的短文本情感分析、特定目标(target)情感分析和基于方面(aspect)情感分析[50,51]。区别于普通文本情感分析,短文本情感分析需要从有限的文本特征信息中判断文本的情感极性,对于长度为n的句子1 2{ }ns w ,w , ,w,其中iw 为句子 s 中的第 i 个词语,短文本情感分析的任务是根据句子s的词序列所包含的特征信息来判断句子s 的情感极性。由于短文本通常不遵循语法规则,同时由于长度短、所含的信息相当有限,所以传统情感分类模型难以直接应用到短文本情感分析任务中。例如微博、Tweet 等短文本,往往会有字数的限制,同时会存在大量的口语化用词。以句子“你太给力了”为例,句子中存在“给力”这个含有情感色彩的口语化新兴网络用语,在对这类短文本进行情感分析时,需要将“给力”这类新兴的网络用语以额外特征的方式结合到分类模型当中。
........
2.2 深度网络模型
用在自然语言处理领域的深度网络模型主要有卷积神经网络(CNN)和长短期记忆网络(LSTM)两种,本章将介绍这两种网络的网络结构以及在情感分析任务中的应用。由于卷积神经网络(CNN)在任务中无需大量的预处理工作,有效缓解了任务中对特征工程的依赖,本章介绍了 3 种不同类型的文本情感分析任务,并对不同类型情感分析任务的解决难点做了简单介绍和分析,然后介绍了 2 个在自然语言处理任务中最为流行的深度网络模型,最后对深度网络模型在情感分析任务中的应用做了简单介绍,为后续章节做铺垫。
.........
第三章 基于多通道 CNN 的短文本情感分析模型.............16
3.1 特征构建.............16
3.1.1 词向量特征..........16
3.1.2 词性向量特征......17
3.1.3 位置向量特征......17
3.2 多通道卷积神经网络....18
3.2.1 多通道输入..........19
3.2.2 模型训练..............19
3.3 实验..........20
3.4 本章小结.............26
第四章 基于多注意力 CNN 的特定目标情感分析模型 ....27
4.1 注意力机制.........27
4.2 多注意力卷积神经网络...........28
4.3 实验..........3
4.4 本章小结.............42
第五章 基于门控分层网络的特定目标情感分析模型.......43
5.1 分层模型.............43
5.2 基于门控机制的分层网络模型..........43
5.3 实验..........47
5.4 本章小结.............52
第五章 基于门控分层网络的特定目标情感分析模型
上一章介绍了基于卷积神经网络(CNN)和多样化注意力机制的特定目标情感分析模型,本章将介绍结合卷积神经网络和区域长短期记忆网(LSTM)的深度分层网络模型。通过结合区域 LSTM 和句子层 CNN,使模型在有效区分句子中不同目标情感信息的同时,能有效保留整个句子的特征信息。此外,通过门控机制来控制信息的传递,使模型可以有选择地保留对情感学习有用的特征信息。
5.1 分层模型
近年来,分层神经网络模型已在许多 NLP 任务中取得重要成果,并得到了很多学者的研究和关注。在文档级别句子关系分类任务中,Lin 等人[63]使用一个作用在整个文档的句子级别 RNN 来获取句子间的连贯性,并将句子级别 RNN 提取到的特征信息作为词语级别 RNN 的输入来获取跨句子的语境预测。Li 等人[64]基于分层LSTM 构造自动编码器来保留文档中的句子段落,并通过作用在另一层面的 LSTM网络来学习文档的编码,得到段落的编码重构。Wang 等人[65]将区域 CNN 和 LSTM结合来构建一种分层网络模型用在细粒度情感分析任务中,通过将长文本以独立区域形式作为 CNN 的输入,并通过 LSTM 接收区域 CNN 的有序输出,完成对长文本的特征挖掘。基于上述研究,本章结合区域 LSTM 和句子层 CNN,提出一种带门控机制的分层网络模型用在特定目标情感分析任务中,使模型可以充分挖掘句子的特征信息,有效识别不同目标的情感极性。
.........
总结
由于具有降低任务中特征工程工作量的优势,深度学习在情感分析任务中取得了令人瞩目的成功。但是目前大多数深度网络模型在处理复杂的情感分析任务时仍面临无法充分利用短文本中句子的情感特征信息,结合注意力机制的深度网络模型计算复杂、训练时间较长,以独立句子作为网络输入的模型无法挖掘长文本不同句子间相互依赖关系等问题。针对上述问题,基于深度学习知识和文本挖掘技术,从模型架构和技术结合两方面对深度网络在不同类型情感分析任务中的应用进行了改进和完善。主要的研究内容总结如下:
(1)以往研究中,基于卷积神经网络的情感分类模型虽然可以通过接收句子的平行化输入具有较快的训练速度,但是这类模型往往无法充分挖掘短文本中的情感信息,在短文本情感分析任务中的效果不理想。针对该问题,提出一种基于多通道卷积神经网络的短文本情感分析模型(MCCNN)。该模型在词向量信息的基础上,结合了表示不同情感信息的词性向量,以及区分词语不同重要程度的位置向量,并通过多通道网络的形式接收句子的不同形式输入,使模型在训练过程中可以从不同方式来挖掘短文本的特征,获取更深层次的隐藏情感信息。通过在中文微博的短文本情感分析实验中可以看出,相比以往研究中的卷积神经网络情感分析模型,本章提出的 MCCNN 模型可以在保证训练时间快速的同时,提升了短文本情感倾向性识别的效果。
(2)针对在特定目标情感分析任务中,结合注意力机制的序列性输入网络模型的训练时间较长,且无法从多种方式挖掘情感信息等问题,提出了一种基于多注意力卷积神经网络的特定目标情感分析模型(MATT-CNN)。通过将不同类型的注意力机制和接收平行化输入的 CNN 结合,在有效提升模型训练效率的同时,也可以根据不同类型的注意力机制来高度关注特定目标在句子中的情感信息,从而有效识别多目标句子中不同目标的情感极性。实验结果表明,本文提出的 MATT-CNN模型相比取得重要成功的结合注意力机制的 LSTM 网络,在大幅度降低模型训练时间的同时,能取得更优的分类效果。
..........
参考文献(略)