本文是一篇软件工程论文,软件工程是研究和应用如何以系统性的、规范化的、可定量的过程化方法去开发和维护软件,以及如何把经过时间考验而证明正确的管理技术和当前能够得到的最好的技术方法结合起来。(以上内容来自百度百科)今天为大家推荐一篇软件工程论文,供大家参考。
第1章 绪论
1.1 研究背景与意义
在线社交网络[1]是传统社交网络的一种延伸,在传统的社交网络中,人与人之间通过各种信息媒介直接或间接的传播消息,而消息会随着社交网络的结构逐渐动态传播并形成新的社交网络结构。随着互联网技术的不断发展,用户在获得社交信息时更加便利、更加快捷。同时随着网络终端的不断发展和创新,各种便携式多媒体设备也让传统社交网络中的消息信息量剧增[2]。基于便携式的移动社交网络终端,用户之间的信息交互可以突破地域性的限制,随时随地的分享和发布社交信息[3]。具有相似兴趣爱好的用户通过通讯设备连接起来,形成虚拟社区,并进行内容的传输与分发,极大地增强了用户的真实性、地域性和交互的实时性。同时,移动自组网作为社交网络中支持的技术之一应用逐渐广泛并对传统的在线社交网络进行了有益的扩展和补充[4],MANET 可以为用户带来区别于传统社交网络的新型社交体验,其研究价值和应用价值日益显著[5]。社交网络已经不单单是网络上社区化的交友平台,其与电子商务,网络金融,网络购物等服务业有机结合成为一个新的趋势[6]。随着互联网技术的发展和人们社交形式的改变,社交网络从最初的消息转发演变为各种文件传播的和新闻热点的集散地[7][8],用户之间行为交互的目的也从原始的消息共享转化为可能含有危害信息的不良行为[9]。然而从另一方面看,用户之间的推荐行为能很好的促进社交网络的发展。互联网调研数据显示,有八成的消费者在购物之前,会到网络上寻找他人的体验评价。这说明,他人的评价对于正在选择的用户拥有巨大的意义。在社交网络中,朋友关系的评价反馈会给用户提供更有价值的参考。同时通过这种互动,社交网络上的成员也能增加交流,深化互信。让社交网络更加生活化,人性化。为了保护社交网络中用户的隐私权利并更好的实现用户之间的评价推荐。信任度[1]许多学者提出,它帮助人们克服和陌生人进行沟通时产生的不确定性,做出正确的决策从而避免不确定性带来的风险,并促使用户参与到正常的社交活动中[10]。信任度过低的用户被禁止访问,可以在一定程度上保护用户的隐私[11][12]。信任度还可以应用推荐系统,其可以使用户更方便的获得社交网络中的热点消息和用户关注点。由此可以看出,信任度计算是社交网络中非常重要的组成部分。
.........
1.2 国内外研究现状
在目前的信任度计算研究中,有以下三大类方法:第一类是将用户的静态属性进行归一化,并将归一化后的数值作为分类器的输入,基于目前已有的分类器对信任用户和不信任用户进行分类。例如基于 SVM 的信任度计算方法,基于贝叶斯分类器的信任度计算方法等。第二类是基于新型融合方法的信任度计算方法。此类方法加原始数据直接作为输入,通过多源异构融合算法将原始数据融合为信任度计算结果。由于多源信息融合方法能适应输入数据维度的不同和值域的不同的特点,此类方法相比其他方法能在计算时考虑更多用户属性。例如基于证据理论的信任度计算方法、基于集合论的信任度计算方法、基于神经网络的信任度计算方法、基于遗传算法的信任度计算方法等。第三类是基于用户群和小世界理论,将用户划分群组并使用群组的特征描绘用户属性和信任决策之间的关系。例如基于群论的信任度计算方法、基于领袖意见的信任度计算方法等。Brown[29]提出了一种用户在其社交圈子中影响力的计算方法,并基于用户的影响力计算出在同一个社交圈子中其他用户对当前用户的信任度。Arlei[30]改进了 Brown 的工作,在用户影响力的基础之上加入了用户消息的传播统计,传播次数越多的用户之间的信任度将会越强。Tsolmon 和 Lees[31]将用户的历史行为量化为用户信誉度,基于用户信誉度完成对用户信任决策的计算。除了信誉度,其他属性也被量化并作为信任度计算的输入,例如粉丝数,交互数,转发数等等。蒋文军提出了一种基于网络中消息传播和泄露值的信任度计算方法[32]。Mrmol 和 Prez[33]提出一种基于用户行为和用户评价的信任度计算方法。张志勇[34]提出了一种基于用户反馈和社交圈子的信任度计算方法,其中借鉴并利用了社交圈子中的领袖现象[35]。为了找到社交圈子中的社交领袖,文献[36]提出了一种基于网络拓扑和历史交互次数的社交领袖发现方法 HITS。
...........
第2章 相关理论知识
2.1 社交网络中信任的定义及特点
信任表示人与人之间的信赖程度,其中一方(委托人)愿意信赖另一方在未来的行为(受托人),并自愿放弃对受托人在未来行为的监控和控制。信任本身具备三个特点:1.信任是脆弱的。信任的形成建立在长期的信息交流和反馈基础之上,在信任的形成阶段,大量的正面行为积累的信任度较少,而少量的负面行为会降低很大的信任度。信任的积累十分困难,且十分容易被破坏。2.信任是可传递的。信任是人与人之间情感的体现,其可以通过口碑,行为,文字等形式传递。3.信任是多维的。信任的生成会受到多种因素影响,诸如环境因素,用户心情、媒体宣传等。这些因素都会在单独的一个维度上影响信任度的形成并导致生成信任度的多维性。
.........
2.2 D-S 证据理论
2.2.1 基本 D-S 证据理论
证据理论是 Dempster 在 1967 年提出的一种概率区间表示方法,概率的不确定性通过多值映射转化为概率上下界。相比贝叶斯模型和决策树模型,证据理论能更好的处理不确定和不知道的问题。在证据理论中,所有可能的决策被称为“焦元”,而所有焦元的集合被称为辨识框架 。每个焦元可能是最终决策的概率被看作是一个概率区间。该区间的下限被称为基本信任分配函数 BPA (BasicProbability Assignment),或信任函数(Belief Function),而上限被称为似然函数pl 。其中 bel 代表对证据的完全支持, pl 代表对证据的不反对程度,区间[b el ( A) , pl ( A) ]则构成了当前证据对焦元 A 的支持程度。证据的证据体构成如图2-1 所示。图 2-1 中值域[0,1]被划分为三个区间:支持区间[0,bel],怀疑区间[bel,pl]和拒绝区间[pl,1]。在基本信任分配函数 bel 确定之后,对当前命题的假设都会被界定在这三个区间中。以目标识别为例,假设命题是“对方目标是飞机”,其中基本信任分配函数 bel=0.7,似然函数 pl=0.1,则可以确定不确定程度为 1-0.7-0.1=0.2。同时假设此时有一个传感器返回信号显示对方有 0.9 的概率是飞机,由于 0.9 处于拒绝区间,则认为当前信号不可信,如果传感器返回的信号显示对方有 0.75 的概率为飞机,则认为当前信息有一定的价值,但是处于不确定的范围,将考虑使用,如果信息显示是飞机的概率为 0.6,由于其处于支持区间,认为该信息是有用信息。
............
第3章 社交网络信任属性证据融合方法 ............. 23
3.1 一种改进的D-S证据融合方法............. 23
3.2 证据融合的信任转移模型 ........ 27
3.3 融合方法有效性验证 ..... 28
3.3.1 验证融合结果焦元大小..... 29
3.3.2 验证融合结果准确率和召回率.... 32
3.4 本章小结.... 35
第4章 基于证据理论的社交网络信任计算方法 ....... 37
4.1 基于用户意愿的信任属性证据提取 .............. 37
4.1.1 用户意愿的定义 ...... 37
4.1.2 用户意愿的获取 ...... 37
4.1.3 基于用户意愿的信任属性证据生成....... 41
4.2 基于隐私风险的信任属性证据提取 .............. 43
4.3 两类信任属性证据的融合 ........ 46
4.4 本章小结.... 47
第5章 信任度计算方法验证 ............ 49
5.1 实验设计.... 4
5.2 实验数据及实验环境 ..... 49
5.3 实验结果与分析 ............. 51
5.4 本章小结.... 55
第5章 信任度计算方法验证
5.1 实验设计
为了体现研究方法的有效性和优越性,实验部分采取比较计算过程中的中间值和最终的信任度计算准确率作为比较的重点。在试验部分首先介绍实验所使用的数据集,并介绍为什么使用该数据集和该数据集的特点。其次比较了本研究中一些变量在经过关键操作之后的变化来检测这些操作的有效性,最终比较了本研究提出方法的信任决策准确率和召回率作为方法优越性的决定性因素。在本研究提出的信任度计算方法中,首先对用户进行了用户意愿的提取并基于当前用户的用户意愿生成信任证据。为了检测用户意愿提取的有效性,在试验中比较了用户属性的数值分布和经过用户意愿提取后的数值分布。由于用户属性中的每一个属性都对应于一个信任证据,这些信任证据首先被合成为代表用户意愿的信任证据willm 。由于最终的信任决策是基于willm 和传播风险证据fowm ,willm的决策偏差将引起最终的融合结果的决策偏差,所以在比较融合结果之前首先并比较仅仅基于willm 的信任决策准确率。相比于信任证据willm 的确定规则,信任证据fowm 是基于分类完成的,为了说明分类的过程和分类的有效性,实验部分将分类的过程可视化并找到最优的分类平面。在分类平面获得之后,基于第四部分的证据生成规则生成风险预测证据并以表格的形式呈现。最终通过信任证据willm 和信任证据fowm 的融合生成最终的信任决策结果。并通过图表的形式比较本研究方法和已有方法的准确率召回率。
............
结论
本文首先对当前社交网络中信任度计算的研究现状进行了分析,并提出了本课题的研究动机。根据此动机,提出了一种基于 D-S 证据理论的社交网络信任度计算方法,以及一种抗相似度碰撞的证据融合方法。在本文的最后,使用在线数据集 Epinions 检验了提出方法的有效性和正确性。由于本研究的应用场景为在线社交网络,本文首先介绍了在线社交网络和在线社交网络中用户之间的信任度计算的需求。以及目前已有的用户信任度计算方法以及现有方法的研究不足和局限性,并引出本文的信任度计算方法。在相关理论部分,介绍了基本证据理论、支持向量机和信息流理论为描述本文的具体算法做铺垫。本文的主要工作有以下三个方面:
1.提出一种降低相似度碰撞的证据融合方法证据理论作为一种处理不确定数据的多源信息融合方法,已经被广泛的应用于数据挖掘、可靠性分析等领域。由于证据能同时表述不信任和不确定的概率,本研究使用证据形式表述信任度以避免信任度在传递过程中的信任度丢失。然而目前已有的证据融合方法存在相似度碰撞的不足,本文在第三章分析了证据相似度碰撞的问题,并得出了计算焦元序列能够降低相似度碰撞的结论。在第三章的后续部分,提出了一种基于计算焦元序列的降低相似度碰撞的证据融合方法。并在第三章的最后使用两组试验对提出方法的有效性进行了验证。
2.提出一种信任决策个性化的挖掘方法在本文的研究现状中,陈述了目前信任度计算缺乏个性化的不足。在本文的第四章,定义了用户个性化的数据结构-用户意愿,并提出了一种基于梯度下降的用户意愿挖掘方法。弥补了目前信任度计算中缺少个性化计算的不足。
3.将隐私消息的泄露风险转化为信任度证据基于目前信任度计算无法预测隐私泄露风险的问题,提出一种将隐私泄露风险转化为信任度证据的方法。通过蒙特卡洛抽样,计算出任意两个用户之间的消息传播概率。联合消息拥有者的黑名单和概率的分布,生成隐私泄露信任证据。在文中的第四章,介绍了基于抗相似度碰撞的融合规则对获得的最终的融合结果。在文章的最后,使用在线数据集对本研究提出方法的有效性和正确性进行了验证。在准确率方面,相比目前已有的方法,信任决策的准确率和 F-Score 都有很大程度的提高。
..........
参考文献(略)