结合模糊数学及多目标决策方案之混合多准则推荐系统

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw202316292 日期:2023-07-16 来源:论文网

第一章 绪 论

1.1 问题陈述与分析

文献[10]在他们的研究中率先用一个正确而生动的例子阐述了多准则推荐的研究问题。2011 年,文献[54]进一步修改这个例子并使它更具说服力。因此,我们在本文中引用和修改文献[54]中的例子来说明在推荐系统中引入多准则评分体系的重要性。我们将这个例子进一步延伸来说明如何用模糊逻辑来收集用户的偏好信息。现假设某电影网站希望向用户推荐电影,并且该网站使用基于友邻的协同过滤技术[18]来预测用户对电影的评分。基于友邻的协同过滤技术会根据某个用户的友邻(友邻和该用户有相同的偏好)对某个项目的评分来预测该用户对该项目的评分。

现在,这个电影网站希望根据已获取的其他用户的评分来预测用户 Alex 是否喜欢电影 Titanic。在传统的单一准则评分系统中,Alex 和 Mary 从他们过去已评分的项目中显示出相似的评分模式,如表 1-2 所示。因此,这两个用户会被当作友邻;并且,对 Alex 没有看过的电影的评分的预测将根据 Mary 对这些电影的评分来进行。在这个例子中,Alex 对 Titanic 的评分可能会是 Mary 对它的评分,即 9 分。

........

1.2 相关研究

在这一节中,我们简单介绍和本研究相关的一些研究工作的进展。推荐系统的发展根源可以追溯到认知科学(Cognitive Science)[13],近似理论(Approximation Theory)[14], 信息检索(Information Retrieval)[15], 预测理论(Forecasting Theories)[16]中的大量研究工作;同时,推荐系统最初的发展也同管理科学(Management Science)以及营销学中的消费者选择模型(Consumer ChoiceModeling in Marketing)密切相关。推荐系统在 20 世纪 90 年代中期开始崭露头角,成为一个独立的研究领域;这个时候,大量研究人员开始将注意力集中到那些依赖于评分结构(Ratings Structure)的推荐问题上[7]。推荐问题的公式化描述从文献[18-19]的研究中开始被大家普遍接受,这一问题也从那个时候开始得到广泛研究。由于推荐系统的历史不是本文关注的主要问题,接下来我们只对推荐系统的基本原理和分类做简要介绍。依据最终的推荐结果的获取方式,推荐系统一般被分为以下两类[20]:基于内容的推荐(Content-Based Recommendations):推荐系统推荐给用户的项目是那些与用户过去偏好的项目相似的项目[7]。基于内容的推荐算法的理论基础是:系统自动将某用户偏好信息中的特征与某项目的特征相互匹配[21-26]。基于内容的推荐系统有几个局限性[19-20]:第一,受制于系统所推荐的项目的特征和属性;第二,推荐给用户的项目只可能是那些与用户已评分项目相似的项目;第三,用户必须在系统中给相当数量的项目评分,才能保证基于内容的推荐系统真正了解用户的偏好并做出可靠的推荐,这就是推荐系统中的冷启动问题。

........

第二章 算法背景

2.1 推荐技术

通常来说,效用函数e 只考虑项目的一个属性;但是,效用函数也可以包含项目的多个属性。此时,传统推荐问题就被转化为多属性(Multi-Attribute)或多准则(Multi-Criteria)问题,相对应的推荐系统即多准则推荐系统。我们已基本明确了推荐和多准则推荐的核心问题,现在我们简要陈述基于内容的推荐算法和协同过滤算法的主要内容;它们是使用最为广泛并且也要在本研究中被使用到的推荐算法。基于内容的推荐算一般来说会将候选项目与之前用户已评分过的项目进行比较,并将最匹配的项目推荐给用户[20]。在基于内容的推荐算法中,项目i对用户u的效用 e ( u , i )可通过用户u 分配给项目 I’的效用 e ( u , i′ )来估算,其中i ′∈ I,表示所有和项目i“相似”的项目。相似性的计算方法将在 4.3 章中详细介绍。所有与项目i相似的项目的评分的加权和可以通过公式(2-1)计算。获得最高估计评分u ,ir的项目将会被推荐给相应的用户。

........

2.2 语义变量与模糊数

语义变量是指那些值是自然或人工语言的短语或句子的变量[59]。语义变量为我们提供了一种丰富而自然的方式来表达个人的判断和偏好[50]。语义变量的值,例如,真实(True)、很真实(Very True)、完全真实(Completely True)、不很真实(Not Very True)、不真实(Untrue)等等,引出了模糊集(Fuzzy Set)和模糊逻辑(Fuzzy Logic)的概念[60]。模糊集和模糊逻辑已经被大家公认为是一种有效的处理主观、模糊信息的工具。2001 年,文献[8]认为包含模糊集概念的模型可以被有效的应用到用户偏好模式挖掘以及个性化推荐中。用户偏好挖掘的目的是学习用户对于不同的服务或项目(如:电影、音乐)的偏好模式,它对个性化智能应用技术的发展至关重要。因此,正如我们在引言中提到的那样,为了强调用户偏好信息中的不确定性和模糊性,我们将会在本研究中引入语义变量和模糊数来获取用户信息。为方便后续讨论,我们在这里先简要给出模糊数(Fuzzy Numbers)、模糊算数运算(Fuzzy Arithmetic Operations)以及语义变量(Linguistic Terms)的基本定义[61-63]。需要特别指出的是,不同的模糊数会有不同的隶属度函数(MembershipFunctions)。最常用的隶属度函数包括:三角函数、梯形函数、高斯函数、S-函数和指数函数。确定隶属度函数在很大程度上带有主观性,且隶属度函数的选择只能在实际应用环境中来确定[64]。在本研究中,我们选择三角函数,原因是它可靠且易于理解。

........

第三章 混合多准则推荐算法 .............. 20

第四章 实验验证 ........................ 24

4.1 数据集 ........................ 24

4.2 评价指标 .......................... 31

4.3 相似性计算 .............................. 33

4.4 实验步骤 ................................. 35

4.5 实验结果与讨论 ..................... 36

第四章 实验验证

4.1 数据集

多准则推荐系统实验数据的获取被公认为这个研究领域的难点。虽然研究者们可以找到可用的单一准则真实数据(如,MovieLens, EachMovie, Netflix and Jesterdatasets 等等),但多准则推荐系统的实验验证要求使用具有多准则评分的数据集[27]。如果存在多准则评分体系下的大型真实数据集,多准则推荐系统的实验验证将被极大的促进。令人遗憾的是,这类大型真实数据集的缺乏仍然是这个领域目前最大的挑战[27]。目前,只有人工合成的(模拟)实验数据集或通过实验收集的小型数据集可用于多准则推荐系统的验证[45]。大多数研究人员没有足够的资源来收集足够的多准则评分数据用来验证他们的算法或假设,因而往往只能将他们的研究限制在初始阶段[27]。2006 年,文献[15]设计和发展了一种基于网络的工具,用来支持多准则协同过滤系统的模拟研究。他们提出的测试工具允许生成包含多准则评价的人造数据,并允许人为设定生成的数据的一些特征。但是,该工具并没有被公开和验证。目前所有提到了这个工具的文献都来自提出这个工具的同一研究团队。2007 年,文献[10]提出了一种新的用于多准则评分体系的推荐技术。他们从 Yahoo! Movies 收集了一个小型的真实数据集用于实验验证,数据集包含 155 个用户和 50 部电影。但是,该数据集既没有被公开也没有被验证;文献中也没有详细说明该数据集特征的统计信息。文献[50]提出了一种基于信任的推荐系统,该系统可用于对等生产服务(Peer ProductionServices)。这个推荐系统中引入 MCDM 方法来帮助服务选择的决策支持。因为没有合适的真实数据集,为了验证算法有效性,他们用小世界生成器(Small WorldGenerator)来做仿真。文献[52]提出了多准则决策支持系统用于增加电子商务领域的用户忠诚度,但他们仅仅举了一个例子来说明他们的算法,未做任何实验验证。文献[10]提出了一种混合推荐方法,该方法结合了推荐系统和 MCDM 方法的特征。

........

第五章 总结与未来的研究方向

随着计算机、互联网和信息技术的发展,人们充分享受着科学发展带来的便利。但是另一方面,信息过于丰富也带来了信息过载这一问题。信息处理系统对信息的反应速度要远远低于信息的产生以及传播的速度。需要处理的信息总量超过了信息处理系统能够接收、处理以及有效利用的范围,有时甚至会导致故障发生。推荐系统诞生于上世纪 90 年代,经过 20 年左右的充分发展,取得了许多研究及应用上的成果。推荐系统现在被认为是解决信息过载问题最成功的方法之一。但是另一方面,推荐系统在多准则环境下的研究与应用尚属起步,这方面的不少研究领域还处于空白状态。部分学者从近几年开始注意并强调推荐系统与模糊逻辑、多目标决策等研究领域的结合。他们也指出这个研究领域还存在许多问题,需要更加充分的研究。在前人的研究基础上,本文提出一种新颖的混合推荐算法用于提高多准则环境下推荐系统的推荐准确性,该算法的特点在于使用模糊逻辑描述用户偏好、用多准则评分来描述推荐系统中的项目属性。为充分利用经典推荐技术和多目标决策方法的优点,本文引入模糊逻辑来更为精准的捕获用户偏好信息,用户可使用自己熟悉的自然语言来描述他们对推荐系统中各个项目的偏好。同时,本文利用多目标决策中的 DEMATEL 和 AHP 方法来计算多准则环境下不同用户的不同准则权重。DEMATEL 方法可在用户难以确定多个准则之间的相互影响时采用;AHP 方法可在用户难以确定多个准则的相对重要性时采用。用户可在不同的情境下选择不同的方法来为多准则推荐系统中的准则确定权重,为更好的产生个性化推荐结果提供了可能。接下来,本文引入模糊TOPSIS 方法来整合用户的多准则评分并将其采用到推荐系统中。最后在所提出的算法中将基于内容的推荐算法和协同过滤推荐算法结合以提高算法效率。为验证所提出算法的表现,我们进行了一项在线网络调查收集真实多准则用户评分数据。该在线实验为期七个月,收集到了 335 名用户对 200 部电影的多准则评分数据。我们采用了推荐系统领域标准的算法衡量指标MAE及TOP-K Hit Rate验证算法表现,同时还引入了在营销学中用于衡量用户满意度的量表来验证所提出的算法是否能提高用户满意度。实验结果表明本文提出的算法可以显著的提高推荐系统在多准则环境下的推荐准确性,并在过个维度提高用户使用推荐系统时的满意度。

.......

参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100