云环境下安全高效的多关键词密文检索技术探讨

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw202329701 日期:2023-07-22 来源:论文网

本文是一篇软件工程论文,本文主要针对外包云环境下多关键词排序检索提出相应的解决方案,分别为基于关键词分组倒排索引结构的Top-k检索方案以及云环境下可验证的多关键词排序检索方案。这两种方案分别着重于解决云环境下多关键词密文排序检索的隐私保护问题和一致性验证问题。
第一章 绪论
1.1 研究背景与内容
云计算是由并行计算、分布式计算等相关技术发展而来。它是指通过网络将互联网中的软、硬件资源组织在一起,为用户提供巨大的存储、计算等资源。它是一种新型的计算模式,能够将复杂的程序分解为单机可运行的无数小程序,以便通过多部单机协调有序的完成复杂的计算,并将结果返回给用户。由于这一系列过程对于用户而言是透明的,并且可以根据不同的业务需求来增加或删除“云”中的机器,以及云服务提供商提供的可定制化的服务器等,这都使得云计算技术快速风靡起来[3,4,5]。
然而,云计算的快速发展也带来一系列的问题。由于云服务器是由第三方提供,用户将失去对外包到云中数据的控制,存在安全问题。因此,一部分企业或者个人对云计算技术持观望态度,这也使得云计算技术的发展和应用受到阻碍。人们对于云计算主要有两个方面的担忧。首先,用户关心的是外包数据的隐私问题,外包到云中的数据能否受到很好的保护,即数据除了数据拥有者及授权用户以外,不能被第三者获得,包括云服务器提供商。因为外包到第三方云服务器中的数据可能包含企业的商业机密或者个人的隐私数据,一旦数据泄露将会对企业或个人带来不可估量的损失。虽然云服务器提供商提供了诸如防火墙、访问控制等安全措施,但近年来云服务器遭到内、外部攻击的案例屡见不鲜。因此,将数据的隐私保护完全交给云服务器不现实也不可取。其次,用户关心的是外包数据的一致性问题。云服务可能会因为受到攻击、系统故障、财务激励等导致用户得到的执行结果是不完整的甚至是错误的。例如,云服务器提供商可能会为了节约计算成本,只在部分数据集上执行用户的命令,并将该结果返回给用户。由于得到的结果是部分解或者是错误解,可能会影响用户执行下一步决策。当前,外包云计算所面临的这些问题,都将阻碍云计算技术的进一步发展和应用[6]。
..................................
1.2 课题研究现状
外包云数据计算模式主要包含两方面的安全隐患:一方面是用户失去对外包到云服务器中的数据的控制,可能存在外包数据的泄露问题;另一方面是由于云服务可能受到黑客攻击或者云服务器自身对外包到云端的数据好奇,通过分析检索陷门、路径以及检索结果等不断试图破解外包数据,从而获得隐私数据。
外包数据脱离用户控制所带来的的隐私泄露问题,可以通过外包数据前就对数据进行加密处理来解决。这也是绝大部分可加密搜索所采用的方案。一般采用对称加密、非对称加密等技术来对数据进行加密。只要保证密钥的安全性,就可以避免外包数据被不可信的第三方窃取。而应对云服务器通过分析检索陷门、检索路径以及检索结果等来分析、破解加密外包数据的问题较为复杂。针对这方面的研究也有很多,其中方案[10,14,27,28,31,56-58]可以保证检索陷门的安全性,方案[28,32,37]可以保证检索路径的安全性,方案[40]可以保证检索结果的安全性。但是他们却不能同时能够保证检索陷门,检索路径和检索结果安全性。
自Song[6]等人第一次提出可搜索加密方案以来,研究者们对提高可搜索加密方案的检索效率的研究就没停止过。Goh[7]等人基于布隆过滤器和对称加密方法提出了一种新的方案,在该方案中检索时间与数据集合的大小呈线性关系。Curtmola[8]等人首次将应用在明文检索中的倒排索引结构应用在密文检索中,大大减少了检索时间。
以上是针对单关键词检索时间的优化,对多关键词检索效率的提升更具有实际意义。Cao[9]等人第一次提出了针对多关键词的密文排序检索的方案MRSE,提高了检索精度,但是他的方法依然是线性检索,检索效率较低。Xia[10]等人基于平衡二叉树机构提出了多关键词排序检索方案(DMRS),该方案采用树形索引结构组织文档向量,并采用深度优先检索算法,通过自顶向下的剪枝策略进行检索,不断求出与检索关键词集合最相关的前k个文档。该方案使得检索时间降低到log级别,但是该方案依赖剪枝效果,并且当文档集合较大时,索引结构将会变得异常庞大,普通单机无法构造索引结构。同年,Chen[11]等人采用凝聚层次聚类算法提出了一种高效检索方案(MRSE-HCI)。在该方案中,用户首先采用聚类算法将文档集合进行自顶向下划分,直至每个聚类簇中的文档数量达到阈值。每次检索时,都只在与检索关键词集合最相关的文档聚类簇中进行检索,直至找到满足条件的前k个文档。该方案虽然提高了检索效率,但是大大降低了检索精确度。
.................................
第二章 相关工作
2.1 云计算概述
随着互联网、物联网企业的快速崛起,致力于提供数据外包存储与计算的云计算技术得到快速发展。云计算的诞生解决了企业存储数据和进行复杂计算的难题,企业和个人只需按需租用云服务器就可将庞大的存储和复杂的计算外包给第三方云,节省了资源布置和维护的成本。就目前而言,常见的云服务提供商主要由各互联网巨头承担,包括:亚马逊AWS、阿里云、华为云、腾讯云、谷歌云、微软云等。各个云服务器提供商都对云计算有着自己的定义,在众多定义中,最受大家认同的是如图2.1所示的将云计算[15-20]划分成三大服务类型,四大部署模型和五大基本特征的定义。


软件工程论文怎么写

正如云计算基本架构所示,它以独特的分布特征为用户提供类本地化的服务,并且可以根据计算的任务量,将任务切分成一个个可以在单机中运行的子任务,并通过并行运算的方式为用户提供超强的计算能力。在云计算中,主要包括六个部分,分别为:云消费者(Cloud Consumer)、云提供商(Cloud Provider)、云开发者(Cloud Developer)、云代理者(Cloud Broker)、云审核者(Cloud Auditor)、云载体(Cloud Carrier)。这六部分协同合作,为用户提供各式各样的服务,并以其绝对的优势正在快速风靡市场。总结来说,其优势主要包含以下几个方面:
(1) 按需计费,节约成本
云服务提供商以其专业的服务和协调统一的管理为用户提供低成本的计算、存储资源,并且用户不需要一次性购买,可以根据业务需求量动态的进行增加或删除服务,以节约成本。此外,云服务提供商专业、统一的维护成本也较企业自己开发、维护成本较低。
(2) 快速部署、可定制化服务
目前,云计算行业发展迅速,各大云服务器提供商提供了大量适用于市场需求的云服务需求,甚至可以提供定制化的服务器,极大的方便了用户的需求以及更新迭代的成本。此外,巨大的云服务池和专业的云服务团队可以实现快速部署新的业务集群,可以有效解决因服务器访问量暴增而导致的业务停滞的现象。
...............................
2.2 密码学基础
本节主要介绍在外包云环境下执行多关键词排序检索时所使用到的密码学基础知识,主要包括对称加密算法、非对称加密算法以及常见的攻击方式等。
2.2.1 加密算法
加密算法[21-24]主要是通过某种计算方式将明文形式的数据转化为不可读的密文形式的数据。通过该算法可以保护隐私,保障数据的安全性。常见基础加密算法主要包含对称加密算法和非对称加密算法。
(1) 对称加密算法
对称加密算法[25]也被称为共享密钥加密算法,该加密算法的加密密钥和解密密钥相同,密钥的安全性决定加密算法的安全性。对称加密算法的流程如图2.2所示,数据发送方通过将加密密钥安全的传递给数据接收方来实现密文的加密与解密过程。对称加密的计算开销小,是最基础也是最主要的加密算法,但是由于密钥的安全性决定加密算法的安全性,因此保护对称加密算法的关键在于保护密钥。其常见的对称加密算法有DES、AES、3DES等。
(2) 非对称加密算法
非对称加密算法[26]与对称加密算法不同的是,加密的密钥与解密的密钥不同。一般而言,加密密钥是公钥,不需要保护;解密密钥为私钥,需要保护。图2.3为非对称加密算法的过程,数据使用公钥加密,私钥解密。因此,非对称加密算法的安全性较高。其常见的非对称加密算法包括RSA、DSA等。
...............................
第三章 基于KGI-index的Top-k密文检索方案 ............................... 14
3.1模型与问题描述 .......................... 14
3.1.1 系统模型 ............................ 14
3.1.2 问题描述 .................................. 15
第四章 可验证的多关键词密文排序检索方案 ..................... 44
4.1模型与问题描述 ................................ 44
4.1.1 系统模型 ................................. 44
4.1.2 问题描述 ................................... 45
第五章 原型系统的设计与实现 ................................. 60
5.1 需求分析 .................................. 60
5.2 系统设计 ................................... 60
第五章 原型系统的设计与实现
5.1 需求分析
正如第三章所描述的,我们的KMRS方案的原型系统主要包括三个部分:数据拥有者,数据使用者以及云服务器。各部分的功能也在介绍KMRS方案中进行了详细的介绍和分析。数据拥有者首先对数据进行预处理,提取出关键词,并将文档向量化。然后对关键词进行聚类,并将聚类后的关键词划分成关键词分组,然后针对每个分组生成其对应的倒排列表,并将其加密后外包给云服务器。当检索时,数据使用者首先会根据检索要求生成检索陷门,并将其加密后发送给云服务器。接着云服务器根据检索陷门,在索引上进行检索,然后将检索结果返回给数据使用者。为了保证在云环境下多关键字排序检索的安全性,准确性以及高效性,系统原型设计目标如下:
(1) 检索过程的正确性:系统原型应严格按照第三章中的系统框架进行设计,设计出的系统应与KMRS方案的细节一致,检索过程能够正确无误地表达KMRS方案的思想。
(2) 检索过程的安全性:在KMRS方案的执行过程中,应始终保证文档、陷门、关键词、检索模式、检索路径等的安全性与隐私性。


软件工程论文参考

...............................
第六章 总结与展望
6.1 工作总结
在大数据背景下,数据的重要程度不言而喻。随着云计算技术的快速发展,为存储大量数据提供了有效的解决方法。云计算凭借其高性能、可定制、高响应、低成本、高可靠性等优势迅速赢得中小企业和个人用户的青睐。在外包云环境下,用户可以随时随地的访问数据,并且可以根据业务需求动态的增加或删除服务器数量,以达到节约存储和计算成本的目的。然而,尽管云计算技术有着不可替代的优势,但是同样也存在一些问题,影响着云计算的大规模应用。例如,当用户把数据外包给云服务器后,用户就失去了对数据的管辖权。如何保证外包数据的安全与隐私性,以及如何能够安全高效的检索和访问外包云中的数据成了影响使用云计算技术的一大难题。
本文主要针对外包云环境下多关键词排序检索提出相应的解决方案,分别为基于关键词分组倒排索引结构的Top-k检索方案以及云环境下可验证的多关键词排序检索方案。这两种方案分别着重于解决云环境下多关键词密文排序检索的隐私保护问题和一致性验证问题。 针对KMRS检索方案,我们首先给出了方案的模型与问题描述,包括系统模型、威胁模型、问题描述以及检索框架等,将该方案所要解决的问题和方案框架进行了详细的描述。接着对传统倒排索引结构进行改进,提出了基于关键词分组的倒排索引结构,在该结构中,我们首先对关键词进行分组,使得每个关键词分组所对应的文档数量一致,然后再为每个关键词分组生成一个倒排列表。紧接着我们通过对关键词进行聚类以及采用树形结构组织倒排列表等措施来优化索引结构。通过我们的理论分析和实验证明,本文提出的云环境下基于关键词分组倒排索引结构的多关键词排序检索方案能够实现云环境下安全、高效的多关键词排序检索。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100