背景及意义

云计算总是被认为是不可信或半可信的服务器,因为所有的服务器和存储在物理上位于云服务提供商(CSP)的场所。

这种不受信任的服务器往往会导致隐私和安全问题,一个主要的安全问题是数据的机密性。

数据机密性是为了确保敏感数据(如个人信息)不会被未经授权的访问。最近,密码学被认为是用于数据保密的有前途的方法。传统的搜索机制不适用于被加密的数据,其中一个解决方案是使用可搜索加密(SE),它允许用户以安全的方式搜索存储在云中的加密数据。

本文综述了文献中发展起来的可搜索加密方法,并根据使用的技术进行了分类。

可搜索加密(SE)

2000年,Song等人提出了SE方案的思想,解决了在云上搜索加密数据的问题。根据C. Bosch等人的说法,SE方案有六种SE技术,并且直到现在仍在快速增长。

这六种se技术包括可搜索对称加密(SSE)、带关键字搜索的公钥(PEKS)、基于身份的加密(IBE)、隐藏向量加密(HVE)、谓词加密(PE)和内积加密(IPE)。此外,最近的一项研究将多关键字排序可搜索加密(MRSE)视为一种新的搜索引擎技术。

它们还支持单用户架构和多用户架构。此外,为支持单关键字搜索、多关键字搜索和排序、子集查询和范围查询和模糊多关键字搜索所做的工作。

之前在SE上所做的大部分工作都是为了提高由对手活动激发的保密性。一些对手活动包括暴力攻击、搜索/访问模式泄漏和DDoS攻击。为了证明所开发的任何方案或算法足以抵御攻击或对手活动,系统模型和威胁模型被构建用于实验目的。

在其他工作中,其他技术,如私人信息检索(PIR)和全同态加密(FHE)被认为是在增强SE。

可搜索的对称加密方案

带有关键字搜索的公钥加密

基于身份的加密

基于身份的加密(IBE)算法是由Shamir在1984年提出的。

该方案使用用户的身份作为加密和解密过程的密钥。用户的身份密钥可以公开访问,这意味着任何人都可以使用它来发送消息。另一方面,只有拥有私钥的接收者才能解密消息。

例如,想象一下发送和接收电子邮件的类比,其中基于收件人姓名的收件人电子邮件地址用于从发件人发送电子邮件,而收件人可以使用他/她的电子邮件地址打开电子邮件。

PEKS是基于IBE发展起来的主要SE技术之一。由双线性Diffie-Hellman(BDH)构造的IBE系统证明了随机预言模型中的PEKS对于选择关键字攻击是语义安全的。X. Dong等人提出了一种安全、高效、可扩展的数据协作方案(SECO),以克服云通信中多用户设置加密、允许写入和更新查询等包含细粒度访问控制的问题。

这些只有通过采用两级分层的基于身份的加密(HIBE)才会发生。使用SECO,数据用多个接收者的公钥加密,只有那些拥有密钥的用户才被允许访问分配给他们的数据。在该方案中,构造BDH以确保SECO提供语义安全和概率性。

隐藏向量加密

隐藏向量加密(HVE)是一种谓词加密(pe),支持加密数据的联合等式和查询范围,如等式查询、比较查询和子集查询。HVE是一种特殊类型的PE,其中密文和令牌与属性上的两个向量相关联。在更高的层次上,当且仅当两个向量在分量上相等时,密文匹配令牌。

谓词加密

谓词加密(PE)允许用户在没有私钥的情况下对加密数据使用公钥。在PE 方案中,不是使用完整的私钥,而是将令牌提供给查询服务器。然后,查询服务器执行测试,以确保提供的令牌与密文匹配。如果测试成功,则查询服务器将加密数据转发给公共密钥所有者,而不向服务器透露任何信息。

动词 (verb的缩写)Goyal等人引入了基于属性的加密(ABE),它允许发送者通过设置策略来定义谁应该能够读取数据。在这个方案中,一个权威机构负责在属性和密文上分发私钥以及公式集。拥有分布式私钥的用户将能够解密密文,也能够读取明文。

X.A. Wang等人声称,与传统的公钥加密相比,通过将PE转换为PEFKS,PE可以实现更加复杂和灵活的功能。这种转换将允许该方案支持多个关键字搜索,这些关键字搜索支持合取或析取逻辑,而不仅仅是相等关系。根据J. Katz,匿名IBE(AIBE)和基于属性的加密方案支持在PE的框架下考虑的范围查询。

内积加密(IPE)

内积加密(IPE)首先由J. Katz等人提出,它是一种加密机制,允许对加密数据的访问进行更细粒度的控制(方便用户访问满足给定任务需求的数据)。

IPE密码或内积计算在PE、IBE和HVE使用最多。J. Katz等人还设法构建了属性隐藏方案,该方案处理不同于有效载荷隐藏的多项式时间谓词上的析取。有效载荷隐藏是实现更强的安全级别保证的安全概念,其中密文与隐藏所有信息的属性相关联,直到拥有密钥来解密。

有效载荷和属性隐藏在明文的密文隐藏方式上略有不同。对于属性隐藏,相关参数应与密文一起隐藏,而有效载荷隐藏只要求明文与密文一起隐藏。

多关键字排序搜索加密

N. Cao等人于2014年引入了加密云数据的多关键字排序搜索(MRSE)。该方案的主要思想是允许用户根据搜索请求,通过“内部产品相似度”关键字返回具有语义多个关键字的文档。为了安全和获得最相关的检索结果,MRSE从安全的k-最近邻(kNN)技术中选择数据库记录(pi)和查询向量(q)之间的k个最近的数据库记录。采用安全内积计算以设置严格的隐私要求来确保云通信的保密性。

然而,MRSE有三个主要缺点,如R. Li等人所定义的。首先,MRSE使用的是静态字典,需要为每一个额外的关键字重建字典,结果以无序的形式呈现,用户很难获得最相关的文件,最后,MRSE不考虑关键字的权重和访问频率,关键字的文件不在结果的顶部列表中。

因此,R. Li提出了一种新的灵活的多关键字查询方案MKQE来克服MRSE的缺点。MKQE通过实现分块矩阵方法成功地解决了关键字字典扩展问题。此外,MQKE使用索引文件中关键字的权重来解决匹配结果集中的无序问题。

私人信息检索

隐私信息检索(PIR)协议允许多个读者从多个数据库中检索第I个n位数据,而不会向服务器透露任何信息,包括访问/搜索模式。与明显的n位解决方案相比,PIR的通信复杂度更低。1995年,E. Kushilevitz等人首次提出了这一概念。

虽然PIR中的数据在存储到服务器时总是以不加密的方式存储,但是PIR已经被se工作中的大多数研究者所引用,因为它的特性支持SE的保密性和效率。

全同态加密FHE方案是另一种技术,通过重新线性化(也就是将密文的大小减少到n+1的过程)来确保密文大小缩短和解密复杂性降低。根据Gentry的说法,FHE方案的安全性足够强,并且在语义上是安全的。Z. Brakerski已经通过将对称密文转换成同态密文而无需额外的通信,在SE中应用了FHE。X. Yi等人使用FHE开发了具有PIR协议的单数据库,该协议允许在块数据库中仅逐位加密数据。这导致通信复杂度O(ylog m+yn/m)高于O(log2n)。使用PIR,通信严格小于n。

另一方面,L. Tajan等人将PIR协议和某种同态加密(SHE)与SE结合在一起,以隐藏受计算影响的数据存储证据。

比较分析

影响云上SE性能的四个主要因素分别是效率、保密性、架构和关键字搜索。

因素 特性
秘密 加密/解密时间复杂度、攻击、访问控制
效率 密钥大小、索引大小、查询时间
体系结构 用户设置、数据库设置
关键字检索 单一关键字、多个关键字、布尔关键字、模糊搜索