本文是一篇软件工程论文,本文利用SVD、2D-DWT和张量分解等理论和技术研究视频哈希算法,并提出了两种高效的视频哈希算法。第一种是基于低秩帧的视频哈希算法;第二种是基于张量分解的视频哈希算法。两种算法在鲁棒性和唯一性方面均能达到良好的平衡,分类性能也优于实验中用于对比的视频哈希算法。
第1章 绪论
1.1 研究背景与意义
视频是一种信息高度集中且表现形式丰富的内容载体,丰富了人们对于生活中碎片化时间的利用,也是当前在网络上应用极为普遍的信息传递媒介。在云时代,通过智能手机就可以简单地拍摄、制作和剪辑视频文件,并将这些视频上传到互联网中进行存储和分享。人们在享受互联网给生活带来便利的同时,也面临着许多实际问题和挑战。例如,同一个视频的多个拷贝副本的可能被用户同时存储在Google Drive、OneDrive和iCloud等网络存储服务提供商的服务器中,这些副本的编码方式和视频文件数据可能发生了改变,但它们在视觉内容上依然是相似的。这些副本浪费了大量的网络存储空间[1],如何快速地查找出所有副本是一个亟待解决的难题。
此外,随着智能手机性能的日益提升,功能完善且易于使用的视频处理软件大量涌现,利用智能手机就可以轻易地对视频进行修改和编辑。对视频进行正常的修改和编辑可以对其美化,但如果是恶意的篡改则会对网络信息安全造成隐患,严重的甚至会影响社会稳定。例如,某些居心不良的用户从网上下载视频,然后通过各类视频操作手段恶意篡改视频内容,再通过多个账号发布到网络中以此营造热点舆论事件进行牟利。又或是盗用过往新闻和事件,甚至是暴恐视频,获取关注度。例如,2022年初有部分用户在抖音等平台上发布2020年疫情新闻,营造社会恐慌。同时,还有部分用户利用AI换脸技术将他人的脸拼接到不雅视频中以此来诋毁和中伤他人。因此,保护视频内容不受到恶意的原因而遭受更改和破坏[2],已经成为多媒体安全领域的重要课题。
...............................
1.2 视频哈希简介及其性能指标
传统的密码学哈希算法(例如:SHA-1、SHA-256和MD5等)是一种单向映射,可以将任意长度的输入映射为固定长度的输出,即使一位比特的输入数据变化都会造成输出截然不同,主要用于鉴权、加密和索引等。视频哈希算法不同于传统的密码学哈希算法,对于同一个视频哈希算法,它能在相同的参数设置下,将经过压缩、旋转和剪辑等数字操作的视觉内容相似视频映射为一串相同或相似的哈希序列[19]。视频哈希算法的经典框架如图1.1所示。
软件工程论文怎么写
在一般情况下,设计视频哈希算法时应该关注五个性能指标[20]:鲁棒性、唯一性、安全性、时间效率和存储代价。详细介绍这些性能指标之前,先定义必要的数学符号。用V表示输入视频,oriV表示原始视频,其视觉相似的副本记为sameV,其视觉内容有明显差别的视频记为diffV。H(⋅)和P(⋅)分别表示哈希函数和事件发生的概率函数。D(,)表示视频哈希之间的距离函数。T是阈值,取值需要根据算法的实际用途选取。ε是一个无限接近于0的正整数。
.................................
第2章 基于低秩帧的视频哈希算法
2.1 算法描述
本章提出的基于低秩帧的视频哈希算法由以下三个步骤组成:视频预处理、低秩帧计算和低秩帧压缩。本章算法的计算过程示意图如图2.1所示。首先,将输入视频进行预处理,得到标准化视频。然后,将标准化视频进行分组并构造为高维矩阵。接着使用SVD计算低秩帧。下一步,使用2D-DWT对低秩帧进行压缩,利用低频小波系数的均值构造哈希元素,再将所有哈希元素串联得到视频哈希。后续小节将分别介绍视频预处理、低秩帧计算和低秩帧压缩的详细计算过程。
SVD是一种有用的数据分析技术[82,83],被广泛应用在信号处理[84]、推荐系统以及数据压缩[16,85]等方面。它可以将任意矩阵进行分解,其中包含两个表示旋转变换的正交矩阵和一个表示伸缩变换的对角矩阵。2D-DWT是一种有用的时频分析方法,已广泛应用于图像处理、视频处理和机器学习等领域。本章利用SVD和2D-DWT提出了一种基于低秩帧的新型视频哈希算法。本章算法对多种视频处理手段鲁棒,能抵抗多种角度的视频旋转攻击,对于不同视频也具有良好的区分能力。同时,该算法的性能相比于一些文献中提出的视频哈希算法[34,51,55,69,70]更好。本章算法的主要贡献概括如下:
(1)提出一种基于奇异值计算的低秩帧构造技术。具体而言,首先将视频分成由若干个包含相同帧数的视频组,接着将每个视频组构造为一个包含时域信号的高维矩阵,然后将高维矩阵用SVD进行分解,接着使用较大的奇异值计算高维矩阵的低秩帧。由于SVD方法对大部分数字操作是稳健的。因此,从利用奇异值计算的低秩帧中提取的视频特征也具备很好的鲁棒性。此外,由于视频组的大多数能量值都包含在较大奇异值中,这也充分保证了视频哈希的唯一性。
(2)利用2D-DWT压缩低秩帧。使用2D-DWT将低秩帧逐个压缩,选择低频小波系数的均值统计特征作为该低秩帧的哈希元素。由于低频小波系数是对原始数据的压缩,因此可以近似的表示低秩帧,提升了算法的唯一性。
..................................
2.2 实验结果和分析
在接下来的实验和分析中,本节先是分析了算法的鲁棒性、唯一性和存储代价,然后对实验参数进行了讨论。具体来说,在第2.4.1节、第2.4.2节和第2.4.3节实验分别讨论了本章算法的鲁棒性、唯一性和哈希存储代价。低秩帧的秩和视频组帧数的参数选择分别在第2.4.4节和第2.4.5节进行讨论。在本节后续内容的实验中,本章算法所设置的实验参数如下:α=256、β=256、γ=256、N=16和r=2。因此,视频哈希的长度是L=γ/N=16。
2.2.1鲁棒性
为了分析本章算法的鲁棒性,从澳大利亚昆士兰大学公开的视频数据库[86]中选取前150个编号的视频来生成原始视频的相似视频作为实验数据集,这些视频内容包括海藻、海龟、海鞘和海葵等海洋生物,这些视频都使用AVI格式进行编码,分辨率均为384×288,视频的帧数最低为66帧,最高为2751帧。
在本节实验中,将使用一些常见的数字操作对这些原始视频进行鲁棒性攻击。这些鲁棒性攻击分为内容保留攻击、内容改变攻击和噪声攻击。其中,内容保留攻击包含亮度及对比度调整、MPEG-2及MPEG-4压缩、帧的缩放平移和随机交换、高斯低通滤波。内容改变攻击包含帧旋转、随机加帧及丢帧。噪声攻击包含加性高斯白噪声、椒盐噪声、斑点噪声。上述数字操作共计11种,表2.1列出这11种数字操作的详细攻击参数,总共包含110种数字操作。这样每个原始视频都会生成110个视觉相似的副本,因此总共生成了150×110 =16500个原始视频的视觉相似副本。在本节实验中所用到的视频共有150+16500 =16650个。
...........................
第3章 基于张量分解的视频哈希算法 .......................... 32
3.1 算法描述 ....................................... 32
3.1.1 视频预处理 ........................................ 33
3.1.2 视频特征提取 ................................... 33
第4章 总结与展望 ................................. 51
4.1 总结 .................................. 51
4.2 展望 ........................................ 51
第3章 基于张量分解的视频哈希算法
3.1 算法描述
本章算法主要由以下三个步骤组成:视频预处理、视频特征提取和张量分解。算法的流程框图如图3.1所示。首先,对输入视频进行重采样和高斯低通滤波等一系列操作进行预处理,得到标准化视频。然后从视频分组中提取特征来构造一个特征张量。最后,对特征张量进行分解,得到唯一的因子矩阵作为哈希元素,再将哈希元素量化得到视频哈希序列。以下小节将分别介绍视频预处理、视频特征提取和张量分解的详细计算步骤。
软件工程论文参考
3.1.1 视频预处理
为了统一视频哈希的长度,并减轻一些数字处理给视频造成的失真,需要对输入视频进行预处理。首先,如果输入视频是彩色视频,则利用公式(2.1)将其映射到b rYC C颜色空间中,并使用亮度分量Y来代表这个视频,如果输入视频是灰度视频则不进行该处理。下一步,分别在时域和空域进行重采样。使用双线性插值对视频空域进行重采样,将每帧的分辨率调整为α×β,然后再利用线性插值对视频时域进行重采样,将帧数调整为γ。最后使用3×3高斯低通滤波对视频进行处理。经过预处理后,得到了尺度为α×β×γ的标准化视频。
.................................
第4章 总结与展望
4.1 总结
视频是一种信息高度集中且表现形式丰富的内容载体,随着多媒体技术的发展,视频已经成为网络上应用极为普遍的信息传递媒介。在云时代,越来越多的视频被上传到网络中,形成了多媒体大数据。视频哈希是一种能在大规模数据中用于视频内容管理和保护的高效技术,已被成功应用于视频的检索、拷贝检测和认证等方面。本文利用SVD、2D-DWT和张量分解等理论和技术研究视频哈希算法,并提出了两种高效的视频哈希算法。第一种是基于低秩帧的视频哈希算法;第二种是基于张量分解的视频哈希算法。两种算法在鲁棒性和唯一性方面均能达到良好的平衡,分类性能也优于实验中用于对比的视频哈希算法。主要内容总结如下。
(1)第2章提出一种基于低秩帧的视频哈希算法。该算法运用SVD构造低秩帧,通过2D-DWT对低秩帧进行压缩,用小波系数的均值生成哈希。该算法对多种视频处理手段鲁棒,能抵抗各种角度的视频旋转攻击,具有良好的唯一性。同时,算法的性能优于一些文献提出的视频哈希算法。算法的主要的贡献是使用SVD的低秩近似进行低秩帧计算。由于大的奇异值对数字操作是稳定的,所以使用低秩帧进行视频哈希提取可以提供良好的鲁棒性。同时,在低秩帧中大多数的能量包含在大的奇异值中,也有助于提高算法的唯一性。
(2)第3章提出一种基于张量分解的视频哈希算法。该算法首先将输入视频进行空域重采样、时域重采样和颜色空间转换等处理,然后从处理后的视频中提取特征来构造特征张量,接着利用一种名为CP分解的张量分解技术对特征张量进行分解,最后对分解得到的秩一张量进行量化得到视频哈希。由于CP分解具有唯一性,因此使用因子张量构造的视频哈希的唯一性较好。其次,利用相邻视频帧的规律和差异作为视频特征构造的特征张量,能够在经过有损压缩、对比度调整等数字处理后保持相对不变,这能同时提高鲁棒性和唯一性,并且可以抵抗多种数字操作处理带来的失真。
参考文献(略)