一、浅析视频非线性失真测量(论文文献综述)
张国明[1](2021)在《基于非线性特性的语音安全和声波通信关键技术研究》文中进行了进一步梳理随着物联网技术与人工智能的快速发展,人与设备、设备与设备之间的交互和通信变得越来越普遍和智能。声波作为一种重要的信息载体,已被广泛应用于人机交互(Human–Computer Interaction,HCI)和设备与设备(Device-to-Device,D2D)之间的通信。然而以语音识别系统为代表的智能人机交互技术在带来便捷的同时,也面临着新的安全风险;对于声波通信来说,由于智能设备自身音频接口的特点,如何实现通信过程的无声且高效传输成为声波通信广泛应用的关键。本文针对智能语音设备的安全分析、防护问题以及智能设备间无声高速的声波通信问题,提出了相应的解决方案。1.针对智能语音设备面临的安全问题,本文分析了麦克风电路的硬件特性,并首次发现了电路中存在的非线性作用。基于该硬件漏洞提出并实现了一种无声的攻击方式:“海豚音攻击”(Dolphin Attack)。“海豚音攻击”通过对任意语音命令进行高频调制并利用电路中的非线性作用,可以以无声的方式将语音命令注入麦克风电路中,随后语音信号将被解调和恢复,从而被语音助手识别,最终控制智能设备进行相应的操作,包括无声激活Siri,并在i Phone上发起Face Time通话等。因此,攻击者可以在用户不知道的情况下操纵其智能设备,造成隐私泄露,财产损失等一系列的安全问题。2.针对智能语音助手面临的安全风险,本文提出了“海豚音攻击”安全防护技术,设计并实现了一种轻量级无需增加设备硬件的安全检测方法:Ear Array,它不仅可以对“海豚音攻击”进行检测,还可以确定攻击者的方位。本质上,无声的语音指令是一种频率较高的超声波信号,在空气中传播时,其固有的衰减速度比低频可听的声音衰减更快,特别是在遇到障碍物(智能设备)时,其衍射能力较弱,智能设备周围的超声波声场分布变得不均匀。基于声波传输的物理特性,提出了高频攻击指令和正常语音指令的传播模型并验证了可行性。通过智能设备上内置的多个麦克风对声场不同位置的声音进行捕获,提取与声场分布相关的特征,结合机器学习(Machine Learning,ML)的方法,实现对攻击信号的识别。为了提高Ear Array的性能,本文还首创的提出了一种新型的空间麦克风阵列形式,这也为智能设备生产厂商在设计麦克风阵列时提供建设性的参考建议。最终,本文使用两个自制的麦克风阵列对Ear Array的性能进行验证,实验表明Ear Array对攻击检测的准确度可达99%,定位准确度为97.89%。该方法可以很方便的移植到智能设备上,为语音识别系统的安全提供有力的保障。3.针对智能设备无法同时实现无声且高速率声波通信的问题,本文提出了一种基于非线性作用的声波通信方法。由于无需增加额外的硬件,声波通信已成为智能设备间通信的研究重点并可以服务于多种移动应用,例如移动支付,数据共享等。目前,声波通信的研究集中于如何使用可听频带或不可听(超声波)频带进行通信。前者获利用了比较宽的频带,通信速率比较高,但可以听得到声音,用户体验性差;后者使用超声波频带,虽然听不见,但可用的带宽(20–24k Hz)有限(大多数智能设备音频接口的采样率为48k Hz),因此通信速率较低。为了解决无声和高通信速率无法同时实现的问题,本文从全新的维度提出了一种智能设备间声波通信的方法:Ultra Comm。Ultra Comm采用正交频分复用技术(Orthogonal Frequency Division Multiplexing,OFDM)将传输信息调制到可听的频段(频带范围:0-20k Hz),在发射之前,将该声波信号调制到超声波上以实现高速和无声的通信,在接收端,利用麦克风电路的非线性效应,对接收到的高频信号进行解调,恢复出OFDM信号,然后对此信号进行解码。本文提出并建立了一种基于非线性的声波通信模型,从理论上分析了Ultracomm的最大吞吐量。最后,本文在7种不同的智能设备上实现并验证了Ultra Comm的性能,其通信速率高达16.24kbps,是目前最高通信速率的4倍。
董武[2](2021)在《基于剪切波变换的图像质量评价方法研究》文中提出图像失真会使图像丢失信息,并使图像的质量下降,从而影响使用者的主观视觉感受。对于图像处理系统来说,进行图像质量的识别和客观量化评价是一项必不可少的工作。本文基于剪切波变换的特点并结合人眼视觉的感知特性,从四个方面对图像质量的评价进行了深入的研究。论文的主要工作如下:1.提出了一种在剪切波域中基于多尺度多方向感知差值(Multiscale and Multidirectional Perceptual Error,MMPE)的全参考自然图像质量评价方法,该方法能够解决现有的全参考方法中方向特征不明显的问题。该方法使用剪切波变换,并结合人眼的多个底层心理视觉特性,能够提高评价精度。首先,为了模拟人眼视觉的多通道机制,使用剪切波变换对图像进行分解,得到多个尺度和多个方向的子带。然后,在子带中定义局部方向带限对比度和视觉恰可感知差异门限。在处理视觉隐藏问题时,同时考虑了对比度隐藏效应和熵隐藏效应起到的作用。最后,把所有子带的多尺度多方向感知差值组合在一起作为图像质量的评价结果。实验结果表明,该方法比目前主流的评价方法具有更好的质量评价性能。2.提出了一种在剪切波域中基于子带结构相似性(Shearlet Transform Subband Structural similarity,STSS)的全参考自然图像质量评价方法,该方法能够解决严重失真的图像中空间结构特征受到破坏的问题。在该方法中,首先使用剪切波变换分别把参考图像和失真图像进行分解,得到多个不同尺度和不同方向的子带;然后,计算参考图像和失真图像每个子带之间的结构相似性;最后,根据人眼视觉的感知特性,对不同尺度和不同方向子带的结构相似性使用不同的权值进行加权求和,作为失真图像质量的评价结果。实验结果表明,此方法对于严重失真的自然图像具有更好的质量评价性能。3.提出了一种在剪切波域中基于区分归一化变换系数统计特征(Statistical Features of Divisive normalization transform coefficients in the Shearlet domain,SFDS)的部分参考自然图像质量评价方法,该方法能够解决现有的部分参考方法中线性变换子带系数之间存在着较强统计相关性的问题。首先,对图像剪切波域中子带的系数进行区分归一化变换,其目的是减少剪切波变换系数之间的统计相关性。然后,使用高斯分布近似描述归一化系数的统计分布,同时计算高斯分布和实际分布之间的差值,并把此差值和实际分布的统计特征作为图像子带的特征。最后,根据人眼的视觉感知特性,对不同尺度不同方向子带的特征设置不同的加权值,并把失真图像和参考图像在子带特征之间的相似性组合在一起,作为失真图像质量的评价结果。实验结果表明,该方法能够获得较好的质量评价效果。4.提出了一种基于分区域结构特征(Regionalized Structural Features based Evaluator,RSFE)的无参考屏幕内容图像质量评价方法,该方法能够解决屏幕内容图像中图像区域和文本区域具有不同特点的问题。首先,使用剪切波局部二值模式提取图像区域在剪切波域的多尺度多方向纹理特征,同时使用局部微分模式提取图像区域在空间域的纹理特征。对于图像区域,使用纹理特征作为它的结构特征,同时使用亮度特征作为它的辅助特征。对于文本区域,使用从多阶微分值中提取出来的方向梯度直方图作为它的结构特征。然后,把图像区域和文本区域各自的特征分别提供给支持向量回归,得到这两部分各自的质量评价结果。最后,使用活动性加权策略,把这两部分的质量评价结果组合在一起,作为屏幕内容图像整体内容质量的评价结果。实验结果表明,此方法比已有的屏幕内容图像评价方法获得了更好的质量评价效果。
桂永强[3](2021)在《面向稳健多媒体传输的资源分配机制研究》文中提出随着无线网络的广泛部署以及智能终端设备的普及,体育赛事转播、网络直播、云游戏等多媒体应用蓬勃发展,以图像视频为主的多媒体业务流量也大幅增加。然而,高度动态的无线传输环境、异构终端设备以及海量数据流量都给无线多媒体传输机制的设计带来了严峻挑战。现有的模拟传输和数字传输机制,在各自发展的历史阶段均取得了显着性能,但是在实际部署中仍存在一些问题。其中模拟传输存在易受干扰、色度畸变、亮度串扰、清晰度低等缺点,影响用户感知体验。基于香农信源信道分离定理发展起来的数字传输在点对点通信且已知精确信道状况情况下,能够实现最优传输性能。然而数字传输在估计信道状况和实际信道状况不匹配时,将发生“悬崖效应”和“饱和效应”,严重影响系统性能。同时在多播广播场景下,为了保证所有用户均能正确解码,数字传输会采用保守的码率选择策略,导致信道利用效率低下且对多用户不公平。稳健传输是解决模拟传输和数字传输上述问题的一种新的传输机制。稳健传输去除了数字传输中的非线性操作,在对原始图像视频进行去相关变换之后,直接对去相关系数进行功率缩放,然后将功率缩放系数映射到物理层符号的正交和同相分量并传输出去。由于整个系统是线性的,稳健传输能够从根本上消除数字传输中的悬崖效应和饱和效应。在稳健传输中进行适当的资源分配能够有效对抗衰落和噪声,然而目前稳健传输中的资源分配机制尚处于起步阶段,在一些复杂场景下无法取得最优性能。鉴于稳健传输中资源分配的重要性以及现有研究的不足,本文分别针对带宽受限场景、用户分辨率异构场景研究稳健传输资源分配机制,同时考虑基于大规模天线阵列毫米波等下一代通信技术,以提升稳健视频传输效率及动态信道适应性。本文研究内容包括以下几部分:1)提出了带宽受限场景下遥感图像压缩稳健传输机制。在带宽受限的情况下,原始稳健传输中简单的数据块丢弃策略不再适用于遥感图像。与自然图像不同,遥感图像包含了较多结构信息,去相关变换之后能量不再聚集于低频部分,而是散布在整个频段。针对这种情况,本文引入压缩感知技术,设计带宽受限场景下遥感图像压缩稳健传输机制,以充分利用遥感图像变换域中频和高频系数的稀疏性。基本策略是对重要性较高的系数直接进行稳健传输,重要性次之的系数经过压缩感知之后再进行稳健传输。考虑引入压缩感知带来的信源失真,首先对所提方案的系统失真进行分析,然后构建关于带宽和功率的系统失真最小化问题。针对这样的混合整数连续优化问题,本文提出两步资源分配算法以较低复杂度解决该问题。仿真结果表明压缩感知能充分利用遥感图像变换域中频和高频系数的稀疏性,且所提两步资源分配算法在带宽受限场景下能有效提升系统性能。2)提出了用户分辨率异构场景下多载波稳健视频传输机制。稳健传输中广播场景下的多用户分辨率异构问题并未受到考虑。为解决该问题,本文首先提出一种空域分解方法以支持多用户差异化的分辨率请求,并保证传输带宽的有效利用。同时考虑正交频分复用系统中不同子载波之间信道增益差异性以及信源内容重要性的差异性,构建基于载波匹配与功率分配的传输失真最小化问题。由于0-1匹配变量的存在,该问题是一个混合整数非线性规划问题,因此将其解耦并进行求解。对于功率分配子问题,通过对多用户失真耦合的转换处理,推导出功率缩放因子的最优闭式表达。对于载波匹配子问题,将其建模为竞价问题并利用竞价算法给出低时间复杂度的最优解。最后利用交替优化对主问题求解并给出算法收敛性分析。同时提出类模拟信道反馈机制以降低广播场景下的信道反馈开销。仿真结果表明所提方案能够支持多用户分辨率异构性需求,交替优化算法能快速收敛,所提资源分配方案能以低计算复杂度取得近似最优性能。3)提出了基于大规模天线阵列毫米波的稳健视频传输机制。基于大规模天线阵列的毫米波是提高带宽效率、支持大容量视频内容传输的潜在技术。本文通过采用毫米波透镜天线阵列,稀疏的毫米波信道可以被转换为相互独立的空间路径,从而有效降低毫米波通信的计算复杂度。然后利用应用层视频内容的差异性以及物理层空间路径增益的差异性,设计了一种稳健视频跨层传输机制。由于空间路径数目通常少于数据块数目,动态信道下需要进行数据块调度,同时应该考虑路径匹配与功率分配以获得最优性能。方案构建的优化问题是混合整数非线性规划问题,首先对其进行子问题分解,分别得到数据块调度问题、联合路径匹配与功率分配问题。然后基于未传输数据块对数据包的失真贡献设计低复杂度数据块调度算法,并基于贪心思想设计贪心注水算法解决路径匹配与功率分配问题。仿真结果表明所提方案在峰值信噪比和视觉质量方面均取得优于对比方案的性能,同时验证了数据块调度与资源分配方式的有效性,为实际系统部署提供了指导性建议。
鲁国[4](2020)在《视频压缩编码及其质量增强的优化技术研究》文中进行了进一步梳理近年来,随着多媒体技术的蓬勃发展,视频作为重要的信息传递媒介,其应用需求和数量规模迎来了爆发式的增长。更为重要的是,消费者对高分辨率、高帧率的高品质视频需求也日益强烈,这对视频传输系统的压缩效率和质量增强提出了更高的要求。本文从视频编码系统整体优化的角度出发,围绕提高视频压缩效率和提升压缩视频质量这两个关键问题展开深入研究,创新性地提出了一个基于深度学习的完整视频压缩编码系统,从而显着提升了视频压缩效率。同时本文分别从视频编码预处理和解码后处理入手,结合视频编码特性,提出了内置帧率上变换的高效视频编码系统和压缩视频复原算法,从而提升了压缩视频的质量。本论文的研究工作针对整个编码系统,实现了高效率的视频压缩以及高品质的压缩视频重建,增强了终端的视频质量并减少了视频的传输带宽。本文的主要研究内容及创新归纳如下:围绕高帧率视频的产生与编码问题,本文提出了在编码器中内置视频帧率上变换,并与视频压缩编码联合优化的方案。为了在编码端产生高质量的高帧率重建视频,并且减少高帧率视频传输带来的带宽消耗,本文给出了一个视频压缩编码和帧率上变换的联合优化模型,从而能够根据率失真策略对帧率上变换进行优化。这种新架构的关键是把帧率上变换功能嵌入编码器环路中,并在原有的运动估计和运动补偿模块中增加帧率上变换功能。这种高帧率编码新架构有效地提升了高帧率视频编码的性能,并使得解码器能直接解出高帧率视频。本文给出的系统充分结合已有的编码多层次划分架构,给出一个多信息融合的运动估计策略;同时根据运动可靠度和量化误差,建立一个内插帧的失真模型。所提出的内嵌帧率上变换功能的联合优化编码系统,在保证压缩标准兼容的前提下,比传统预处理加编码的级联系统显着减少了高帧率视频的码率消耗,去除了编码端帧率上变换预处理和解码端帧率上变换后处理的需要,从而显着降低了编码端和解码端处理高帧率视频的计算复杂度。针对压缩视频图像的高质量后处理,本文对于压缩视频的失真复原问题提出了一个基于深度学习的卡尔曼递归模型。视频的有损压缩编码,意味着解码端的视频重建不可避免地存在压缩图像的失真现象。本文结合基于模型和基于学习这两种方法的优势,首次提出了一个应用于视频复原的基于深度学习的卡尔曼递归模型。所提出的算法将视频的压缩失真复原建模为一个卡尔曼滤波递推问题,通过利用卷积神经网络估计卡尔曼滤波器状态和计算卡尔曼增益,获取准确的后验估计。对于视频图像序列,本文提出的方法一方面利用了卡尔曼递归滤波特性,另一方面又发挥了深度学习的数据驱动的特长,从而实现压缩视频图像的高效复原。对于深度学习视频压缩这一关键问题,本文首次给出了一个端到端优化的完整视频压缩编码系统。本文系统充分利用当前视频压缩编码的混合编码框架和深度学习的强大表达能力,通过设计编码系统中的运动估计网络、运动信息压缩网络、运动补偿网络、残差压缩网络以及码率估计网络,实现了一个基于混合编码架构和深度学习的完整压缩编码系统。整个编码系统可以通过率失真损失函数进行端到端的整体优化,从而实现高性能的视频压缩。与此同时,本论文基于深度学习的视频压缩系统具有很强的可扩展性,从而能够根据速度和性能的需求进行对应设计。实验结果表明,相比较当前广泛使用的H.264算法,本文给出的深度视频压缩算法能够实现更高的压缩效率。即便与最新标准H.265相比,本文给出的视频编码系统能够实现相似甚至更好的主观质量。本论文围绕视频压缩编码及其质量增强的优化技术展开研究,所提出的系统和方法提升了视频压缩效率、增强了视频质量,为应对高品质视频需求提供了卓有成效的解决方案。更为重要的是,通过对深度卡尔曼模型、基于深度学习的视频压缩编码等研究方向的探索,为今后的研究提供了有益借鉴。
樊春玲[5](2019)在《数据驱动的图像感知和质量评价方法》文中研究表明随着数字媒体技术的飞速发展,人类已经进入到一个信息时代,海量的图像出现在人们生活的方方面面并发挥着重要的作用。由于在图像的采集、传输、存储到显示等各个环节都不可避免存在噪声,因此最终显示在用户端的图像会存在质量损失,即图像失真。在流媒体应用中用户对高质量的体验需求又在不断提高,因此需要预先对图像的失真程度进行评估,即图像质量评价。为了保证用户良好的观看体验,图像感知和质量评价成为一项必不可少的工作。随着大数据时代的到来,从图像数据中发掘规律,即数据驱动的图像质量评价方法显得尤为重要。本论文以图像感知为出发点,着重考虑人眼视觉系统特性,构建符合人眼视觉系统特性的质量评价方法,主要有以下几个方面的研究:1.针对图像失真类型多样性影响图像质量评价问题,提出一种基于多专家卷积神经网络的无参考图像质量评价方法。在实际应用中,图像失真类型多种多样,现有的图像质量评价方法并不能在每一种失真类型上都表现最佳,本文首先识别图像失真类型,得到该图像属于若干个失真类型的概率值;接着,针对每一种或一组失真类型训练特定的专家网络;最后,将识别模型输出的概率值和多专家网络预测结果融合起来得到图像的质量分数。通过实验分析发现,针对特定失真类型训练的专家网络与单一网络模型相比性能有很大的提升,说明专家网络能够学习到对特定失真类型敏感的有效的特征表达。在LIVE II和CSIQ数据集上的实验结果表明提出的基于多专家卷积神经网络的无参考图像质量评价方法预测结果与人眼视觉系统有很强的相关性。2.提出了基于深度学习的图像质量和用户满意度(Satisfied User Ratio,SUR)预测方法。根据人眼视觉系统的恰可察觉失真特性,人眼并不能察觉图像中的微小失真,只有当失真达到一定的阈值才能被感受到,这个阈值被称为JND。传统的JND模型关注像素域或者子带域,但是由于掩蔽效应等,图像中某个或者某些像素值超过其JND范围时并不一定能够被人眼察觉,本文关注的是图像级JND(Picture-level JND,PJND)。由于人眼的生理结构、视力状况、知识储备等不同,不同个体的PJND阈值也有所差异,因此为了表达群体的PJND,引入用户满意度的概念。用户满意度是指群体中对当前质量满意的用户比例。本文提出了基于深度学习的2D图像的SUR和PJND预测模型。对压缩图像的SUR进行预测更具实际意义,在给定用户满意度的条件下,可预测出最大编码参数、最大失真等级和最小码率。研究成果可直接应用于流媒体领域,节省图像编码码率进而大大减少流媒体运营商的成本。3.构建了基于PJND的对称和非对称压缩立体图像数据集。立体图像给人身临其境的视觉体验,这更符合人眼对周围真实世界的感受,然而,人眼对立体图像的PJND特性还需要进一步的探索,并且在本文之前还未出现基于PJND特性的立体图像数据集。本文通过主观实验研究立体图像的PJND特性,包括设置实验环境、收集立体图像数据、组织实施实验过程、对实验结果进行统计分析等。实验发现随着失真等级增大,SUR不断减小,说明失真等级越高导致用户的满意度越低。实验还发现JPEG2000非对称压缩的PJND左、右视点质量差异均值是2.12 d B,H.265非对称压缩的PJND左、右视点质量差异均值是2.38 d B。最后,构建了基于PJND的对称和非对称立体图像数据集,分别命名为SIAT-JSSI和SIAT-JASI,该数据集已经公开发布在IEEE Dataport平台。4.基于本文构建的面向PJND的立体图像数据集SIAT-JSSI,本文提出了立体图像的感知质量和用户满意度预测方法。首先,考虑到立体视觉的双目竞争机制和双目融合机制,从参考图像和失真图像对中提取特征,包括立体图像质量特征、单目视觉特征和双目视觉特征。然后,从提取的特征中选择关键特征并将特征融合再输入支持向量回归模型,学习特征空间到用户满意度的映射函数。由于立体图像数据集规模较小,采用了跨任务的迁移学习减少过拟合。在SIAT-JSSI数据集上的实验结果表明提出的方法性能较好。
赵利军[6](2019)在《基于优化学习的图像编码与增强》文中研究说明利用人工智能技术对图像进行表示、压缩和增强已经成为图像处理、模式识别和计算机视觉等领域的一项非常重要的研究课题。本论文以数字图像的压缩和增强为研究对象,深入地研究面向图像压缩的图像表示、兼容标准的多描述图像编码、基于深度学习的多描述图像编码、图像增强等几个关键技术。研究工作主要包括以下几个部分:(1)提出一种虚拟编码器监督的图像重采样压缩方法,用于解决硬量化函数的不可导问题。还将该方法扩展到多描述图像编码,提出一种兼容JPEG标准的多描述图像编码方法,其中,将生成的多描述图像互相作为对方的图像标签并使用多描述距离损失有效地约束多描述生成网络的学习。大量的实验结果验证了所提方法的有效性。(2)提出一种基于深度学习的多描述图像编码框架,该框架能够很好地避免多描述量化器的复杂索引分配问题。首先,所提的框架构建于自编码器,该框架包含多描述多尺度空洞卷积编码网络和多描述残差卷积解码网络。其次,通过一种端对端的自监督学习得到一对标量量化器及其重要性指示图。在多个通用的标准数据集上进行测试,实验结果表明:所提方法的编码性能优于多个现有的多描述编码方法,特别是在低码率的情况下。(3)由于下采样可以大幅度地减少三维视频的数据传输量,但是需要在解码端对三维视频进行上采样,因此,提出一种以低分辨率彩色图和低分辨率深度图为条件的对抗生成网络来解决三维视频的并行超分辨率问题。除了使用对抗损失,还引入三个辅助损失函数来训练生成网络。实验结果表明:所提的方法能够生成高质量的图像,还能用于解决其它图像处理问题。(4)提出一种局部活动驱动的各向异性扩散模型,并引入两个新的边缘停止函数用以有效地去除压缩深度图的编码伪影。与此同时,提出一种局部活动驱动的相对全变分模型实现图像去噪和图像平滑。由于第二个模型是非凸的,因此,将所提模型的正则化项分解为二次项部分和非线性部分进行求解。大量的实验结果表明:在图像质量增强和图像平滑方面所提方法优于现有的几种方法,并且所提方法有助于提升图像的编码效率。
李晨[7](2019)在《高效率线性Doherty功率放大器研究》文中进行了进一步梳理近年来无线通信系统的发展日新月异,势头迅猛且毫无减缓的趋势。如今的移动互联网时代越加需要具有更高数据吞吐量和更低功耗的通信系统,这为无线发射机的设计者们带来了更大的挑战。射频功率放大器(PA)是无线通信发射机的关键模块,它的性能指标严重影响着整个通信系统的效率和线性度。为提高数据传输速率,现今的无线通信系统在带宽和载波数量方面取得了重大进展,然而,射频PA的记忆效应使设计具有宽瞬时带宽的高功率放大器变得非常困难。除了带宽问题之外,诸如CDMA-2000,宽带码分多址(WCDMA),正交频分复用(OFDM)等无线通信系统的瞬时发射功率很大且变化快速,造成射频信号功率具有高峰均比(PAPR)。因此,用于通信系统的基站PA必须满足足够高的线性度以放大高PAPR的调制信号。为了满足线性要求,PA通常偏置在A类或AB类工作状态模式下,并且必须在峰值输出功率大量回退下工作,而回退时的效率是基站PA的另一个重要指标。此外,通信系统的尺寸和成本都在降低,其冷却系统也变得愈加简单小巧,因此效率增强技术变得非常重要。宽瞬时带宽的高效率和高线性度的PA设计已成为热点问题。本文研究了不同功率放大器的工作原理及其特点,并查阅大量的文献资料,了解国内外射频PA的研究进展和成果,总结了高效率、高线性度射频PA的设计难点,详细分析了记忆效应的来源以及它对PA线性度的影响。为了提升PA的效率、提高线性度,本文提出了一种新型的双偏置网络结构,设计了一款Doherty PA,并通过完整的理论推导证明了其可行性,另外还采用新型合路器降低阻抗变换比,以及利用3dB耦合器替代传统Doherty功率放大器中的功分器。为了验证其实际可行性,本文采用CREE半导体公司的GaN HEMT功放管CGH40010F,Rogers4350B板材,设计了一款工作在5G低频段(3.4-3.6 GHz)的Doherty功率放大器。其中,主放大器工作在AB类,直流偏置为Vds=28 V,Vgs=-2.75 V;辅放大器工作在C类,直流偏置为Vds=28 V,Vgs=-6 V。经过实物测试,本文设计的Doherty PA的饱和输出功率为43-44 dBm,饱和漏极效率超过70%,功率回退6 dB处的效率在51%-55%,功率回退8dB处效率高于43%。加入数字预失真后,在平均输出功率达到42.5 dBm时的邻近信道泄露比低于-46.5 dBc,对比当前国内外功放指标,效果良好。
范业昭[8](2019)在《基于深度学习的质量评价与人脸属性的研究》文中指出随着数字时代的到来,图像和视频爆发式增长、传播。相比文字、语音等信息,用户更容易被图像、视频吸引。因此,计算机视觉领域越来越受到研究者的关注。但图像在生成,压缩,接收等过程中不可避免的受到各种噪声的干扰。图像质量评价可以有效评价这些算法的性能,为算法优化提供重要的目标与依据,根据评分对象分为主观质量评价和客观质量评价。客观质量评价根据是否需要原始图像的特征分为全参考质量评价、部分参考质量评价与无参考质量评价。实际应用中,无参考质量评价不需要初始图像特征,应用范围更广。本文提出基于数据增强和深度学习的图像质量评价模型DNR-IQA(Deep NoReference Image Quality Assessment)。由于图像质量评价数据库比较小,本文利用高斯核回归拟合失真程度和平均主观得分差函数,增大数据量,训练基于AlexNet网络的图像质量评价模型。实验结果表明模型准确率比较高,有良好的泛化能力。近年来,人脸属性分析系统越来越受到关注,广泛应用于各种身份确认、人机交互等场景,如人脸检测、人脸关键点检测、人脸姿态估计、人脸识别等。实际应用中,人脸属性分析系统的效果?分依赖人脸图像的质量。如果人脸在图像中光照均匀、姿态较正、噪音较低、没有遮挡,系统的性能可以达到很高的准确率。然而,图像在拍摄、传输与接收等阶段,不可避免的出现图像失真、人脸姿态比较大、甚至被遮挡的情况,人脸质量较低、极大影响人脸属性分析系统的效果,准确率较低。本文提出基于ResNet-50网络的人脸质量评估分类模型。相比传统的网络,ResNet具有参数量更低、网络更深,训练的模型效果更好等优点。本文根据图像中的人脸质量分类,分为模糊、局部与非人脸、大姿态、遮挡、高质量五种类别。通过筛选清晰的人脸图像,在数据源头上控制人脸质量,提高人脸属性分析系统的准确率。实验表明,模型对人脸质量的分类准确率比较高。目前,很多场景需要对人脸属性进行研究,如安检、身份验证、人机交互等。人脸检测是人脸属性分析的基础,是人脸识别的重要一环,受到人脸姿态、表情、遮挡、图像质量等问题的干扰。人脸关键点检测利用68点定位人脸五官与轮廓,为人脸识别,人脸姿态估计、人脸对齐等问题提供位置信息。人脸姿态估计不但能提高人脸识别准确率,还能估计人眼注视方向,得到感兴趣区域。因此,人脸相关问题一直是计算机视觉领域的重要研究方向。本文采用全卷积网络提出多人脸检测模型。全卷积网络用卷积层代替全连接层,极大减少模型的参数,提高效率。测试阶段不需要调整图像大小,防止图像失真。接着,提出基于多任务学习的人脸属性分析模型,检测人脸68点关键点并估计人脸姿态。实验结果表明模型的速度与准确率都比较高。最后,本文提出利用人脸质量评价模型筛选清晰人脸的图像,提高人脸68点关键点检测与人脸姿态估计的准确率。
施文娟[9](2019)在《基于人类视觉特性的无线视频质量评价及其应用》文中研究表明随着通信技术的发展及手机、平板等智能终端设备的普及,人们对视频的需求与日俱增,无线视频业务已成为最热门的多媒体应用之一。但是无线信道的动态变化特性极易造成视频数据丢失从而导致视频质量下降,影响终端用户主观体验。因此,需要实时准确地对无线终端视频质量进行评估,为在线调整编/解码器相关参数提供参考依据,从而提高用户体验。本文首先分析了影响视频终端用户体验的系统因素、情景因素和人类因素;然后,根据不同的视频质量客观评价的分类方法,分析并对比了当前主流的客观视频质量评价方法。针对压缩编码、码率降低、重缓冲等事件造成视频质量下降的问题,结合人类视觉特性提出无线视频客观质量评价方法,并对无线视频客观质量评价方法的应用进行了研究。提出基于自然统计特性的移动终端视频质量评价方法。针对无线网络中压缩编码及无线丢包等因素对移动终端视频的降质影响,在分析视频相邻帧差信号空-时感知统计特性的基础上,提出一种基于自然统计特性的移动终端视频质量评价方法(No-reference Mobile Video Quality Assessment,NMVQA)。首先,进行视频帧差空-时自然统计规律分析,确定移动终端视频失真类型对视频相邻帧差系数统计特性的影响;其次,计算水平、垂直、主对角线和副对角线方向的帧差相邻系数乘积分布参数的时域统计特性;最后,以多尺度帧差相邻系数的时域统计特性相关程度来衡量移动终端视频失真程度。在LIVE移动视频数据库上的实验结果表明,所提算法的结果与主观评价具有较好的一致性,能够准确反映人类对视频失真程度的视觉感知效果,可为实时在线调节信源码率和无线信道参数提供参考依据。提出基于空时特征的无线动态码率视频质量评价方法。针对无线网络中码率动态变化对无线终端视频的质量影响,在提取可表征无线动态码率视频质量失真程度时域特征和空域特征的基础上,结合近因效应,提出一种基于空时特征的部分参考无线动态码率视频质量评价方法(Spatial and Temporal feature-based Reduced Reference Quality Assessment for rate-varying videos in Wireless Networks,STRQAW)。首先,利用人类视觉系统(Human Visual System,HVS)方向选择机制,以HVS方向选择分布直方图为空域特征,以其相似度为空域质量衡量标准;其次,分析视频相邻帧差离散余弦变换(Discrete Cosine Transformation,DCT)系数分布统计规律,以相邻帧差DCT系数时域变化为时域特征,以其相似度为时域质量衡量标准;最后,结合近因效应,综合空时特征衡量无线动态码率视频质量。在LIVE移动视频数据库上的实验结果表明,所提算法的结果与主观评价具有很好的一致性,能够准确反映人类视觉系统对无线动态码率视频的主观感知效果,可为内容供应商和网络运营商调节码率和视频编码参数从而提高终端用户满意度提供评估依据。提出基于结构相似度的无线视频码率变化聚类识别算法。由于信道环境条件复杂多变,为了匹配无线信道的时变特性,无线视频传输过程中码率会发生变化,从而影响视频质量和用户主观体验。为了保证视频的可靠传输,有必要动态识别视频码率变化情况。结合结构相似度(Structural Similarity,SSIM)的图像质量评价测度,根据终端视频帧质量数值分布特点,提出一种基于结构相似度的无线视频码率变化聚类识别算法(SSIM based Bitrate Clustering Recognition Algorithm,SBRCA)。首先使用结构相似度计算测试视频的帧质量,并计算相邻帧质量数据之间的相似度;其次基于二叉树分裂方法,以相邻帧质量相似度值最小的帧序号为分裂点对帧区间进行递归分裂;最后依据分裂结果完成无线视频码率聚类,实现码率变化情况的识别。实验结果表明,所提出的算法可根据视频帧质量数值分布特性对相同码率自动聚类,码率变化情况的识别结果准确。提出移动视频用户主观体验连续预测模型。由于通信技术的快速发展,移动视频流服务的需求呈现爆炸式增长,但是无线网络带宽的有限性导致视频在线播放过程中经常发生重缓冲、码率降低等视频损伤事件,从而降低用户主观体验。预测视频损伤对用户体验质量(Quality of Experience,QoE)的影响可以为改进资源分配策略提供参考依据,从而为用户提供更高质量的视频流服务。为了预测重缓冲、码率降低等视频损伤事件对用户主观体验的影响,提出了一种移动视频用户主观体验连续QoE预测模型。该预测模型的输入由表征视频帧质量向量、重缓冲事件状态向量以及表征记忆效应的向量组成。输出由连续主观QoE构成。预测模型采用块结构非线性Hammerstein-Wiener模型。在LIVE-Netflix移动视频数据库上的实验结果表明,所提出的模型的预测结果与主观用户感知具有较好的一致性,能够准确反映人类对无线视频的主观感知。该论文有图54幅,表44个,参考文献190篇。
陈赫[10](2018)在《串行数字视频信号抖动与模拟分量视频信号失真的计量方法研究》文中指出视频信号参数的计量是保障视频信号、视频系统及相关设备质量的重要手段。本文针对串行数字视频信号抖动与模拟分量视频信号失真的计量方法开展研究,研究内容如下:(1)研发基于正弦调频信号模型和E8257D信号发生器的标准SDI信号抖动源,可用于SDI信号抖动参数测量仪器的校准,提高测量准确性;(2)对于研发的SDI信号抖动源,提出了一种基于频谱比值法的校准方法,降低了测量不确定度,将SDI信号抖动参数量值溯源到计量基准;(3)研发出基于TG700视频信号发生器硬件平台和SDP2000软件平台的标准失真模拟分量视频信号源,可用于模拟分量视频信号测量仪器的校准,提高测量准确性;(4)对于研发的失真模拟分量视频信号源,建立基于示波器的校准方法,降低了测量不确定度,将失真模拟分量视频信号参数量值溯源到计量基准;(5)针对视频信号参数计量中的溯源基准,研究了电光采样原理,建立脉冲波形测量系统,实现对光电探测器输出电脉冲信号的测量。
二、浅析视频非线性失真测量(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、浅析视频非线性失真测量(论文提纲范文)
(1)基于非线性特性的语音安全和声波通信关键技术研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
第一章 绪论 |
1.1 课题背景及研究意义 |
1.1.1 语音识别系统安全分析和防护 |
1.1.2 声波通信 |
1.2 国内外研究现状 |
1.2.1 智能语音识别系统安全分析与防护研究现状 |
1.2.2 智能终端设备声波通信研究现状 |
1.3 研究内容 |
1.3.1 语音识别系统安全分析 |
1.3.2 语音识别系统安全防护 |
1.3.3 基于非线性作用的声波通信 |
1.3.4 论文组织结构 |
第二章 语音识别系统安全分析 |
2.1 引言 |
2.2 语音识别系统相关系统 |
2.2.1 语音助手 |
2.2.2 麦克风 |
2.2.3 人类听觉范围 |
2.2.4 威胁模型 |
2.3 “海豚音攻击”设计 |
2.3.1 语音指令生成 |
2.3.2 语音指令调制 |
2.3.3 攻击设备 |
2.4 攻击的可行性验证 |
2.4.1 语音助手及设备的选择 |
2.4.2 实验设置 |
2.4.3 实验结果 |
2.5 实验验证与评估 |
2.5.1 不同语言对攻击成功率的影响 |
2.5.2 背景噪声的影响 |
2.5.3 语音指令的声压水平的影响 |
2.5.4 攻击距离的影响 |
2.5.5 使用智能手机作为攻击设备 |
2.5.6 便携式攻击设备 |
2.5.7 使用传统扬声器的可行性验证 |
2.6 远距离攻击 |
2.6.1 使用超声换能器阵列进行远距离攻击 |
2.6.2 有声和无声的临界点 |
2.7 本章小结 |
第三章 语音识别系统安全防护技术 |
3.1 引言 |
3.2 声学基础知识 |
3.2.1 “海豚音攻击”信号的形态变化 |
3.2.2 语音信号的特点 |
3.2.3 声波的衰减 |
3.2.4 智能设备的麦克风阵列 |
3.3 声学衰减模型 |
3.3.1 理论分析 |
3.3.2 声场仿真 |
3.3.3 声场验证 |
3.3.4 声学衰减验证 |
3.4 防御方案设计 |
3.4.1 系统概述 |
3.4.2 音频信号预处理 |
3.4.3 特征提取 |
3.4.4 攻击检测和定位 |
3.5 实验验证与性能分析 |
3.5.1 原型实现 |
3.5.2 实验设置 |
3.5.3 整体性能 |
3.5.4 距离的影响 |
3.5.5 角度的影响 |
3.5.6 载波频率的影响 |
3.5.7 环境噪声的影响 |
3.5.8 不同语音指令的影响 |
3.5.9 几种规避策略的影响 |
3.5.10 窗口时间和样本重叠时间对检测准确度的影响 |
3.5.11 声压的影响 |
3.5.12 带三个麦克风的智能手机 |
3.6 问题讨论以及未来工作 |
3.6.1 智能手机 |
3.6.2 智能音箱 |
3.6.3 基于硬件的防御 |
3.7 本章小结 |
第四章 基于非线性特性的智能设备声波通信 |
4.1 引言 |
4.2 非线性声学 |
4.2.1 麦克风电路 |
4.2.2 非线性作用的原理 |
4.3 声波通信系统模型 |
4.3.1 无声通信的通信速率 |
4.3.2 Ultra Comm的通信速率。 |
4.4 基于非线性作用的声波通信技术 |
4.4.1 初始化过程 |
4.4.2 数据帧结构设计 |
4.4.3 数据帧设计 |
4.4.4 OFDM信号调制 |
4.4.5 接收器设计 |
4.5 实验验证与性能评估 |
4.5.1 实验设置 |
4.5.2 性能测试 |
4.5.3 性能评估 |
4.6 Ultra Comm的局限性 |
4.7 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 研究展望 |
参考文献 |
攻读博士期间主要研究成果及参与的科研项目 |
(2)基于剪切波变换的图像质量评价方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究的目的和意义 |
1.2 图像质量评价的研究现状 |
1.2.1 自然图像质量客观评价的研究现状 |
1.2.2 屏幕内容图像质量客观评价的研究现状 |
1.3 论文的研究内容和组织结构 |
1.3.1 论文的研究内容 |
1.3.2 论文的组织结构 |
第二章 基于多尺度和多方向感知差值的全参考自然图像质量评价方法 |
2.1 引言 |
2.2 剪切波变换的性质 |
2.3 基于多尺度和多方向感知差值的全参考图像质量评价方法 |
2.3.1 DNST域中的局部方向带限对比度 |
2.3.2 DNST域中的对比度敏感函数 |
2.3.3 DNST域中的恰可感知差异门限 |
2.3.4 DNST域中多尺度多方向感知差值的合并 |
2.4 实验结果 |
2.4.1 图像质量评价方法的性能评估指标 |
2.4.2 全面的性能比较实验 |
2.4.3 统计意义实验 |
2.4.4 计算复杂度比较实验 |
2.5 本章小结 |
第三章 基于剪切波变换子带结构相似性的全参考自然图像质量评价方法 |
3.1 引言 |
3.2 SSIM方法的基本原理 |
3.2.1 SSIM方法的计算过程 |
3.2.2 SSIM方法的缺点 |
3.3 基于剪切波变换子带结构相似性的全参考图像质量评价方法 |
3.3.1 STSS方法的结构框图 |
3.3.2 每个剪切波变换子带的结构相似性 |
3.3.3 所有剪切波变换子带结构相似性值的组合 |
3.3.4 STSS方法详细的实现步骤 |
3.4 实验结果 |
3.4.1 图像质量客观评价方法散点图的比较 |
3.4.2 加权策略的验证实验 |
3.4.3 对严重失真的图像进行质量评价的比较实验 |
3.5 本章小结 |
第四章 基于区分归一化变换系数特征的部分参考自然图像质量评价方法 |
4.1 引言 |
4.2 在剪切波域中基于区分归一化变换系数特征的评价方法 |
4.2.1 SFDS方法的结构框图 |
4.2.2 区分归一化变换系数的统计分布特点 |
4.2.3 发送端进行参考图像特征的提取 |
4.2.4 接收端对失真图像质量的评价 |
4.3 实验结果 |
4.3.1 区分归一化变换系数统计特征的优势 |
4.3.2 全面的性能比较实验 |
4.3.3 对于每种失真类型的性能比较实验 |
4.4 本章小结 |
第五章 基于分区域结构特征的无参考屏幕内容图像质量评价方法 |
5.1 引言 |
5.2 基于分区域结构特征的无参考屏幕内容图像评价方法 |
5.2.1 RSFE方法的框图 |
5.2.2 提取图像区域的特征 |
5.2.3 提取文本区域的特征 |
5.2.4 回归模型和加权组合 |
5.3 实验结果及性能分析 |
5.3.1 图像质量评价方法性能的比较实验 |
5.3.2 文本区域结构特征中微分阶数的选择实验 |
5.3.3 图像区域特征和文本区域特征产生的不同作用 |
5.3.4 活动性加权策略的验证实验 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
附录 缩略词语 |
致谢 |
攻读学位期间发表的学术论文目录 |
(3)面向稳健多媒体传输的资源分配机制研究(论文提纲范文)
摘要 |
ABSTRACT |
缩略词表 |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 研究现状 |
1.3 研究内容和论文结构 |
第2章 稳健传输技术 |
2.1 稳健传输架构 |
2.1.1 发送端编码传输 |
2.1.2 接收端解码 |
2.2 去相关变换 |
2.3 资源分配 |
2.4 本章小结 |
第3章 带宽受限场景下遥感图像压缩稳健传输机制 |
3.1 引言 |
3.2 ComPaTS系统模型 |
3.2.1 系统概述 |
3.2.2 主要操作 |
3.3 ComPaTS系统失真分析 |
3.4 带宽与功率分配 |
3.4.1 层间资源预分配 |
3.4.2 层内资源重分配 |
3.5 ComPaTS性能评估 |
3.5.1 对比方案 |
3.5.2 不同信道SNR结果 |
3.5.3 不同带宽压缩比结果 |
3.5.4 视觉效果对比 |
3.5.5 基函数和数据块划分影响 |
3.6 创新性分析 |
3.7 本章小结 |
第4章 用户分辨率异构场景下多载波稳健视频传输机制 |
4.1 引言 |
4.2 SSRVB系统模型 |
4.2.1 SSRVB概述 |
4.2.2 空域分解 |
4.2.3 稳健视频传输 |
4.3 载波匹配与功率分配 |
4.3.1 平均失真最小化问题构建 |
4.3.2 功率分配问题求解 |
4.3.3 载波匹配问题求解 |
4.3.4 主问题交替求解 |
4.3.5 信道状态信息反馈 |
4.4 SSRVB性能评估 |
4.4.1 对比方案 |
4.4.2 空域可伸缩性与联合资源分配结果 |
4.4.3 单用户场景下性能 |
4.4.4 多用户场景下性能 |
4.4.5 计算开销对比 |
4.5 创新性分析 |
4.6 本章小结 |
第5章 基于大规模天线阵列毫米波的稳健视频传输机制 |
5.1 引言 |
5.2 LensCast系统模型 |
5.2.1 框架概述 |
5.2.2 主要操作 |
5.2.3 透镜天线阵列信道模型 |
5.2.4 传输失真最小化问题构建 |
5.3 路径匹配与功率分配 |
5.3.1 问题分析 |
5.3.2 问题求解 |
5.4 数据块调度 |
5.5 LensCast性能评估 |
5.5.1 不同方案性能对比 |
5.5.2 数据块尺寸及路径数目影响 |
5.5.3 信道估计误差影响 |
5.6 创新性分析 |
5.7 本章小结 |
第6章 总结与展望 |
6.1 本文总结 |
6.2 下一步工作 |
参考文献 |
在读期间发表的学术论文与取得的研究成果 |
在读博士学位期间的科研和项目经历 |
致谢 |
(4)视频压缩编码及其质量增强的优化技术研究(论文提纲范文)
摘要 |
ABSTRACT |
主要符号对照表 |
第一章 绪论 |
1.1 研究背景及其意义 |
1.2 国内外研究现状 |
1.2.1 传统视频压缩编码 |
1.2.2 视频帧率上变换 |
1.2.3 视频压缩失真复原 |
1.2.4 基于深度学习的视频压缩 |
1.2.5 研究现状总结与分析 |
1.3 论文主要工作及结构安排 |
1.3.1 论文的主要研究工作 |
1.3.2 论文结构安排 |
第二章 理论基础 |
2.1 视频压缩编码 |
2.2 基于运动补偿的帧率上变换 |
2.3 卡尔曼滤波器 |
2.4 图像压缩的基础神经网络架构 |
第三章 视频压缩编码和帧率上变换的联合优化 |
3.1 引言 |
3.2 帧率上变换和视频压缩的联合优化框架 |
3.2.1 帧率上变换和HEVC算法的融合模型 |
3.3 联合运动估计算法 |
3.3.1 数据项 |
3.3.2 特征匹配项 |
3.3.3 平滑项 |
3.4 面向内插帧的率失真优化模型 |
3.4.1 内插帧的失真模型 |
3.4.2 预测误差的方差估计 |
3.5 实验结果与分析 |
3.5.1 实验条件设定 |
3.5.2 客观质量评估 |
3.5.3 主观质量评估 |
3.5.4 RDO准则的有效性验证 |
3.5.5 联合运动估计算法的有效性验证 |
3.5.6 融合模型的计算复杂度分析 |
3.5.7 与基于后处理算法的性能比较 |
3.6 本章小结 |
第四章 基于深度卡尔曼模型的压缩视频复原 |
4.1 引言 |
4.2 相关研究工作 |
4.2.1 单帧图像的压缩失真复原 |
4.2.2 基于深度学习的视频失真复原 |
4.2.3 基于非局部先验信息的图像复原 |
4.3 面向压缩视频失真复原的深度卡尔曼模型 |
4.3.1 卡尔曼滤波器的基础模型 |
4.3.2 基于预测量化误差先验的深度卡尔曼模型 |
4.3.3 基于非局部先验信息的深度卡尔曼模型 |
4.4 实验结果与分析 |
4.4.1 训练数据集 |
4.4.2 与业界领先算法的比较 |
4.4.3 消融实验分析 |
4.5 本章小节 |
第五章 端到端优化的深度视频编码系统 |
5.1 引言 |
5.2 相关工作 |
5.2.1 传统的图像和视频压缩算法 |
5.2.2 基于深度学习的图像和视频压缩算法 |
5.2.3 运动估计算法 |
5.3 端到端优化的深度视频压缩系统 |
5.3.1 深度视频压缩模型框架 |
5.4 深度视频压缩的网络设计 |
5.4.1 运动估计 |
5.4.2 运动编码与解码网络 |
5.4.3 运动补偿网络 |
5.4.4 残差编码和解码网络 |
5.5 网络训练策略 |
5.5.1 损失函数 |
5.5.2 量化 |
5.5.3 码率估计 |
5.5.4 参考帧缓冲设置 |
5.6 深度视频压缩框架的扩展 |
5.6.1 轻量级的深度视频压缩方案 |
5.6.2 增强版的深度视频压缩方案 |
5.7 实验结果和分析 |
5.7.1 实验设置 |
5.7.2 实验结果分析 |
5.7.3 消融实验分析 |
5.7.4 计算复杂度分析 |
5.7.5 深度视频压缩模型的分析与讨论 |
5.8 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读博士学位期间的科研成果及参与项目 |
简历 |
(5)数据驱动的图像感知和质量评价方法(论文提纲范文)
摘要 |
abstract |
第1章 引言 |
1.1 课题背景及研究意义 |
1.2 图像质量评价的研究现状 |
1.2.1 主观质量评价 |
1.2.2 客观质量评价 |
1.3 研究目标与内容 |
1.4 论文结构 |
第2章 基于多专家卷积神经网络的无参考图像质量评价方法 |
2.1 相关研究 |
2.2 问题描述 |
2.3 图像质量评价算法 |
2.3.1 预处理 |
2.3.2 图像失真类型识别 |
2.3.3 专家卷积神经网络模型 |
2.3.4 融合策略 |
2.4 实验结果分析 |
2.4.1 图像失真类型分类性能分析 |
2.4.2 图像质量评价性能分析 |
2.4.3 跨数据集验证 |
2.4.4 卷积核可视化 |
2.5 本章小结 |
第3章 基于深度学习的图像质量和用户满意度预测 |
3.1 相关研究 |
3.2 问题描述 |
3.3 图像用户满意度预测 |
3.3.1 用户满意度曲线及图像级恰可察觉失真定义 |
3.3.2 基于深度学习的预测模型 |
3.3.3 预测SUR曲线及PJND |
3.4 实验结果分析 |
3.4.1 实验设置 |
3.4.2 减少过拟合策略 |
3.4.3 实验结果及分析 |
3.5 PJND预测在编码中的应用 |
3.6 本章小结 |
第4章 基于图像级恰可察觉失真特性的立体图像主观质量评价 |
4.1 相关研究 |
4.2 问题描述 |
4.3 立体图像主观实验 |
4.3.1 数据集 |
4.3.2 实验设置 |
4.3.3 主观实验方法 |
4.3.4 数据后处理 |
4.4 实验结果分析与讨论 |
4.4.1 用户满意度和图像级恰可察觉失真 |
4.4.2 对称失真主观实验结果分析 |
4.4.3 非对称失真实验结果分析 |
4.4.4 对称与非对称失真实验结果对比 |
4.4.5 观看经验的影响 |
4.4.6 实验反馈 |
4.5 本章小结 |
第5章 基于支持向量回归的立体图像质量和用户满意度预测 |
5.1 立体视觉机理 |
5.2 问题描述 |
5.3 立体图像用户满意度预测 |
5.3.1 立体图像质量特征 |
5.3.2 单目视觉特征 |
5.3.3 双目视觉特征 |
5.3.4 特征选择与SVR预测 |
5.4 实验结果分析与讨论 |
5.4.1 H.265帧内编码预测结果分析 |
5.4.2 JPEG2000压缩预测结果分析 |
5.5 在编码中的应用 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 本文工作总结 |
6.2 下一步工作方向 |
参考文献 |
附录 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
(6)基于优化学习的图像编码与增强(论文提纲范文)
致谢 |
中文摘要 |
ABSTRACT |
1 绪论 |
1.1 选题背景和意义 |
1.2 图像编码的研究现状 |
1.2.1 图像压缩标准的研究进展 |
1.2.2 基于深度学习的图像压缩的研究进展 |
1.3 多描述编码的研究现状 |
1.3.1 基于量化的多描述编码方法 |
1.3.2 基于相关变换的多描述编码方法 |
1.3.3 基于抽样的多描述编码方法 |
1.3.4 兼容标准的多描述编码方法 |
1.4 图像增强技术的研究现状 |
1.4.1 图像分辨率增强 |
1.4.2 图像质量增强 |
1.4.3 图像细节增强 |
1.5 本论文的研究内容及贡献 |
1.6 论文组织结构 |
2 图像编码和增强的基本理论 |
2.1 最优化基本原理 |
2.1.1 最优化问题 |
2.1.2 面向机器学习的最优化算法 |
2.2 率失真优化理论 |
2.2.1 单描述编码的率失真优化理论 |
2.2.2 多描述编码的率失真优化理论 |
2.3 基于深度学习的图像编码理论 |
2.3.1 基本概念 |
2.3.2 编码框架 |
2.3.3 面向深度学习的优化算法 |
2.4 小结 |
3 基于卷积神经网络的图像编码方法 |
3.1 引言 |
3.2 虚拟编码器监督的图像重采样压缩方法 |
3.2.1 图像编码器硬量化的不可导问题 |
3.2.2 图像重采样压缩框架 |
3.2.3 学习算法 |
3.3 兼容标准的多描述编码方法 |
3.3.1 多描述编码框架 |
3.3.2 目标函数 |
3.3.3 网络结构 |
3.3.4 学习算法 |
3.4 实验结果与分析 |
3.4.1 图像压缩方法的性能评估 |
3.4.2 多描述图像编码方法的性能评估 |
3.5 小结 |
4 基于深度学习的多描述编码方法 |
4.1 引言 |
4.2 基于深度学习的单描述编码方法 |
4.3 基于标量量化学习的多描述编码方法 |
4.3.1 多描述编码的目标函数 |
4.3.2 网络结构 |
4.4 实验结果与分析 |
4.4.1 实验设置 |
4.4.2 性能评估 |
4.5 小结 |
5 彩色图和深度图的并行超分辨率 |
5.1 引言 |
5.2 基于条件对抗生成网络的深度图和彩色图并行超分辨率 |
5.2.1 网络结构 |
5.2.2 目标函数 |
5.2.3 对抗损失函数 |
5.2.4 辅助损失函数 |
5.2.5 高分辨率彩色图引导的深度图超分辨率应用 |
5.2.6 其它应用 |
5.3 实验结果与分析 |
5.3.1 实现细节 |
5.3.2 彩色图和深度图的并行超分辨率的性能评估 |
5.3.3 高分辨率彩色图像引导的深度图超分辨率的性能评估 |
5.3.4 并行的图像平滑和边缘检测的性能评估 |
5.4 小结 |
6 局部活动驱动的图像滤波方法 |
6.1 引言 |
6.2 局部活动驱动的各向异性扩散模型 |
6.3 局部活动驱动的相对全变分模型 |
6.4 实验结果与分析 |
6.4.1 模型参数设置 |
6.4.2 压缩深度图滤波的性能评估 |
6.4.3 图像平滑和图像尺度表示的性能评估 |
6.4.4 图像去噪的性能评估 |
6.5 小结 |
7 总结与展望 |
7.1 工作总结 |
7.2 未来工作展望 |
参考文献 |
作者简历 |
攻读博士学位期间发表的学术论文 |
学位论文数据集 |
(7)高效率线性Doherty功率放大器研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 本文主要内容及安排 |
第2章 射频功率放大器基本理论 |
2.1 功率放大器主要性能指标 |
2.1.1 频带 |
2.1.2 效率 |
2.1.3 增益与输出功率 |
2.1.4 线性度 |
2.1.5 稳定性 |
2.2 散射参数 |
2.3 功率放大器的效率增强技术 |
2.3.1 包络消除和恢复 |
2.3.2 包络跟踪技术 |
2.3.3 异相合成技术 |
2.4 Doherty功率放大器原理 |
2.4.1 传统Doherty功率放大器基本结构 |
2.4.2 传统Doherty功放工作原理 |
2.4.3 Doherty功放工作状态及效率分析 |
2.5 本章小结 |
第3章 射频功率放大器中的非线性影响及其线性化技术 |
3.1 通信系统中的信号模型 |
3.2 功率放大器中的非线性 |
3.3 记忆效应 |
3.4 功率放大器的线性化技术 |
3.4.1 功率回退技术 |
3.4.2 负反馈线性化技术 |
3.4.3 前馈线性化技术 |
3.4.4 预失真技术 |
3.5 新型双偏置结构 |
3.6 本章小结 |
第4章 3.4-3.6 GHz Doherty功率放大电路设计 |
4.1 A设计指标要求 |
4.2 晶体管和介质板材的选择 |
4.2.1 晶体管的选择 |
4.2.2 介质板材的选择 |
4.3 高效率线性Doherty功率放大电路设计过程 |
4.3.1 直流扫描分析 |
4.3.2 偏置电路的设计 |
4.3.3 3dB定向耦合器的设计 |
4.3.4 输入输出阻抗匹配电路的设计 |
4.3.5 负载调制网络的设计 |
4.3.6 原理图和版图的联合仿真 |
4.4 版图联合仿真结果分析 |
4.5 本章小结 |
第5章 Doherty功率放大器的实物测试与性能分析 |
5.1 功率放大器的组装 |
5.2 性能测试与结果分析 |
5.2.1 Doherty PA的效率与增益测试 |
5.2.2 ACLR测试 |
5.3 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
附录 |
(8)基于深度学习的质量评价与人脸属性的研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 本文主要工作 |
1.2.1 基于深度学习的图像质量评价 |
1.2.2 基于深度学习的人脸质量评估 |
1.2.3 基于全卷积网络的多人脸检测 |
1.2.4 基于多任务学习分析人脸属性 |
1.2.5 基于人脸质量评估的图像筛选 |
1.3 本文结构 |
1.4 本章小结 |
第二章 卷积神经网络 |
2.1 神经网络优化原理 |
2.2 网络层介绍 |
2.3 激活函数 |
2.4 欠拟合与过拟合 |
2.5 本章小结 |
第三章 基于深度学习的无参考图像质量评价与人脸质量评估分类 |
3.1 引言 |
3.2 相关工作 |
3.2.1 人眼视觉系统 |
3.2.2 基于深度学习的图像质量评价 |
3.2.3 人脸质量评价 |
3.3 图像质量评价的数据增强 |
3.3.1 拟合高斯核回归函数 |
3.3.2 增强图像样例 |
3.4 无参考图像质量评价模型建立 |
3.4.1 常用网络模型 |
3.4.2 网络结构搭建 |
3.5 图像质量评价的实验结果与分析 |
3.5.1 图像质量评价数据库 |
3.5.2 性能评价指标 |
3.5.3 整体实验结果对比 |
3.5.4 数据库交叉验证 |
3.6 人脸质量评估分类 |
3.6.1 网络结构搭建 |
3.6.2 实验结果与分析 |
3.7 本章小结 |
第四章 基于多任务学习的人脸属性分析 |
4.1 引言 |
4.2 相关工作 |
4.3 人脸检测 |
4.3.1 网络结构搭建 |
4.3.2 聚类算法 |
4.3.3 实验结果与分析 |
4.4 人脸属性分析 |
4.4.1 网络结构搭建 |
4.4.2 实验结果与分析 |
4.5 基于人脸质量评估分类的图像筛选 |
4.6 本章小结 |
第五章 总结与展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(9)基于人类视觉特性的无线视频质量评价及其应用(论文提纲范文)
致谢 |
摘要 |
abstract |
变量注释表 |
常用缩略语 |
1 绪论 |
1.1 课题背景及选题意义 |
1.2 视频质量评价研究现状 |
1.3 视频数据库简介 |
1.4 评估客观视频质量评价算法的性能指标 |
1.5 主要研究内容和创新点 |
1.6 论文组织结构 |
2 视频质量客观评价研究综述 |
2.1 引言 |
2.2 影响QoE的因素 |
2.3 视频质量客观评价方法 |
2.4 本章小结 |
3 基于自然统计特性的移动视频质量评价 |
3.1 引言 |
3.2 相关研究 |
3.3 视频相邻帧差空-时感知相关统计特性分析 |
3.4 NMVQA算法 |
3.5 算法仿真分析 |
3.6 本章小结 |
4 基于空时特征的无线动态码率视频质量评价 |
4.1 引言 |
4.2 相关研究 |
4.3 动态码率视频的空域特征提取 |
4.4 动态码率视频的时域特征提取 |
4.5 STRQAW算法 |
4.6 算法仿真分析 |
4.7 本章小结 |
5 基于结构相似度的无线视频码率变化聚类识别 |
5.1 引言 |
5.2 相关研究 |
5.3 SSIM及码率识别 |
5.4 SBRCA聚类识别算法 |
5.5 算法仿真分析 |
5.6 本章小结 |
6 移动视频用户体验连续预测模型 |
6.1 引言 |
6.2 相关研究 |
6.3 影响连续主观QoE因素分析 |
6.4 用户体验预测模型 |
6.5 预测模型性能评估 |
6.6 本章小结 |
7 结论 |
参考文献 |
作者简历 |
学位论文数据集 |
(10)串行数字视频信号抖动与模拟分量视频信号失真的计量方法研究(论文提纲范文)
提要 |
中文详细摘要 |
abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 视频信号参数计量 |
1.1.3 串行数字视频信号抖动与模拟分量视频信号失真 |
1.1.4 研究意义 |
1.2 研究现状 |
1.2.1 串行数字视频信号抖动研究现状 |
1.2.2 视频测试信号研究现状 |
1.2.3 视频仪器可溯源校准研究现状 |
1.3 本文的主要研究内容 |
第2章 标准SDI信号抖动源研究 |
2.1 引言 |
2.2 抖动及其测量 |
2.3 抖动源的设计 |
2.4 抖动源的测试 |
2.5 本章小结 |
第3章 标准SDI信号抖动源校准方法研究 |
3.1 引言 |
3.2 校准方法的研究 |
3.2.1 校准方法 |
3.2.2 校准方法的分析与比较 |
3.3 实验系统的设计与搭建 |
3.4 校准实验 |
3.5 测量不确定度的分析和评定 |
3.6 SDI信号抖动参数量值的溯源链路 |
3.7 本章小结 |
第4章 标准失真模拟分量视频信号源研究 |
4.1 引言 |
4.2 测试信号的研究 |
4.2.1 5阶梯波信号 |
4.2.2 彩条信号 |
4.2.3 多波群信号 |
4.2.4 平场信号 |
4.3 信号源的设计 |
4.4 信号源的测试 |
4.5 本章小结 |
第5章 标准失真模拟分量视频信号源校准方法研究 |
5.1 引言 |
5.2 信号源的校准 |
5.3 测量不确定度的分析和评定 |
5.3.1 直流幅度 |
5.3.2 交流幅度 |
5.3.3 上升时间 |
5.4 失真模拟分量视频信号参数量值的溯源链路 |
5.5 本章小结 |
第6章 视频信号参数计量的溯源基准研究 |
6.1 引言 |
6.2 电光采样原理 |
6.3 系统的设计与搭建 |
6.4 系统的优化 |
6.5 光电探测器输出电脉冲波形测量实验 |
6.6 本章小结 |
第7章 全文总结 |
7.1 主要创新性成果 |
7.2 存在的不足及进一步工作建议 |
参考文献 |
作者攻博期间发表的学术论文与科研成果 |
致谢 |
四、浅析视频非线性失真测量(论文参考文献)
- [1]基于非线性特性的语音安全和声波通信关键技术研究[D]. 张国明. 浙江大学, 2021(01)
- [2]基于剪切波变换的图像质量评价方法研究[D]. 董武. 北京邮电大学, 2021(01)
- [3]面向稳健多媒体传输的资源分配机制研究[D]. 桂永强. 中国科学技术大学, 2021(09)
- [4]视频压缩编码及其质量增强的优化技术研究[D]. 鲁国. 上海交通大学, 2020(01)
- [5]数据驱动的图像感知和质量评价方法[D]. 樊春玲. 中国科学院大学(中国科学院深圳先进技术研究院), 2019(01)
- [6]基于优化学习的图像编码与增强[D]. 赵利军. 北京交通大学, 2019(01)
- [7]高效率线性Doherty功率放大器研究[D]. 李晨. 杭州电子科技大学, 2019(01)
- [8]基于深度学习的质量评价与人脸属性的研究[D]. 范业昭. 上海交通大学, 2019(06)
- [9]基于人类视觉特性的无线视频质量评价及其应用[D]. 施文娟. 中国矿业大学, 2019(04)
- [10]串行数字视频信号抖动与模拟分量视频信号失真的计量方法研究[D]. 陈赫. 吉林大学, 2018(12)