一、用于实时IP语音开发的编码/解码器(论文文献综述)
杜佳梦[1](2020)在《面向移动互联网实时语音通信的压缩感知编解码方法研究》文中认为随着现代科技的高速发展,互联网催生的各类应用在全球范围内迅速普及,并日益改变人们的生活方式。其中,流媒体技术和宽带技术促进了多媒体内容在互联网上的传输,这些新的技术为基于IP的音频/视频传输提供了可能,与此同时Vo IP(Voice over Internet Protocol)技术应运而生。Vo IP是一种基于互联网进行语音交互的通信系统,凭借着较低的语音业务成本,在全球范围内得到了迅速的发展。然而,互联网分组交换的信息传输方式最初是为数据传输所设计的,它“尽力而为”的传输特点,无法提供必要的服务质量保证。在目前的Vo IP系统中,由于分组交换的技术特点,及网络环境不稳定等问题使得丢包、延迟现象非常常见,从而导致语音通信质量急剧恶化。因此,如何在丢包的情况下,保障实时语音通讯的服务质量是Vo IP技术目前亟待解决的关键问题。首先,在移动互联网环境下,针对数据包的丢失(或者延时)造成实时语音通讯服务质量恶化的问题,本文提出一种基于压缩感知理论框架(CS,compressive sensing)下的基于编码端与解码端的抗丢包算法,其主要贡献如下:1)在编码端构造满足低编码复杂度和高感知能力的稀疏二元感知矩阵,对语音信号进行整体线性重采样,使得每个采样点包含信号的整体信息,再通过Vo IP传输模型按TCP/IP标准进行打包发送;2)在丢失重要信息的情况下,解码端可以采用基于图理论的压缩感知重构算法,仅利用剩余数据高质量的恢复音频信号,从而达到抗丢包的目的。这为移动互联网语音通信提供了新的思路。其次,介绍了压缩感知编解码的数学模型,并进行算例仿真。在网络随机丢包环境下,将本文提出的基于压缩感知语音丢包恢复的改进算法(PLRCS,Improved Packet Loss Recovery Algorithm Based on Compressed Sensing),分别对THCHS30、Librispeech、Common Voice Data-sets三个数据集进行优化。再与标准基于压缩感知的抗丢包算法、采用带内FEC的SILK编解码算法、未采用带内FEC的SILK编解码算法进行对比。实验结果表明,在一定丢包率下采用本文的基于压缩感知语音丢包恢复改进算法(PLRCS)重构得到的语音信号质量更佳,并为用户提供良好的听觉体验,从而证明本方法较传统的方法具有的性能优势以及可执行性。最后,借助SIP协议,设计了基于Android应用框架的Vo IP系统,对其功能进行了实现,并对服务器注册模块、短消息模块、呼叫服务模块等进行了测试。随后选择Wireshark抓包分析工具对RTP流的数据包抓包,对时延、抖动、丢包率等语音参数进行详细的分析,分析结果表明本实验搭建的Vo IP模拟系统能提供良好的语音服务质量。
彭景惠[2](2020)在《基于熵随机的网络流媒体动态隐密通信研究》文中研究说明在信息化成为时代发展趋势的大背景下,互联网已渗透到人们的日常生活中,与个人、企业和政府的需求密切相关。随着Internet的兴起和数字语音编码技术的提高,网络语音电话(Voice over Internet Protocol,简称VoIP)等流媒体技术获得了突破性的进展,在公共网络中广泛应用。随之而来的数据安全问题亟待解决,因此需要设计切实可行的安全协议,探索流媒体数据安全通信方法,以促进网络应用的不断发展。本文从理论和技术出发,系统研究了基于网络流媒体的安全动态隐密通信(Covert communication)技术,涉及信息理论建模、安全性分析、隐写(Steganography)算法设计、编码、隐密通信测试以及性能和鲁棒性测量等。本研究以面向对象的C++编程为基础,开发了一套可扩展的VoIP隐密通信系统,为此项工作提供实验平台。针对网络流媒体数据安全通信的复杂性,本文在信息隐藏和密码学技术的融合方面开展了前瞻性的研究,提出了基于计算机处理器硬件的真随机数和单向密码累积器(One-way cryptographical accumulator)的隐密通信新方法。结合高级加密标准、动态密钥分配和单向密码累积认证,该方法能显着提高隐密通信系统的安全性、有效性和鲁棒性。作为网络通信的安全信道,VoIP隐密通信可以有效保护数据免受网络攻击,甚至来自量子对手的攻击。本文对基于VoIP网络流媒体的隐密通信研究做出了如下几点贡献:(1)针对VoIP流媒体通信过程中的“时变”和“丢包”特征,构建了一个新的流媒体安全隐密通信理论模型,以描述在被动攻击情形下流媒体隐密通信的安全场景,从理论上解决其分组隐藏容量的不确定性和机密信息的不完整性等关键性问题。鉴于使用流媒体隐写术实现VoIP隐密通信,该模型用随机过程对VoIP隐密通信的信息源进行建模,通过假设检验理论(Theory of hypothesis testing)对敌手的检测性能进行分析评估,建立一种高精度的离散预测模型,模拟流媒体隐密通信中有效载荷的时变特征。(2)针对加密密钥的安全问题,详细探讨了流媒体隐写术与隐密通信领域中基于硬件熵源的真随机密钥生成。研究了在流媒体隐密通信中,利用硬件熵源产生的真随机数作为AES-128加密算法的密钥,以保证其保护的数据绝对安全。安全性分析和Mann-Whitney-Wilcoxon测试表明,由真随机数发生器产生的密钥,以CPU的读取时间戳计数器(the Read Time Stamp Counter)为熵源,可有效抵御恶意攻击。提出了一种新颖的数据嵌入间隔选择算法,使用从逻辑混沌图(Logistic Chaotic Map)生成的随机序列随机选择VoIP流中的数据嵌入位置,提高流媒体隐密通信中数据嵌入过程的复杂度和机密性。(3)针对VoIP隐密通信过程中的密钥分配问题及流媒体“丢包”特征,设计了一个高效、用于安全通信认证的单向密码累加器。在此基础上,提出了一个基于动态密钥更新和传输的流媒体隐写算法,该算法将单向密码累加器集成到动态密钥交换中,以提供动态、安全、实时的密钥交换,用于VoIP流媒体隐密通信,解决了其通信过程中机密信息不完整性问题。此动态密钥分配算法可以保护数据通信免受网络攻击,包括威胁到大多已知隐写算法的中间人攻击。依据数学离散对数问题和t-test检验的隐写分析结果,该算法的优势在于其在公共信道上的密钥分配具有高度可靠性。通过安全性分析、隐写分析、非参数统计测试、性能和鲁棒性评估,检验了基于硬件熵源真随机数和动态密钥更新和传输的流媒体隐密通信算法的有效性。以可扩展的VoIP隐密通信系统为实验平台,针对不同的数据嵌入位置、嵌入信息长度和流媒体隐藏容量和速率,进行了一系列VoIP流媒体隐密通信研究。结果表明,该隐密通信算法在语音质量、信号失真和不可感知性等方面对实时VoIP通信几乎没有影响。在VoIP流媒体中使用该隐密通信算法嵌入机密信息后,其语音通信质量指数PESQ的平均值为4.21,接近原始VoIP语音质量,其平均信噪比SNR值为44.87,符合VoIP通信国际标准。与其他相关算法相比,本文提出的隐密通信算法平均隐藏容量高达796比特/秒,与其它隐写算法相当,但在解决VoIP隐密通信相关的安全问题方面更有效。
张文[3](2020)在《VoIP语音库的体系与生成方法研究》文中研究表明伴随着互联网技术的发展,网络上的流量迅速增加。然而随着安全性的需求和网络流量加密传输的广泛使用,对网络流量进行加密已经成为了一种标准。目前,越来越多的学者围绕网络流量展开研究,研究网络流量的分类与识别。然而网络电话也已经成为一种成熟的通讯技术,网络中的VoIP流量越来越多。但是目前用于研究的数据集还是以IDS(入侵检测)和网络流量应用分类为主,可用于加密语音流量识别的VoIP数据集比较缺乏。当前,在借助VoIP软件生成数据的方式下,想要获取准确、多样化标签的流量是一件困难的事情,因此研究具有准确标签的VoIP流量数据集生成方法显得尤为重要。为了能够获得标签种类多样化、准确的VoIP流量数据集,本论文主要完成以下工作:1)本论文首先研究VoIP中的相关协议,如H.323、SIP、SDP协议,确定了基于SIP协议的VoIP流量生成路线。SIP协议中使用的网络安全机制也是研究对象之一。SIP协议中的安全机制偏向于保证SIP中的信令流安全,媒体流的安全是通过SRTP协议实现的。为了了解SRTP的工作流程,本文研究了 RFC3711。研究发现SRTP中需要一个主密钥,而主密钥的协商需要使用MIKEY、SDES等密钥协商管理协议。SRTP协议中采用了基于AES128的数据加密方式。2)研究目前用于语音识别的数据库的特性,提出了用于VoIP语音识别的语音库体系构成,从发音文本设计、录音人的选择等角度讨论语音库的设计标准。3)在前三点的研究基础上,本文对VoIP流量的生成有了完整的系统性认识,结合目前VoIP流量产生的缺陷和实际需求,提出了一种使用WAV文件作为语音源的VoIP流量生成方法。研究网络层次中各协议的报文头格式,通过网络协议报文头的封装,达到流量生成的目的。实现了 AES128的计数器工作方式。4)为了能够提高VoIP流量的标签标注工作的自动化程度,提出了一种基于DNN的说话者性别识别方法和基于CNN的语种识别方法。5)通过系统的测试,生成的流量报文能正确被Wireshark软件识别,表明数据封装的正确性。基于DNN的说话者性别识别实验结果表明通过提升MFCC的维度或者语音数据的时间长度,都能提高识别的准确率。而基于CNN的语种识别也有90%以上的准确率。
江志远[4](2019)在《多功能护理床视音频监控系统设计与实现》文中进行了进一步梳理中国面临人口老龄化问题,采用多功能护理床的居家养老模式的行为兴起,医护工作者集中监控多个不同地点老人的生活状况和异地家属掌握亲人的健康状况有很强的实用意义。针对上述状况,本文提出了一种面向家庭使用的多功能护理床远程视音频监控系统的远程医疗解决方案,可为医生或家属提供视频观看病人的病情并提供语音协助的医疗服务。本文分析了远程监控系统的用户需求和当前视频监控系统的发展现状,给出了系统的总体结构方案。系统采用P2P应用框架,系统前端是集成网络摄像头,用于采集、编码、传输图像,系统中枢P2P连线平台负责前端和PC端直连,系统终端PC负责用户管理和界面交互,并提供多路视频画面集中显示、一路音频双向通话和云台控制服务。本文的主要工作是监控系统PC端软件的设计。首先,总结了PC端软件设计所使用的主要技术:多线程编程与同步、FFmpeg库和DirectDraw图形库等;其次,着重阐述了分别使用FFmpeg解码H.264视频流和利用DirectDraw技术在屏幕上显示YUV420P像素格式数据的步骤以及使用GDI技术实现字幕叠加显示过程;紧接着,叙述了将接收的音频流解码为波形音频数据并利用waveOut在PC端播放过程;然后,介绍了利用waveIn采集的音频数据编码和通过网络传输至监控前端播放过程;最后,对实现的PC端软件功能进行验证。结果显示:PC端软件实现了多地多功能护理床的视频集中显示、一路音频交互、信息屏幕显示和云台控制,基本满足用户需求,且PC端软件操作界面友好,易于更新维护。
吴晨[5](2018)在《基于WebRTC的Android端音视频通信系统的设计与实现》文中研究说明随着网络接入带宽的逐渐改善,许多领域的应用都希望能够嵌入实时通信功能。但目前国内外通信应用都使用私有的通信标准,无法实现跨终端通信,如微信、Skype等。谷歌开源WebRTC(Web Real-Time Communication)技术是为了统一互联网通信标准,并解决移动端因硬件资源不足导致的抖动、延时和CPU占用率高等问题。因此,本课题采用WebRTC技术在Android平台设计并实现了跨应用终端的音视频实时通信系统。本文主要研究内容及工作如下:(1)研究WebRTC技术原理及主要结构。分析并研究了音视频编解码器的原理性能后,分别选用iSAC和VP8作为音视频编解码器;深入分析UDP和RTP/RTCP原理及结构,结合UDP在实时通信场合中的优势,及RTP在处理丢包、乱序及音视频同步方面的特点,最后选用两者作为本系统的传输层协议。(2)完成服务器的设计与搭建。根据需求在Ubuntu平台上搭建服务器。首先是房间服务器,它能够维护通话并管理通话人员的加入与退出;其次是信令服务器,客户端建立通信前需要进行信令交互,信令服务器则起到了信令传递的作用;最后针对现在复杂的网络情况,分析了不同类型的NAT及其穿透方案,并在此基础上搭建了能够实现NAT穿透功能的STUN/TURN/ICE服务器。(3)设计并实现客户端各个模块功能。在Ubuntu平台搭建WebRTC安卓端的下载编译环境,下载编译WebRTC安卓端底层源码。通过对底层源码封装及调用实现了客户端的音视频采集及传输功能。为了弥补UDP通信的丢包问题,引入NACK机制;同时还嵌入了带宽自适应功能以适应不断变换的网络带宽。(4)对主要功能进行测试并收集分析主要数据。分别对同一应用和不同应用之间的音视频通信功能进行测试。测试结果表明,本系统具有跨应用终端的特点,系统可以根据网络条件的不同动态调节帧率。通话时丢包率基本保持在6%-7%之间,CPU占用率为10%左右,延时时间基本处于80ms左右。本文设计的基于WebRTC的音视频通信系统模块分工明确、易于维护、可扩展性强。同时引入NACK丢包重传功能,有效减少了实时通信场合中数据包的丢失。本课题的研究成果对于音视频实时通信的设计具有实际应用价值。
陈羿江[6](2012)在《G.729语音编码抗丢包算法研究及其ARM平台实现》文中认为实时语音通信技术在实际的运营中由于网络阻塞引起的丢包、信道干扰等问题,导致实时语音服务质量下降,这些问题还远未有效解决。语音数据在Internet上的实时可靠传输日益得到重视。G.729语音编码算法是目前常用的语音编码算法之一。多描述编码算法是在不可靠网络中进行信息传输的信源编码技术。基于上述两方面,G.729语音编码数据在网络上的可靠传输原理和算法被研究,提出基于多描述编解码算法的抗丢包G.729语音编解码算法框架,并采用标量双描述算法和交织算法分别实现了两个抗丢包G.729语音编解码器,这两个算法在性能上各有千秋。抗丢包G.729语音编解码算法的运算复杂度高,而ARM处理器的运算能力有限,未经优化的抗丢包G.729语音编解码器无法满足实时性要求很高的语音通信服务。针对ARM平台,对编解码器进行深入的优化,提高编解码器的实时性,并移植到ARM-Linux平台下。最后对编解码器优化前后复杂度和语音质量进行测试。搭建NIST net网络测试环境对算法的抗丢包性能进行测试。结果表明,从抗丢包性能上讲,抗丢包G.729语音编码算法的抗丢包性能明显优于无抗丢包编码算法,从ARM平台实现上讲,优化后的抗丢包语音编解码算法复杂度降低到优化前的五分之一。最终为ARM平台提供了高实时性的带有抗丢包特性的G.729语音编解码器。
沈阳[7](2008)在《宽带变速率语音编解码算法研究及其在嵌入式平台上的实现》文中提出2006年,ITU-T提出新一代语音编解码标准G.729.1。其码流速率可根据网络的实际状况有效利用带宽,进行自适应调整。随着相关技术的发展,G.729.1宽带语音压缩标准必将有着广阔的应用前景。论文的特色性工作是基于FPGA平台对G.729.1编解码算法给予IP核实现。为此,对于在软核方式的嵌入式系统实现上,进行了大量的研究和实验,率先通过了实时的G.729.1硬件工程,并总结出多种算法实现的经验,有利于下一步硬件实现工作的开展。本文的研究工作主要包括以下几个方面:1.剖析G.729.1编解码算法结构,以及对相关性能参数进行深入研究。完成了基于PC机的G.729.1性能测试平台,优化出一系列的测试向量,为该算法的嵌入式系统实现打下基础。2.按照可重用设计方法学中IP核设计准则,从系统级设计角度,完成了基于NiosⅡ的G.729.1编/解码器系统设计。3.充分利用SoPC技术的优势,从模块级设计角度,完成硬件加速模块的设计,并最终实现了G.729.1硬件解码器的实时工作。4.总结出现代DSP设计相比于传统DSP设计所具备的优势,得出相关结论,为G.729.1硬件解码器的实现给出了建设性意见。
雷晓荣[8](2007)在《移动IP语音通信系统音频编解码器的研究》文中指出随着网络技术和移动通信的发展,移动IP技术的应用越来越广泛,但现有的移动IP语音通信在路由、切换和语音质量等方面还不够成熟,这些问题直接或间接影响了通信的语音质量。因此如何提高通信的语音质量,是目前移动IP语音通信领域重点研究的课题。本文设计的移动IP语音通信系统,支持无线网络环境下移动节点的移动性,而且在移动过程中仍然保持较好的语音质量。 本文包含的主要工作有: 1、本文研究了SIP协议和iLBC语音编解码标准,给出了一种使用SIP协议和移动IP相结合来实现移动IP语音通信系统的方案; 2、通过对iLBC性能和技术优势的分析,提出了语音模块使用iLBC语音编解码器的方案; 3、在VC6.0下使用C++语言实现了基于iLBC标准的语音编解码器; 4、为了满足移动IP环境实时性的要求,对编解码器进行了软件优化。 在总体设计方面采用的是模块化思想,移动IP语音通信系统被分为SIP协议栈模块、Server模块、NAT模块、网络通信模块、RTP/RTCP模块、语音模块和应用程序模块,各模块相对独立,实现较为方便。 本文实现的移动IP语音通信系统,在固定网络环境下通过连接、信令和语音质量等方面的测试,测试结果表明系统可以很好的实现各项功能。
范怡帆[9](2021)在《基于强化学习的人机谈判系统》文中进行了进一步梳理随着人工智能的兴旺,电子商务行业迎来了新的发展机遇。随着在线交易的频率和规模的增加,商家与客户之间的在线协商和沟通变得越来越频繁。因为它们无法实现谈判,也无法分析用户,因此难以针对特定用户更好地达成交易。在线交易谈判流程的自动化已逐渐成为商家和消费者的潜在需求。但是,现有的在线对话系统(例如淘宝上的阿里小蜜和京东的在线客户服务)无法很好地满足这样的需求。目前,一方面,自动谈判的研究者主要集中在计算机对计算机的谈判上,而对人机谈判的研究不多。另一方面,对话系统的研究人员很少关注自动谈判。因此,在本文中,我们将对话系统的体系结构与自动谈判集成在一起,研发了一个人机谈判系统。它可以代替人工客服来处理许多重复性和多样化的谈判。它可以随时随地与多方进行谈判,从而显着提高谈判效率,并减少企业使用人工客服的成本。具体来说,我们基于微信小程序平台,研发了一个基于强化学习的人机谈判系统。我们的系统能够应对不同的用户或同一用户的不同出价方式,并采用动态谈判策略,提高谈判的效率。本文的主要贡献如下:我们综述了对话系统和自动谈判系统领域中的最新技术,比较了它们的优点和缺点,并建议了进一步研究的方向;我们将强化学习与用户行为建模相结合,设计了一种新颖的谈判策略,这个策略让我们的谈判系统在谈判中可以根据用户的行为来调整谈判策略;我们编写了对话语料和谈判语料库,采用fast Text算法训练识别人类意图的分类器,并且我们用基于特征词抽取的匹配算法来提取谈判对话中与价格相关的结构化信息;我们在微信小程序平台上实现人机谈判系统,该系统包括了分别从用户界面,对话理解,对话谈判管理和对话回应生成四个模块,并使用中文的自然语言与用户进行多轮谈判;我们进行了大量实验来分析我们的系统,通过分析意图识别模型的性能评估对话理解模块的性能,从系统谈判效率、对话成功率和公平性三个方面分析谈判策略的有效性,采用问卷调查的方式分析用户对系统的满意度。实验结果表明,我们研发的系统可以很准确地识别人类对手的意图,与人类对手进行谈判的效率、成功率以及公平性,大部分人类对手对我们的系统表示满意。本文设计和实现的人机谈判对话系统为研究对话系统和自动谈判的学者们提供了一个新的研究方向。
周琨[10](2021)在《网络流量模型及异常检测技术研究》文中研究指明网络流量海量化、复杂化已成为常态,如何识别、监测、分析网络流量已成为重要研究方向和热点。特别是基于深度学习的异常检测方法的研究,受到产学研界广泛关注,异常检测与机器学习、深度学习等人工智能技术领域相结合是网络安全领域研究的一个重要分支。作为检测高级威胁手段的流量分析技术结合人工智能、大数据等技术对流量建模,分析流量行为,识别检测异常流量,为网络规划、网络优化、网络监控等提供重要的技术支撑。本论文的研究内容是将传统的统计方法、深度学习及强化学习的方法用于网络流量建模和异常检测,流量模型是基于流量的异常检测的基础性研究工作,掌握流量特征是建设健壮、安全可靠网络的前提条件。可在流量模型上开展流量预测、分类,以及在此基础上进行异常检测研究。本文主要研究内容和贡献包括:(1)研究了移动平均自回归模型在以流量为代表的时间序列建模领域的应用,总结了一套建模流程,可用于指导模型设计、指标选择及模型评估;提出了一个ARIMA+SVR的混合模型,时间序列的预测准确度提高了10%以上。设计了一个加密视频流识别方案,提出了视频流最近邻、动态时间规整算法;基于加密后流量不确定性增加、熵值加大的特点,结合分类算法提出了一个加密流量识别方法,该方法与传统方法相比,识别准确率提高了10%以上。(2)在分析和实验长短期记忆网络性能存在的问题后,提出了基于注意力机制和自编解码融合的流量模型,训练时间与现有的模型相比缩短了约80%左右,在流量模型的基础上设计了异常评分机制,提出了基于注意力的异常检测模型,实验结果表明异常检测准确率达到或超过现有模型,模型训练时间效率提升明显。(3)通过将生成式对抗神经网络(GAN)应用于流量建模和异常检测的研究,提出了基于GAN的流量模型,该模型克服了GAN训练易出现不稳定等问题,生成了“高仿真度”的网络流量,在此基础上进一步设计了异常评分机制,进行流量异常检测。实验测试表明模型的有效性,其识别准确率达到或超过现有模型。(4)通过对异步强化学习(A3C)应用于网络流量的研究,提出了一个对网络攻击行为建模的异常检测模型,对四个基准数据集的实验测试表明,检测准确率、召回率及F1分数等评价指标达到或超过现有的模型。
二、用于实时IP语音开发的编码/解码器(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、用于实时IP语音开发的编码/解码器(论文提纲范文)
(1)面向移动互联网实时语音通信的压缩感知编解码方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 VoIP技术国内外研究现状 |
1.2.1 VoIP技术国外研究现状 |
1.2.2 VoIP技术国内研究现状 |
1.3 压缩感知理论国内外研究现状 |
1.3.1 压缩感知理论国外研究现状 |
1.3.2 压缩感知理论国内研究现状 |
1.4 本文的章节安排及其主要内容 |
第二章 VoIP系统关键技术及架构 |
2.1 VoIP系统概述 |
2.2 VoIP呼叫信令协议 |
2.3 实时传输技术 |
2.4 语音编码技术 |
2.5 VoIP丢包处理技术 |
2.5.1 丢包恢复技术 |
2.5.2 丢包隐藏技术 |
2.6 本章小结 |
第三章 基于SILK音频编解码算法研究 |
3.1 语音活动检测模块(VAD) |
3.2 基音检测模块 |
3.3 预测分析模块 |
3.4 噪声整形模块 |
3.5 SILK语音编码器模块 |
3.6 SILK语音编解码器测试与分析 |
3.6.1 编码器参数设置 |
3.6.2 解码器参数设置 |
3.6.3 实验设置与结果分析 |
3.7 本章小结 |
第四章 基于压缩感知的语音编解码方法(PLRCS) |
4.1 压缩感知理论 |
4.1.1 信号的稀疏表示 |
4.1.2 压缩感知的数学模型 |
4.1.3 信号重构算法 |
4.2 改进基于压缩感知语音丢包恢复算法 |
4.2.1 交织编码技术 |
4.2.2 观测矩阵设计与优化 |
4.2.3 解码过程 |
4.3 VoIP语音质量评价标准 |
4.3.1 平均意见得分 |
4.3.2 感知语音质量测量 |
4.4 算法测试与分析 |
4.4.1 参数设置 |
4.4.2 实验设置 |
4.4.3 结果分析 |
4.5 本章小结 |
第五章 基于SIP的 Vo IP系统设计与实现 |
5.1 SIP服务器系统配置 |
5.1.1 系统服务器框架设计 |
5.1.2 注册SIP服务器 |
5.2 基于Android的智能客户端设计与实现 |
5.2.1 通话页面设计与实现 |
5.2.2 登陆页面设计与实现 |
5.2.3 嵌入编解码算法 |
5.3 VoIP系统测试与分析 |
5.3.1 注册服务器测试 |
5.3.2 短消息模块测试 |
5.3.3 呼叫服务模块测试 |
5.3.4 系统性能测试 |
5.4 本章小结 |
结论与展望 |
参考文献 |
攻读学位期间取得的学术成果 |
致谢 |
附录 |
(2)基于熵随机的网络流媒体动态隐密通信研究(论文提纲范文)
作者简历 |
摘要 |
abstract |
第一章 绪言 |
1.1 研究背景和意义 |
1.2 信息隐藏技术概述 |
1.2.1 信息隐藏定义及应用 |
1.2.2 信息隐藏技术的分类与研究现状 |
1.3 VoIP流媒体隐密通信研究现状 |
1.3.1 隐藏算法研究 |
1.3.2 随机密钥生成研究 |
1.3.3 隐密通信密钥分配研究 |
1.4 存在问题与难点 |
1.4.1 理论模型问题 |
1.4.2 随机密钥生成问题 |
1.4.3 容量不确定性问题 |
1.4.4 机密信息不完整性问题 |
1.5 本文组织结构 |
1.5.1 本文研究内容及创新点 |
1.5.2 本文组织结构 |
第二章 VoIP流媒体数据通信技术与安全 |
2.1 VoIP基本原理及主要特点 |
2.2 VoIP系统组成 |
2.2.1 终端用户设备 |
2.2.2 网络组件 |
2.2.3 呼叫处理器 |
2.2.4 网关 |
2.2.5 协议 |
2.3 VoIP通信原理及关键技术 |
2.3.1 VoIP通信原理 |
2.3.2 尽力而为服务的局限性 |
2.3.3 VoIP关键技术 |
2.4 VoIP安全性分析 |
2.4.1 VoIP组件的安全性分析 |
2.4.2 VoIP通信的安全问题 |
2.5 本章小结 |
第三章 隐写术与VoIP隐密通信 |
3.1 隐写术系统构成 |
3.1.1 原始载体 |
3.1.2 秘密信息 |
3.1.3 嵌入过程 |
3.1.4 含隐载体 |
3.1.5 隐写密钥 |
3.1.6 提取过程 |
3.2 隐写术的分类 |
3.2.1 根据载体类型分类 |
3.2.2 根据嵌入域分类 |
3.2.3 基于提取/检测条件分类 |
3.2.4 其他分类 |
3.3 基于隐写术的VoIP隐密通信 |
3.4 VoIP隐密通信系统性能评估 |
3.4.1 不可检测性 |
3.4.2 不可感知性 |
3.4.3 安全性 |
3.4.4 隐写容量 |
3.4.5 鲁棒性 |
3.5 VoIP隐密通信面临的攻击 |
3.6 本章小结 |
第四章 VoIP隐密通信理论建模及安全分析 |
4.1 VoIP隐密通信的信息理论模型 |
4.1.1 Cachin隐写信息理论模型及其安全性定义 |
4.1.2 VoIP隐密通信理论建模及安全性证明 |
4.2 VoIP隐密通信算法设计 |
4.2.1 加密算法 |
4.2.2 数据嵌入算法 |
4.2.3 数据提取算法 |
4.3 VoIP隐密通信系统构建 |
4.3.1 VoIP通信模块 |
4.3.2 密钥生成及分配模块 |
4.3.3 数据嵌入及提取模块 |
4.4 VoIP隐密通信实验平台搭建 |
4.4.1 性能测试 |
4.4.2 评估指标 |
4.5 本章小结 |
第五章 基于熵随机和混沌映射随机的VoIP隐密通信 |
5.1 基于硬件熵源和混沌映射的实时VoIP隐密通信设计 |
5.1.1 VoIP通信 |
5.1.2 基于硬件熵源的真随机密钥生成 |
5.1.3 基于混沌映射的VoIP隐密通信嵌入位置选择 |
5.1.4 秘密信息的嵌入与提取 |
5.2 实验设置 |
5.2.1 实验测量性能指标 |
5.2.2 实验平台搭建 |
5.2.3 信号质量测量 |
5.2.4 语音质量测量 |
5.3 实验结果与分析 |
5.3.1 实验测量结果 |
5.3.2 不可检测性分析 |
5.3.3 算法性能比较 |
5.3.4 安全性分析 |
5.4 本章小结 |
第六章 基于单向累积密钥分配的动态VoIP隐密通信 |
6.1 基于动态密钥分配的VoIP隐密通信系统 |
6.1.1 VoIP隐密通信的密钥分配问题 |
6.1.2 基于动态密钥分配的VoIP隐密通信模型 |
6.2 基于单向累积密钥分配的动态VoIP隐密通信设计 |
6.2.1 基于单向累积的密钥分配 |
6.2.2 秘密信息的嵌入 |
6.2.3 秘密信息的提取 |
6.3 安全性分析 |
6.3.1 通信方认证 |
6.3.2 中间人攻击 |
6.3.3 敌手攻击 |
6.4 实验结果与分析 |
6.4.1 不可感知性及鲁棒性分析 |
6.4.2 嵌入间隔影响分析 |
6.4.3 隐藏信息大小影响分析 |
6.4.4 统计不可检测性分析 |
6.4.5 算法性能比较 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 研究成果与创新 |
7.2 研究局限性 |
7.3 未来研究展望 |
致谢 |
参考文献 |
(3)VoIP语音库的体系与生成方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 本文的主要研究内容 |
1.4 论文的组织结构 |
第二章 相关技术及理论介绍 |
2.1 VoIP相关协议介绍 |
2.1.1 VoIP概述介绍 |
2.1.2 H.323协议 |
2.1.3 SIP协议 |
2.1.4 两种协议比较 |
2.1.5 SDP协议 |
2.2 语音编码技术 |
2.3 RTP协议 |
2.4 SRTP协议 |
2.5 加密算法研究 |
2.6 本章小结 |
第三章 基于SIP的通信过程和数据加密研究 |
3.1 通信过程研究 |
3.1.1 SIP协议用户注册 |
3.1.2 请求发起过程 |
3.1.3 会话关闭过程 |
3.2 VoIP加密方式研究 |
3.2.1 HTTP摘要认证 |
3.2.2 S/MIME |
3.2.3 IPSec协议 |
3.2.4 SSL/TLS协议 |
3.2.5 SRTP协议加密研究 |
3.2.6 MIKEY协议 |
3.2.7 SDES密钥管理协议 |
3.3 AES加密算法研究 |
3.3.1 数据填充方式 |
3.3.2 数据加密过程 |
3.3.3 工作模式 |
3.4 SIP安全机制总结 |
3.5 本章小结 |
第四章 VoIP语音库的体系研究 |
4.1 VoIP语音库的建设目的 |
4.2 VoIP语音库设计关键因素 |
4.2.1 发音文本 |
4.2.2 发音人 |
4.2.3 数据存储与标注 |
4.3 VoIP语音库的体系构成 |
4.3.1 VoIP性别库 |
4.3.2 VoIP语种库 |
4.3.3 VoIP场景库 |
4.3.4 VoIP方言库 |
4.3.5 VoIP情感库 |
4.3.6 语音库之间的关联 |
4.4 VoIP语音库的特有属性 |
4.4.1 语音编解码器 |
4.4.2 数据的加密方式 |
4.5 语音库的构建标准 |
4.5.1 语音库的大小 |
4.5.2 构建方法 |
4.5.3 数据的均衡性研究 |
4.6 本章小结 |
第五章 系统的设计与实现 |
5.1 需求分析 |
5.2 设计目标 |
5.3 技术可行性分析 |
5.4 总体架构设计 |
5.5 预处理模块 |
5.5.1 端点检测 |
5.5.2 基于双门限的端点检测 |
5.5.3 语音文件的重采样 |
5.6 输入模块的设计和实现 |
5.6.1 输入模块的设计 |
5.6.2 输入模块的实现 |
5.7 文件处理模块的设计与实现 |
5.7.1 文件处理模块的设计 |
5.7.2 文件处理模块的实现 |
5.8 语音编码模块 |
5.8.1 语音编码模块设计 |
5.8.2 语音编码模块的实现 |
5.9 数据包封装模块的设计与实现 |
5.9.1 数据包封装模块的设计 |
5.9.2 数据包封装模块的实现 |
5.10 输出模块的设计与实现 |
5.10.1 输出模块的设计 |
5.10.2 输出模块的实现 |
5.11 数据加密模块 |
5.11.1 数据加密模块的设计 |
5.11.2 加密模块的实现 |
5.12 语音标签的自动获取 |
5.12.1 特征选取 |
5.12.2 MFCC |
5.12.3 基于DNN的识别 |
5.12.4 基于CNN的识别 |
5.13 本章小结 |
第六章 VoIP生成方法的系统测试 |
6.1 系统基础环境 |
6.2 文件的处理 |
6.3 加密算法验证 |
6.4 数据包的封装验证 |
6.5 基于DNN的说话者性别识别实验 |
6.5.1 数据集 |
6.5.2 MFCC维度的影响 |
6.5.3 语音数据时长的影响 |
6.6 基于CNN的语种识别 |
6.6.1 数据集介绍 |
6.6.2 网络结构 |
6.6.3 实验结果 |
6.7 工具总结 |
6.8 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(4)多功能护理床视音频监控系统设计与实现(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题的研究背景和意义 |
1.2 远程医疗国内外发展及现状 |
1.2.1 国外远程医疗的发展及现状 |
1.2.2 国内远程医疗的发展及现状 |
1.2.3 视频监控技术发展概述 |
1.3 论文研究内容和结构 |
1.4 本章小结 |
第2章 相关技术概述 |
2.1 NAT穿透技术 |
2.2 P2P通信技术 |
2.2.1 中继传递技术 |
2.2.2 UDP打洞 |
2.3 几种重要函数 |
2.3.1 C++链接库 |
2.3.2 回调函数机制 |
2.3.3 Win32 API |
2.3.4 STL库 |
2.3.5 音频接口waveXXX |
2.4 MFC概述 |
2.5 多线程编程与线程同步 |
2.5.1 Win32 API多线程编程 |
2.5.2 MFC多线程编程 |
2.5.3 线程同步 |
2.6 FFmpeg编解码库 |
2.7 DirectDraw组件 |
2.8 本章小结 |
第3章 系统总体架构设计及硬件平台 |
3.1 用户需求 |
3.2 功能需求分析 |
3.3 系统总体方案设计 |
3.3.1 系统硬件方案设计 |
3.3.2 视频采集模块 |
3.3.3 视频压缩平台 |
3.3.4 编码压缩工作流程 |
3.3.5 云台控制模块 |
3.3.6 网络传输模块 |
3.4 本章小结 |
第4章 PC端软件功能模块的设计 |
4.1 尚云互联平台 |
4.2 PC端软件设计思路 |
4.3 视频浏览模块的设计 |
4.3.1 视音频数据接收 |
4.3.2 视频数据解析 |
4.3.3 视频帧缓冲区设计 |
4.3.4 视频解码器设计 |
4.3.5 YUV数据显示设计 |
4.3.6 字符叠加模块设计 |
4.4 多画面视频浏览模块的设计 |
4.5 声音播放模块设计 |
4.5.1 音频缓冲区设计 |
4.5.2 音频解码与播放 |
4.6 音频广播模块设计 |
4.6.1 声音采集 |
4.6.2 音频编码和传输 |
4.7 云台控制模块的设计 |
4.8 注册登陆模块设计 |
4.9 本章小结 |
第5章 客户端软件的实现 |
5.1 客户端软件实现 |
5.1.1 注册登陆模块实现 |
5.1.2 视频浏览模块实现 |
5.1.3 多画面浏览模块实现 |
5.1.4 音频交互模块实现 |
5.1.5 云台控制模块实现 |
5.2 本章小结 |
第6章 结论和展望 |
6.1 全文总结 |
6.2 下一步工作展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(5)基于WebRTC的Android端音视频通信系统的设计与实现(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状及趋势 |
1.3 本文研究内容 |
1.4 本文章节安排 |
第二章 系统总体架构与技术基础 |
2.1 系统总体设计架构 |
2.1.1 设计思路 |
2.2 WebRTC结构 |
2.2.1 音频引擎技术 |
2.2.2 视频引擎技术 |
2.2.3 用户数据报协议UDP |
2.2.4 RTP/RTCP |
2.3 NAT类型 |
2.3.1 完全圆锥形NAT |
2.3.2 受限圆锥形NAT |
2.3.3 端口受限圆锥形NAT |
2.3.4 对称形NAT |
2.4 开发平台及环境 |
2.4.1 Android平台介绍 |
2.4.2 NDK的配置 |
2.5 本章小结 |
第三章 系统服务端的设计与实现 |
3.1 服务器的功能需求分析 |
3.2 房间服务器的搭建 |
3.3 信令服务器的搭建 |
3.3.1 信令响应 |
3.4 服务器实现NAT穿越方案 |
3.4.1 基于STUN协议实现NAT穿越 |
3.4.2 基于TURN协议实现NAT穿越 |
3.4.3 基于ICE框架实现NAT穿越 |
3.5 打洞服务器的搭建 |
3.6 本章小结 |
第四章 系统客户端的设计与实现 |
4.1 WebRTC安卓平台下载编译环境搭建 |
4.2 安卓端音视频流的采集 |
4.3 客户端通信的实现 |
4.3.1 同一内网下通信 |
4.3.2 4G网络下通信 |
4.4 音频引擎技术的设计与实现 |
4.4.1 音频引擎设计 |
4.4.2 音频引擎实现 |
4.4.3 NetEQ的设计与实现 |
4.5 视频引擎技术的设计与实现 |
4.5.1 视频引擎设计 |
4.5.2 视频引擎实现 |
4.6 用户交互界面的设计 |
4.7 网络反馈与控制 |
4.7.1 NACK丢包重传的设计与实现 |
4.7.2 带宽自适应的设计与实现 |
4.8 音视频同步的设计实现 |
4.8.1 RTP时间戳的产生 |
4.8.2 SR报文构造与收发 |
4.8.3 音视频同步过程 |
4.9 本章小结 |
第五章 系统测试及分析 |
5.1 测试环境及工具 |
5.2 功能测试 |
5.2.1 同一应用终端测试 |
5.2.2 跨应用终端测试 |
5.2.3 服务器端运行情况 |
5.3 性能测试与分析 |
5.4 本章小结 |
总结与展望 |
参考文献 |
致谢 |
个人简历、在学期间的研究成果及发表的学术论文 |
(6)G.729语音编码抗丢包算法研究及其ARM平台实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 引言 |
1.2 选题背景及研究现状 |
1.2.1 语音通信技术的发展 |
1.2.2 网络电话及存在的问题 |
1.2.3 国内外研究现状 |
1.3 论文研究的目的和意义 |
1.4 论文研究内容和章节安排 |
第二章 语音编码及抗丢包技术 |
2.1 语音编码技术 |
2.2 现有语音通信抗丢包技术 |
2.2.1 抗丢包技术介绍 |
2.2.2 丢包恢复技术 |
2.2.3 丢包补偿技术 |
2.3 本章小结 |
第三章 基于多描述的 G.729 语音编码抗丢包算法 |
3.1 G.729 语音编码算法及抗丢包策略 |
3.1.1 G.729 语音编码算法 |
3.1.2 G.729 错误隐藏性能分析 |
3.1.3 G.729 编码算法抗丢包策略 |
3.2 多描述编码算法 |
3.2.1 多描述编码算法概述 |
3.2.2 多描述抗丢包语音编码算法框架 |
3.3 基于多描述的抗丢包 G.729 语音编解码算法框架设计 |
3.3.1 抗丢包 G.729 多描述编码器设计 |
3.3.2 抗丢包 G.729 多描述解码器设计 |
3.4 基于标量双描述算法的 G.729 语音编解码器实现 |
3.4.1 标量双描述编码算法 |
3.4.2 G.729 标量双描述抗丢包编解码器设计实现 |
3.5 基于交织双描述算法的 G.729 语音编解码器实现 |
3.5.1 交织双描述算法 |
3.5.2 G.729 交织双描述语音编解码器实现 |
3.6 本章小结 |
第四章 抗丢包 G.729 语音编解码器 ARM 平台实现 |
4.1 ARM 平台介绍 |
4.2 抗丢包 G.729 语音编码程序的 ARM 开发环境移植 |
4.2.1 ADS 开发环境介绍 |
4.2.2 抗丢包 G.729 语音编解码程序 ADS 开发环境移植 |
4.3 抗丢包 G.729 语音编解码器 ARM 平台优化 |
4.3.1 优化原则 |
4.3.2 循环结构优化 |
4.3.3 判断结构优化 |
4.3.4 指针优化 |
4.3.5 数值操作优化 |
4.3.6 汇编指令优化 |
4.3.7 ARM 流水线互锁优化 |
4.3.8 函数调用优化 |
4.3.9 编译参数配置优化 |
4.3.10 ADS 开发环境下优化结果测试 |
4.4 优化后编解码程序的 ARM-Linux 设备移植 |
4.5 本章小结 |
第五章 性能测试评估 |
5.1 抗丢包性能测试 |
5.1.1 语音质量的评定方法 |
5.1.2 抗丢包性能测试环境搭建 |
5.1.3 抗丢包性能测试结果 |
5.2 ARM 平台优化测试 |
5.2.1 优化前后语音质量的测试结果 |
5.2.2 程序在 ARM 设备上运行速度评定方法 |
5.2.3 在 ARM 设备上优化前后程序的 MCPS 测试结果 |
5.3 本章小结 |
第六章 结论 |
6.1 论文总结 |
6.1.1 论文完成工作总结 |
6.1.2 论文成果 |
6.2 后续工作 |
致谢 |
参考文献 |
附录 A |
附录 B |
附录 C |
(7)宽带变速率语音编解码算法研究及其在嵌入式平台上的实现(论文提纲范文)
致谢 |
中文摘要 |
ABSTRACT |
1 绪论 |
1.1 编码技术简介 |
1.2 语音编码技术分类及发展过程 |
1.3 宽带语音编码算法研究意义 |
1.4 语音编码技术的实现现状及实现手段 |
1.5 论文研究的内容及论文的组织结构安排 |
1.5.1 论文研究的内容与主要工作 |
1.5.2 论文的创新之处及论文研究的意义 |
1.5.3 论文的组织结构安排 |
2 G.729.1算法结构分析及PC平台验证 |
2.1 引言 |
2.2 G.729.1算法结构分析 |
2.2.1 G.729.1编码器结构 |
2.2.2 G.729.1解码器结构 |
2.2.3 比特分配 |
2.3 G.729.1标准的性能分析 |
2.3.1 算法延迟及复杂度估计 |
2.3.2 主观语音质量 |
2.4 基于PC机的G.729.1测试平台设计 |
2.4.1 测试平台的意义 |
2.4.2 测试平台的软件流程设计 |
2.4.3 测试平台的实现 |
2.4.4 码流数据格式调整 |
2.4.5 编码前后压缩比 |
2.4.6 测试结果 |
2.5 本章小结 |
3 基于IP软核的SoPC嵌入式系统设计 |
3.1 可重用设计方法 |
3.2 基于IP软核的SoPC嵌入式系统设计方法 |
3.2.1 系统级设计方法——IP核复用 |
3.2.2 模块级设计方法——IP核设计 |
3.3 嵌入式软核处理器 |
3.3.1 NiosⅡ软核处理器 |
3.3.2 Avalon总线、HAL库和自定义指令 |
3.3.3 NiosⅡ设计流程 |
3.4 嵌入式DSP |
3.4.1 DSP Builder |
3.4.2 DSP Builder设计流程 |
3.4.3 DSP Builder设计规则 |
3.5 本章小结 |
4 基于NiosⅡ的G.729.1编解码器系统设计 |
4.1 基于NiosⅡ的G.729.1编解码器系统需求分析 |
4.1.1 功能需求分析 |
4.1.2 性能需求分析 |
4.2 基于NiosⅡ的G.729.1编解码器设计规范 |
4.2.1 硬件设计规范 |
4.2.2 软件设计规范 |
4.2.3 基于NiosⅡ的G.729.1编解码器系统的特点 |
4.3 基于NiosⅡ的G.729.1编解码器系统模型 |
4.4 基于NiosⅡ的G.729.1编解码器系统软/硬件划分 |
4.4.1 基于NiosⅡ的G.729.1编解码器系统硬件结构 |
4.4.2 基于NiosⅡ的G.729.1编解码器系统软件结构 |
4.5 本章小结 |
5 基于NiosⅡ的G.729.1编解码器IP核设计 |
5.1 G.729.1编解码器用户自定义指令集设计 |
5.1.1 自定义指令逻辑设计 |
5.1.2 自定义指令接口规范 |
5.1.3 自定义指令仿真测试 |
5.1.4 自定义指令硬件综合与下载验证 |
5.1.5 实验结果 |
5.2 用户外设IP核设计 |
5.2.1 算法结构 |
5.2.2 算法模型与仿真测试 |
5.2.3 总线接口与HAL |
5.2.4 硬件语言转换与综合 |
5.2.5 实验结果 |
5.3 本章小结 |
6 现代DSP与传统DSP设计方法上的比较 |
6.1 传统DSP设计概述 |
6.2 现代DSP设计概述 |
6.3 现代DSP与传统DSP比较 |
6.3.1 设计流程 |
6.3.2 运算速度 |
6.3.3 系统集成度 |
6.3.4 知识产权自主性 |
6.3.5 结论 |
6.4 本章小结 |
7 总结与展望 |
7.1 论文工作总结 |
7.2 展望 |
7.3 结束语 |
参考文献 |
作者简历 |
学位论文数据集 |
(8)移动IP语音通信系统音频编解码器的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题的背景和来源 |
1.2 移动IP语音通信技术概述 |
1.2.1 移动IP技术简介 |
1.2.2 移动IP语音通信概述 |
1.2.3 移动IP语音通信面临的问题 |
1.3 语音编解码器概述 |
1.3.1 语音编解码技术的发展历程 |
1.3.2 iLBC语音编解码器概述 |
1.4 SIP协议简介 |
1.5 论文主要工作及内容 |
第二章 移动IP语音通信系统的实现技术 |
2.1 移动IP与SIP移动性 |
2.1.1 移动IP工作原理 |
2.1.2 SIP移动性与移动IP |
2.1.3 选用SIP的原因 |
2.2 SIP相关协议 |
2.2.1 SIP协议分析 |
2.2.2 SDP协议分析 |
2.2.3 RTP/RTCP协议 |
2.2.4 NAT技术 |
2.3 小结 |
第三章 移动IP语音通信系统的设计及实现 |
3.1 系统设计 |
3.1.1 系统需求 |
3.1.2 设计思想与开发环境 |
3.1.3 系统设计 |
3.2 系统的实现 |
3.2.1 协议栈模块的实现 |
3.2.2 Server模块的实现 |
3.2.3 NAT模块的实现 |
3.2.4 网络通信模块的实现 |
3.2.5 RTP/RTCP模块的实现 |
3.2.6 语音模块的实现 |
3.2.7 应用程序的实现 |
3.3 小结 |
第四章 iLBC音频编解码器的研究与性能分析 |
4.1 移动IP环境对音频编解码器的要求 |
4.2 CELP算法的主要技术分析 |
4.2.1 线性预测技术 |
4.2.2 Levinson-Durbin递归算法 |
4.2.3 线谱对(LSP)分析 |
4.2.4 语音信号的矢量量化 |
4.2.5 感知权重滤波器 |
4.3 编解码器原理 |
4.3.1 编码器原理 |
4.3.2 解码器原理 |
4.4 iLBC音频编解码器的性能分析 |
4.4.1 iLBC的性能分析 |
4.4.2 iLBC的技术优势 |
4.4.3 iLBC适合移动IP环境 |
4.5 小结 |
第五章 iLBC音频编解码器的软件实现及优化 |
5.1 iLBC的软件实现 |
5.1.1 浮点源代码的分析 |
5.1.2 iLBC编解码算法的实现 |
5.2 优化方案 |
5.2.1 算法优化 |
5.2.2 代码优化 |
5.3 算法仿真测试 |
5.3.1 算法优化前后运算量比较 |
5.3.2 语音数据分析 |
5.4 小结 |
第六章 系统实现与测试 |
6.1 系统实现 |
6.1.1 系统的实现 |
6.1.2 系统效果 |
6.2 系统测试 |
6.2.1 测试环境 |
6.2.2 测试结果 |
6.3 小结 |
结束语及展望 |
参考文献 |
发表论文和参加科研情况 |
致谢 |
(9)基于强化学习的人机谈判系统(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景 |
1.2 研究的动机 |
1.3 技术路线 |
1.4 本文主要贡献 |
1.5 本文结构 |
第2章 文献综述 |
2.1 引言 |
2.2 对话管理 |
2.2.1 对话行为识别 |
2.2.2 对话状态跟踪 |
2.2.3 对话策略 |
2.2.4 本节小结 |
2.3 对话回应生成 |
2.3.1 基于规则的方法 |
2.3.2 基于知识的方法 |
2.3.3 基于深度学习的方法 |
2.3.4 基于生成式的特殊模型 |
2.3.5 基于知识和深度学习的混合方法 |
2.3.6 本节小结 |
2.4 对话系统的评估 |
2.4.1 评估基于任务的对话系统 |
2.4.2 评估开放域对话系统 |
2.4.3 基于学习的评估 |
2.4.4 挑战 |
2.4.5 本节小结 |
2.5 强化学习 |
2.5.1 简介 |
2.5.2 Q学习算法 |
2.5.3 本节小结 |
2.6 人机谈判 |
2.6.1 人机谈判必要性 |
2.6.2 人机谈判策略 |
2.6.3 谈判的相关方法 |
2.6.4 基于强化学习的人机谈判 |
2.6.5 本节小结 |
2.7 本章小结 |
第3章 系统结构 |
3.1 引言 |
3.2 人机谈判对话系统框架 |
3.3 系统模型定义 |
3.4 系统主函数 |
3.5 本章小结 |
第4章 人机谈判系统的用户界面 |
4.1 引言 |
4.2 用户界面的设计 |
4.2.1 基于微信小程序的前端输入 |
4.2.2 基于Flask框架的后台输出 |
4.3 用户界面的实现 |
4.4 本章小结 |
第5章 谈判对话理解 |
5.1 引言 |
5.2 对话理解的方法 |
5.2.1 基于特征词抽取的匹配算法 |
5.2.2 基于fast Text的意图识别 |
5.3 对话理解的实现 |
5.4 本章小结 |
第6章 基于强化学习的对话谈判管理 |
6.1 引言 |
6.2 对话谈判管理的原理 |
6.2.1 用户行为建模 |
6.2.2 基于Q学习的谈判策略 |
6.2.3 基于Q学习与用户行为建模的谈判策略 |
6.3 对话谈判管理的实现 |
6.4 本章小结 |
第7章 谈判回应生成 |
7.1 引言 |
7.2 基于模板匹配的回应生成方法 |
7.3 对话回应生成的实现 |
7.4 本章小结 |
第8章 谈判示例与分析 |
8.1 引言 |
8.2 谈判示例展示 |
8.3 谈判成功示例分析 |
8.4 谈判破裂示例分析 |
8.5 本章小结 |
第9章 系统评估 |
9.1 引言 |
9.2 意图识别模型的性能 |
9.3 价格谈判的衡量指标 |
9.4 用户满意度 |
9.5 本章小结 |
第10章 结束语 |
10.1 总结 |
10.2 展望 |
参考文献 |
附录A 意图识别模型的部分训练语料 |
A.1 问候意图类部分语料 |
A.2 商品询问意图类部分语料 |
A.3 谈判破裂意图类部分语料 |
A.4 谈判成功意图类部分语料 |
附录B 部分回复模板 |
B.1 问候类部分回复模板 |
B.2 商品询问类部分回复模板 |
B.3 谈判成功类部分回复模板 |
B.4 谈判破裂类部分回复模板 |
B.5 价格谈判类部分回复模板 |
读硕期间获得的成果与奖励 |
致谢 |
(10)网络流量模型及异常检测技术研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 异常检测的定义分类及应用 |
1.3 异常检测研究方法 |
1.3.1 传统异常检测方法 |
1.3.2 基于机器学习方法 |
1.3.3 基于信息熵和小波的异常检测 |
1.4 异常检测面临的问题挑战 |
1.4.1 传统模型存在的问题 |
1.4.2 监督、半监督学习面临的挑战 |
1.5 论文主要贡献及创新点 |
1.6 本论文的结构安排 |
第二章 网络流量模型及异常检测研究综述 |
2.1 网络流量模型及异常检测 |
2.1.1 网络流量模型 |
2.1.2 网络流量异常检测 |
2.1.3 加密网络流量识别检测 |
2.2 基于深度学习的异常检测 |
2.3 基于强化学习的异常检测 |
2.4 本章小结 |
第三章 基于熵和统计机器学习的流量研究 |
3.1 背景 |
3.2 基于统计的流量模型 |
3.3 模型详细设计 |
3.3.1 园区流量模型 |
3.3.2 Web流量模型 |
3.3.3 混合模型 |
3.3.4 分析与小结 |
3.4 基于近邻和DTW的视频检测识别方法 |
3.4.1 视频检测背景技术 |
3.4.2 设计方法 |
3.5 机器学习和信息熵融合的检测识别 |
3.5.1 信息熵平衡估计 |
3.5.2 流量数据平衡信息熵评估 |
3.5.3 熵和机器学习融合算法 |
3.6 本章小结 |
第四章 基于深度学习的流量及异常检测 |
4.1 深度神经网络基本理论 |
4.2 网络流量模型基本原理 |
4.2.1 卷积神经网络基本原理 |
4.2.2 LSTM基本原理 |
4.3 基于自编解码的流量模型 |
4.3.1 自编解码基本原理 |
4.3.2 模型设计 |
4.4 基于注意力机制的流量模型 |
4.4.1 基本原理 |
4.4.2 模型设计 |
4.4.3 实验结果 |
4.5 基于TCNatt-VAE的异常检测方法 |
4.5.1 模型基本原理 |
4.5.2 异常检测模型 |
4.5.3 实验结果 |
4.6 本章小结 |
第五章 基于生成式对抗神经网络的流量及异常检测 |
5.1 背景 |
5.2 模型基本原理 |
5.3 基于GAN的网络流量模型 |
5.3.1 问题描述 |
5.3.2 流量模型设计 |
5.4 基于GAN的流量异常检测 |
5.4.1 模型设计 |
5.5 实验结果及分析 |
5.5.1 流量模型 |
5.5.2 异常检测模型 |
5.6 本章小结 |
第六章 基于强化学习的网络异常检测研究 |
6.1 背景及基本原理 |
6.1.1 背景 |
6.1.2 基本原理 |
6.2 基于强化学习的异常检测 |
6.2.1 问题建模 |
6.2.2 模型设计方法 |
6.3 实验过程 |
6.3.1 三种数据集上的实验 |
6.3.2 实验结果分析 |
6.4 本章小结 |
第七章 全文总结与展望 |
7.1 全文总结 |
7.2 后续工作展望 |
致谢 |
参考文献 |
攻读博士学位期间取得的成果 |
四、用于实时IP语音开发的编码/解码器(论文参考文献)
- [1]面向移动互联网实时语音通信的压缩感知编解码方法研究[D]. 杜佳梦. 广东工业大学, 2020(06)
- [2]基于熵随机的网络流媒体动态隐密通信研究[D]. 彭景惠. 中国地质大学, 2020(03)
- [3]VoIP语音库的体系与生成方法研究[D]. 张文. 电子科技大学, 2020(08)
- [4]多功能护理床视音频监控系统设计与实现[D]. 江志远. 南昌大学, 2019(02)
- [5]基于WebRTC的Android端音视频通信系统的设计与实现[D]. 吴晨. 福州大学, 2018(03)
- [6]G.729语音编码抗丢包算法研究及其ARM平台实现[D]. 陈羿江. 西安电子科技大学, 2012(03)
- [7]宽带变速率语音编解码算法研究及其在嵌入式平台上的实现[D]. 沈阳. 北京交通大学, 2008(09)
- [8]移动IP语音通信系统音频编解码器的研究[D]. 雷晓荣. 西北工业大学, 2007(06)
- [9]基于强化学习的人机谈判系统[D]. 范怡帆. 广西师范大学, 2021(09)
- [10]网络流量模型及异常检测技术研究[D]. 周琨. 电子科技大学, 2021(01)