流数据的频繁项算法研究

流数据的频繁项算法研究

一、流数据频繁项算法研究(论文文献综述)

白彬彬[1](2021)在《网络未知协议语法的智能逆向分析方法研究》文中研究说明近年来,随着互联网发展瞬息万变、5G技术的崛起日新月异,网络安全问题的新闻出现的频率逐渐增多。网络安全问题不仅关乎个人利益,也关系着社会稳定。到目前为止,常见的协议分析方法主要针对上层的协议,而未知协议类型繁多,尤其是私有协议或尚未公开的协议,分析难度较大,使用普通的分析方法很难达到好的效果。针对以上情况,本文以网络协议为研究对象,以多种协议混合分类作为目标,着重探讨未知协议语法的智能逆向分析方法。然后探讨如何对未知协议特征提取算法进行优化,使得比特流协议特征提取更加准确高效。这篇论文研究工作主要包括以下几个方面:(1)设计一种新的未知协议特征提取优化算法。通过对数据进行遍历找出满足支持度阈值的最长数据,并以最长数据的长度初始化一维向量。通过遍历数据集找出每个位置元素的重复次数,根据支持度对向量进行切分。并去除掉坏字符,形成初始频繁项集。然后通过支持度计算以及串统计去除噪声,这样剪枝可以减少后续的工作量。在此基础上对获得的特征集进行去除包含操作,并将结果存入到特征集中。最后进行特征集的支持度过滤和去重操作。将结果保存入协议特征库,为后续工作提供基础工作。(2)提出一种智能化协议逆向分析方法。首先将协议转化为图像后,将数据进行标签化,然后建立卷积神经网络模型,通过设置卷积层、池化层、全连接层,将数据映射到n类协议结果中,最后使用该模型对测试数据进行测试,然后调整模型参数,使得模型尽可能优化。设计智能协议分析方法,将协议类别识别效率提高15%。(3)设计并实现未知协议语法分析系统。采用协议特征库以及智能逆向分析算法综合验证,并设计评价指标。结果表明,采用智能化协议语法逆向分析方法,通过引入卷积神经网络算法,并结合未知协议特征提取优化方法,降低算法运行时间的同时提高协议识别精度5%。通过测试未知协议数据可以表明,所构造的系统在保证精确度的基础上,降低了系统的响应时间,为网络数据传输数据流提供安全防控、数据分析,精准检测提供技术手段。

苗艳微[2](2021)在《面向高速流数据的sketch算法研究》文中指出流数据的分析在异常检测、网络管理等应用中起到重要的作用,它的一项关键任务是统计每个数据出现的次数。随着互联网技术的发展,高到达速率、巨大规模的流数据成为主流。如何利用有限的计算能力存储大规模的流数据成为一个挑战。相关文献已经证明,sketch算法具有高处理速度、高准确率、高内存使用效率的优点,适用于流数据的频数估计任务。虽然学术界关于sketch算法已有大量的研究,但是sketch仍然有两个挑战需要解决。一是多层sketch的索引结构需要存储偏态流数据集数据的索引值,而目前多层sketch的索引结构往往在均匀流数据集上可以产生良好的效果,缺乏对偏态流数据集的支持。二是多层sketch的各个层级结构的大小在分配后不能改变,而在实际流数据处理过程中,由于流数据的规模不能预先确定,预先分配各个层级结构的内存可能会影响sketch的准确性。针对第一个问题,基于实际流数据集数据的频数差别较大的事实,本文提出对不同数据的索引值进行差异化存储的思想。借助这一思想,本文提出了Rhombus sketch算法,Rhombus sketch的索引结构由不同的标志计数器数组构成,每个数组利用标志计数器判断数据在对应层的存储计数器是否发生溢出。此外,为符合每层存储结构发生计数器溢出的数据不断减少的特点,Rhombus sketch索引结构每个数组的计数器的数量不断减少。Rhombus sketch索引结构根据数据的实际数量分配标志计数器,提高数据索引值的准确率,在偏态流数据集上产生良好的效果。针对第二个问题,本文提出一种基于Rhombus sketch的可动态调整的sketch算法—DARS sketch。DARS sketch根据对流数据规模的估计,调整多层sketch层级结构的内存分配。当不同层级计数器冲突同时发生时,DARS sketch减少低层结构的存储内存,增加高层结构的可用内存。并且,DARS sketch保证了数据的存储位置在内存调整前后是一致的。这种调整方式充分利用了多层sketch高层级计数器冲突的影响高于低层级计数器冲突的影响的结构特点,因此,与未进行内存调整的sketch相比,DARS sketch具有更准确的数据频数估计值,更适用于大规模流数据集。本文对所提出的Rhombus sketch算法和DARS sketch算法进行了大量的实验。实验结果表明,Rhombus sketch算法和DARS sketch算法均达到了设计目标。在达到相同的索引准确率时,Rhombus sketch比Diamond sketch节约了45%-78%的内存空间。在内存紧张时,DARS sketch可比Rhombus sketch提升82%的准确率。

杨洋[3](2020)在《考虑区域类型差异的高速公路事故风险识别与交通安全评价研究》文中指出近年来,随着高速公路里程的飞速增长,其给人们的生活生产带来便捷的同时,伴随而来的交通事故和安全隐患等问题亦不容忽视。在既有高速公路事故风险相关研究中,研究对象主要聚焦于特定地理地貌或单一路段类型,忽略了区域类型特征差异对高速公路事故致因分析、事故征兆因子识别以及交通安全水平评估带来的影响,并且缺乏各区域类型间并行层面比较。随着高精度交通流数据的获取成为可能,静态、被动的传统高速公路安全提升方法逐渐被基于实时动态交通数据的主动安全控制技术取代,但在动态交通流特征与交通安全关系的研究中,仍然存在区域类型差异针对性不强的问题。此外,传统的高速公路交通安全评价研究主要集中在微观路段层面,多以“事故强度分析”思路为主,缺乏考虑宏观区域类型差异的高速公路综合交通安全水平评价相关研究。因此,传统的高速公路交通安全分析方法难以对不同区域类型高速公路的安全管理工作提供精确指导。鉴于此,本文以区域类型差异条件下的高速公路为研究对象,依照“事故致因差异判断—动态交通流事故风险识别—交通安全水平评价”的逻辑,逐层展开研究。重点解答如下关键科学问题:不同区域类型高速公路风险因子与事故间的关联关系是否相同;事故维度及致因维度各变量间存在何种深层次的自相关规律;各区域类型高速公路的交通流运行状态与交通安全之间的关系存在何种差异;如何利用高精度交通流数据对不同区域类型和交通状态下的高速公路动态事故风险机理进行有效研判;区域类型差异条件下的高速公路交通安全水平如何定量判别。具体研究内容主要包括以下四个方面:(1)基于改进WODMI-Apriori关联规则挖掘算法的区域类型差异条件下的高速公路交通事故致因分析将研究区域分为城区、乡区和山区高速公路,提出了一种考虑定向约束和指标赋权的多维度交互改进Apriori关联规则挖掘算法(Weighted Orientated Multiple Dimension Interactive-Apriori,WODMI-Apriori),以基于区间层次分析法(IAHP)和灰色关联度的主客观联合赋权模型对数据字段进行权重优化,应用改进的关联规则挖掘算法,分别对三个不同区域类型的高速公路进行了全映射事故致因角度、维度交互角度、事故维度自相关角度等多维度交互的关联规则挖掘计算。挖掘结果显示,不同区域类型高速公路具有不同的事故发生机理,其中的各维度层次,也都具有不同的关联规律。结果表明,改进的WODMI-Apriori算法能更好的揭示不同区域类型高速公路中事故致因和风险的差异性,其算法精确度较传统Apriori关联规则算法在城区、乡区、山区高速公路条件下分别提高了82.7%、88.5%、80.5%。(2)区域类型特征差异条件下的高速公路交通流状态安全风险评估首先基于六级服务水平将交通状态划分为饱和流与非饱和流,结合三个区域类型的划分共建立了6个待评单元;进而应用病例—对照配对方法对交通流和事故数据进行了数据匹配和样本结构化设计;最后利用基于MCMC的条件Logistic回归定量评估了不同区域类型和交通状态下的高速公路事故风险。结果表明:流量、速度和占有率与高速公路区域类型及交通状态都具有高度相关性,高速公路区域类型和交通状态均与交通安全存在显着相关性。其中,运行在城区/饱和流状态下的事故风险最大,其事故风险是乡区/非饱和流状态下事故风险的29.6倍。(3)基于动态交通流特征的不同区域类型高速公路交通事故内在机理研究首先,从交通流基础信息、交通流中车队、车辆变道行为、交通流变量短时间内的突变、车辆跟驰行为等反映交通流动态特征的5个维度,共选取了20个相关的交通流变量;随后,利用随机森林算法计算了不同区域类型和交通状态下的事故征兆交通流变量;最后,根据随机森林分析结果中筛选的事故征兆变量,针对不同区域类型和交通状态分别以贝叶斯Logistic回归方法进行建模,构建了交通流变量与事故风险在不同区域类型和交通状态下的统计关系。结果显示,不同区域类型中,影响交通安全的因素各不相同,且同一因素在不同区域类型中的重要度也存在差异,进一步验证了不同区域类型高速公路具有不同的事故发生机理。此外,多个模型结果均表明,同时考虑高速公路区域类型和交通状态差异的实时事故风险评估方法能够更加全面准确地捕捉交通流动态特征与交通安全的关系。(4)考虑区域类型差异的高速公路交通安全评价方法选取5个不同区域类型高速公路作为待评单元,从安全、效率、经济、环境4个方面共考虑了8项评价指标,构建了高速公路综合交通安全评价体系;应用信息熵权重理论,对传统的密切值模型进行了改进,提出了一种基于熵权改进的密切值评价模型;分别从年度、季度划分两个视角对各区域高速公路进行了综合交通安全水平评价。评价结果显示,在年度视角与季度划分视角的结果中,各路段的优劣排序各有不同,各指标在评价过程中也体现出了不同的重要程度,说明不同区域类型高速公路的交通安全水平存在显着差异。此外,改进密切值法计算结果与传统密切值法存在明显差异,主要是由于传统密切值法将评价指标进行了等权重处理,为避免造成结果偏差,有必要对传统密切值模型进行权重优化改进。密切值法无需确定主观参量、计算快捷、结果分辨率高,可作为高速公路交通安全评价工作中行之有效的一种方法。论文共包括图75幅,表48个,参考文献235篇。

于帅[4](2020)在《基于气象条件与交通流交互作用的高速公路事故风险分析及预测》文中认为道路交通事故目前在世界范围内是第五大致死因素,而在道路交通事故中,高速公路单次交通事故的严重程度更大、伤亡人数更多。传统的高速公路风险管理是被动的、静态的管理,将重点放在了“事后”应急中,已无法适应高速公路现代化、智能化管理的需求。近年来,数据采集、分析技术的发展,以及交通事故预警系统的研发,使高速公路风险管理由“事后应急管理”开始转变为“事前主动防控”。高速公路风险“事前”管理是运用数据挖掘手段,通过对与高速公路交通事故相关的高精度交通流特征、天气条件等数据的分析,识别影响高速公路安全运行的风险因素,判断高速公路运行的安全状态,对当前运行环境下高速公路是否会发生事故进行精准预测。高速公路管理部门可以根据以上分析及预测结果,提前进行针对性的高速公路预警及布置应急工作,提升高速公路安全管控水平,降低交通事故发生数量,减轻事故严重程度。目前我国高速公路风险主动管理还处于初级阶段,需要科学、实用的方法对其建设进行支撑,因此本文以高速公路安全风险为研究对象,以高速公路交通流动态特征与气象条件的交互作用为切入点,运用风险分析理论架构,从风险识别、风险评估及风险预测三个角度对高速公路主动风险管理的关键技术进行研究,为高速公路管理部门制定风险防控措施提供决策支持,主要研究内容包括以下三个方面:(1)高速公路事故风险因素识别首先,利用关联规则挖掘方法识别影响高速公路安全运行的风险因素。在收集、整理并分析高速公路交通事故统计数据的基础上,发现影响高速公路安全运行的风险因素具有多层次、多维度的特点,且不同因素之间存在相关性,因此提出了基于Apriori算法改进的多维多层AHP加权Top-k关联规则挖掘算法的高速公路风险因素识别方法,该方法克服了传统统计分析方法无法避免的影响因素之间相关性问题,同时解决了经典关联规则需要在挖掘过程中设置最小支持度阈值导致错失重要关联规则的问题,实现了对影响高速公路安全运行风险因素的深度挖掘。通过对挖掘出来的关联规则进行筛选和对比分析,有效识别了影响高速公路安全的关键风险因素为交通流特征和天气特征,为接下来的高速公路安全状态评估提供了研究基础。(2)基于气象条件与交通流交互作用的高速公路安全状态划分和评价其次,对高速公路安全风险状态进行评估。综合考虑天气特征与交通流特征之间的关联关系,运用“病例-对照”样本结构数据匹配方法,提取高速公路交通事故发生点对应的事故发生前上下游交通流状态数据以及与其相匹配的高精度天气数据,避免了其他混杂因素的影响;在此基础上计算能够表征交通安全状态的复合指标,并采用随机森林算法筛选出变量重要度靠前的重要指标,解决了后面计算过程中的维度灾难问题。接着针对评价指标同时包含数值型数据与分类型数据的混合型数据特点,提出了基于模糊k-prototypes算法的高速公路安全状态划分方法,并基于贝叶斯Logistic回归方法评估不同交通安全状态对事故风险的影响。结果表明同时考虑天气和交通流动态特征条件下高速公路安全状态可以划分为6类,而只考虑交通流特征时只能将高速公路安全状态划分为5类,说明同时考虑天气条件和交通流动态特征条件下的高速公路安全状态划分的更加精细。(3)基于气象条件与交通流交互作用的高速公路事故风险预测最后,对高速公路安全风险进行预测。定量分析天气因素与交通流特征之间存在的交互效应,并证明了在高速公路安全风险评估中加入天气因素能够提升模型对高速公路事故风险的判别精度。接着在考虑天气因素与交通流特征的基础上提出了基于学习率自适应随机梯度提升算法的高速公路事故风险预测模型,实现对基于气象条件与交通流交互作用的高速公路安全风险进行预测。预测结果显示本文所建模型在同时考虑天气及交通流特征情况下预测准确率最高,同时在数据有缺失值及异常值情况下仍有较高的预测准确率。

李鹏[5](2020)在《通信网告警规则挖掘系统的设计与实现》文中指出在普及通信和网络的时代,民众对通信网络质量的要求很高。通信网设备故障不但会导致网络质量下降,还会对用户体验产生负面影响,甚至会造成经济上的损失。由此,对于通信网络质量的要求达到苛刻的程度。通信网告警是反应通信网络状态最敏感的信号。现在的通信网组网密集且复杂,单一原因引起的故障很容易产生告警风暴。现有的分析逻辑是:事先给出规则来进行告警归并和分析处理。这种方法没有办法对新的规则自动发现,无法响应新出现的各种状况;也无法有效应对通信网日益复杂的组网结构和处理告警风暴。因此,通信网告警规则的自动发现是有价值、有意义的。本文针对通信网告警数据的特点,结合关联分析算法进行分析,使得告警规则可以被主动发现。针对实际告警数据的特点和算法输入所需数据结构的要求,设计并实现从现网抽取告警数据,关联资源,过滤无效值,进行有效分组等操作,以满足数据挖掘算法的输入要求。本文采用从批处理到分布式,再到流式数据的处理方式;应用大数据与流式数据处理分析平台等技术,挖掘出相关告警规则。对于算法挖掘出的结果进行分析、归类和总结。完成界面和数据挖掘处理相关模块的设计、实现和功能测试。主要的成果有:运用软件工程的思想,结合通信网告警数据的现实分析需求,应用数据挖掘中关联分析的相关算法技术,对系统进行了需求分析、详细设计及实现,最后给出测试结果并进行分析、总结、归纳。设计并实现界面层相关模块,实现结果查看、任务下发、派发专家组等功能。实现应用频繁模式算法(Apriori、FP-Growth)、序列模式数据挖掘算法(Prefix Span)分析告警数据,得到可用的告警频繁模式和告警序列模式。设计并实现从常规数据量分析到Spark集群上基于机器学习(MLlib)包的分布式分析相关模块,实现对海量告警数据分析。设计并实现从静态到流式数据分析(Spark Streaming)相关模块,实现对告警数据流的分析。分析通信网告警数据中的频繁模式和序列模式,针对挖掘出的告警规则进行分析和归类,探索达到可以实际应用所需要的参数参考阈值。并对系统进行充分的测试,达到预期效果。

陶虹妃[6](2020)在《基于时空轨迹的伴随车发现方法研究与实现》文中研究表明智能交通系统(intelligent transportation system,ITS)能够产生两类典型的实时交通大数据:一类是GPS数据,另一类是车牌识别流式数据(automatic number plate recognition data,ANPR)。从实时交通大数据中发现车辆的伴随关系已经成为国内外的研究热点,该研究可以应用到交通管理,公安治理等领域。然而,实时的交通大数据具有连续产生、有序到达、无限增长和数据规模不可预知等特点,如何及时准确地从实时的交通大数据中发现伴随车组成为了当前亟待解决的问题。为解决相关问题,本论文从两类典型的实时交通大数据出发进行研究:基于车牌识别数据ANPR,提出一种基于增量计算的分布式伴随车即时发现方法;基于车载设备收集的GPS数据,提出一种基于时间敏感性的轨迹相似性度量算法实时挖掘伴随车组。本论文的主要研究工作和贡献如下:1.针对传统挖掘算法在处理大规模流式车牌识别数据ANPR时效率无法满足实时性要求的问题,本文提出一种针对流式车牌数据的增量挖掘算法。首先,将传统频繁模式增量挖掘算法进行改进向Spark计算模型迁移,实现并行的增量挖掘;其次,本文提出一种可动态调整的伴随车组结构DF-tree,采用自底向上的指针走向来搜索伴随车组,提高查询速度;最后,针对伴随车发现的时效性要求,提出一种时间加权计数的伴随车即时发现算法,最终实现基于大规模过车数据的伴随车即时发现。2.针对挖掘GPS实时轨迹数据时的实时性要求,本文提出一种基于时间敏感性的轨迹相似性度量算法实时挖掘伴随车组。首先,本文引入最小边界扇形(Minimum Bounding Sector,MBS)实时分割算法进行实时轨迹分段;然后,在传统DTW算法和LCSS算法基础上设计了时间敏感性自适应算法度量轨迹相似度;最后,采用分布式流数据处理框架Spark Streaming实现实时的GPS轨迹相似性度量算法,即时挖掘伴随车组。实验结果表明,本文建立的增量挖掘模型和时间敏感性轨迹相似性度量算法对及时、准确挖掘伴随车辆是行之有效的。

雷岳甡[7](2020)在《在线个体特征识别和行为预测研究》文中认为人文社会科学通过人类行为来揭示社会现象和经济现象背后的规律。但受到网络应用不断深入的影响,人类在线行为越来越复杂,其背后隐藏的信息也越来越难以发掘。大数据技术的出现,为这一问题提供了新的解决思路。在线用户行为是人类行为在互联网上的表现方式。通过对在线用户行为数据的收集和分析,可以为政府及企业在决策等问题上提供较为准确的数据支撑,同时也可以为科研人员在研究人类行为时提供理论支撑。本文通过在线用户的点击流数据,结合在线用户的特征以及行为,研究了匿名用户识别问题与用户下一步点击行为预测问题,对影响识别及预测准确率的因素进行了分析。主要的研究内容包括以下两个方面:(1)基于多维轨迹集的匿名用户识别。通过实验验证了在用户的软件点击流数据中包含了用户的行为规律,对比网络浏览数据识别准确率有所提高。提出了一种基于关联规则改进的(Anonymous User Identification,AUI)算法,通过筛选异常数据和减少扫描数据集的次数,降低算法运行的时间成本。同时提出了一种多维轨迹集模型(Multidimensional Trajectory Set,MTS),通过AUI关联算法和向量化方法为每个用户建立独特的多维轨迹集,并结合最大熵自然语言处理方法识别用户。实验表明,MTS模型比基于用户文档的(Support-Based Profiling,SP)算法准确率平均提高5.09%,比C4.5决策树的准确率平均提高10.6%。(2)基于强化学习的用户点击行为预测模型。通过点击流网络构建基准奖励矩阵B-Reward用于分析总体点击行为规律,并通过频繁项集构建权重奖励矩阵Wi-Reward用于分析在特定点击链中的行为规律。结合两个矩阵提出(Combination Matrix Q-Learning,CMQ)预测算法。同时提出了一种基于强化学习的用户点击行为预测模型(Reinforcement Learning-Prediction,RL-P),通过分析影响预测准确率的参数并结合CMQ算法预测用户在当前状态时的下一步点击行为。实验表明,RL-P模型的平均预测准确率为88.28%。随着已知历史点击序列的增加,预测模型的准确率也随之增加,准确率平均提升2.61%。

施佳呈[8](2020)在《交叉口交通状态识别与拥堵传播规律挖掘方法研究》文中研究指明交通拥堵是现代化城市亟待解决的重大难题,交叉口作为道路网络的节点,容易成为交通拥堵的诱发点,对交叉口交通流数据的研究具有重要的理论价值和实践意义。智能化、数据化的交通系统成为解决交通拥堵问题的重要手段之一,如何高效地从海量交通流数据库中获取更多有价值的信息成为学者们探讨的热点内容。因此,在实测数据的基础上,研究交叉口交通状态识别方法和拥堵传播规律对实现拥堵预警和早期干预具有指导性的意义。本文以交叉口交通流量为数据基础,对交叉口交通状态识别和以拥堵传播规律挖掘为基础的交通状态预测进行建模和挖掘,分析城市道路系统中的交通流运行特征。主要研究内容和成果如下:(1)将车辆检测器数据的错误问题分成两类:数据异常和数据缺失。采用阈值法对异常数据进行处理,根据时间序列流量数据的相关性和周期性对缺失数据进行修复。针对无检测器交叉口,考虑与交叉口相关路段沿线两侧用地出入口交通流量的影响,将有检测器交叉口的数据转化为交叉口进口道需求数据,提出了改进相似聚类算法的无检测器交叉口流量数据研究框架,发现改进前后皮尔逊相关系数最大的提高了 37.29%,最低的提高了 10.8%,平均提高了 20.58%。(2)基于交叉口流量数据,对饱和度、排队长度、延误时间三种常见的交叉口交通状态参数的计算方法进行了有效地探索。提出了改进的需求-容量法对交叉口饱和度进行计算:在需求方面考虑路段上流入量和流出量在早晚高峰期对交叉口需求量的影响,在容量方面考虑下游交叉口排队蔓延导致上游交叉口的折损。在估算排队长度、延误时间的过程中确定了以饱和度等于0.8为界限的2种不同计算方法。(3)应用数据挖掘技术直接识别分析海量数据,以获取道路网络中交叉口拥堵扩散的演变规律。构造了交叉口各车道的交通状态历史数据库,并结合交通拥堵预测的特点对数据库进行适应性调整,提出一种基于路网拓扑结构约束的Apriori算法,建立区域交叉口拥堵传播规律挖掘模型。利用苏州市吴中区交叉口实例数据验证了模型的有效性和正确性。根据模型实证结果,从时间维度分析可知拥堵具有相似性和反复性;从空间维度研究发现“回溢”和“流出”两种拥堵传播的模式。基于上述拥堵传播规律获取该区域中各个交叉口拥堵发生的时间顺序,当某一规律中拥堵源交叉口发生拥堵时,根据拥堵传播规律中拥堵传播的趋势,可预测该规律中其他交叉口后续的交通状况。

高翔[9](2020)在《面向汽车电子标识的数据分析系统》文中提出随着国民经济的高速发展,道路上机动车保有量不断地增长,使道路交通的压力剧增导致了交通拥堵,进而增加了出行成本同时也造成了环境污染等诸多问题,使社会的运行成本增长。射频识别(Radio Frequency Identification,RFID)由于其具有识别准确性高不被天气等因素干扰、识别速度快、包含信息更全面等优点,广泛应用于交通领域,形成了汽车电子标识,为解决城市道路交通问题提供了一种新手段。在机动车上安装汽车电子标识标签,在采集点的道路上方安装汽车电子标识识读设备,对采集交通数据对数据进行处理,分析车辆的行为,检测伴随车辆,识别道路交通拥堵和预测交通流。本文以深圳市汽车电子标识数据为基础,设计了面向汽车电子标识的数据分析系统,借助交通流参数分析了城市道路的出行特征,通过一段时间内的汽车电子标识数据分析车辆的伴随行为检测、交通拥堵识别和短时交通流预测。为道路交通管理部门提供合理化建议,缓解城市道路交通问题。本文的主要工作内容如下:(1)伴随车辆检测。伴随车辆是交通领域的概念,指在一定时间内某些车辆一起通过识读站点的数量达到某一阈值,伴随车辆检测主要针对可能存在的协同作案的车辆。本文的伴随车辆检测主要通过各个采集点获取的汽车电子标识,通过使用基于Spark平台的FP-growth(Frequent Pattern growth)的伴随车辆检测算法,利用键值对的方式处理汽车电子标识数据,可提高伴随车辆检测的效率。(2)交通拥堵识别。在汽车电子标识数据基础上,选取交通量和速度作为主要的交通流参数,分析了道路交通的运行状态。通过模糊理论使用FCM(Fuzzy C-means)算法,针对不同道路实际交通拥堵状态,对不同样本数据聚类中心的差异,使用均值移动的方法确定初始聚类中心,同时分析了模糊指数和聚类数目的取值,以获取最佳聚类效果,得到路段状态的识别结果,并对路段拥堵状态判别结果进行了分析,使用模型评价指标,验证了算法的准确性和并行化后提高了效率。(3)短时交通流预测。针对交通流数据具有时序性,周期性等特点,建立基于ARIMA(Autoregressive Integrated Moving Average)的短时交通流预测模型。在对短时交通流预测中使用时间序列的ARIMA算法能够取得较好的效果,但ARIMA模型只能分析数据线性性质,对于不稳定峰值波动会出现一定误差。由于实际交通流的复杂性,只用ARIMA模型难以取得很好的预测效果,本文提出了ARIMA-GARCH(Autoregressive Integrated Moving Average Generalized autoregressive conditional heteroskedasticity)模型,用于短时交通流预测,解决了交通流的非线性特征,准确率达到94%,并利用Spark平台提高了执行效率。在以上模型研究的基础上,基于Spark平台并结合kafka消息中间件,设计和实现了一个基于汽车电子标识的数据分析系统,对汽车电子标识数据进行存储,处理和分析;给出了系统的概要设计和系统的架构、数据库设计,以及数据管理模块、伴随车辆检测模块、交通拥堵判别模块、短时交通流预测模块的详细设计与实现。

路昕宇[10](2020)在《高效用项集挖掘算法研究》文中研究说明高效用项集挖掘(High Utility Itemsets Mining,HUIM)已成为数据挖掘领域研究工作的关键。高效用项集挖掘是为了解决频繁项集挖掘只考虑出现频次的问题,高效用项集挖掘同时考虑事务数据库中项目数量和单位利润。先前大部分HUIM算法只考虑项目存在正效用的情况,然而实际应用中会存在负效用项集。根据先前高效用项集挖掘算法相关修剪策略,低效用项集的子集必是低效用项集。但是事务中存在负效用项,低效用项集的子集可能是高效用项集,因此含负效用项的高效用项集可能会被忽略。不仅如此,现有HUIM算法执行方面,阈值需要用户设定。而在实际应用中阈值的设定直接影响输出结果集的数量,从而极大地影响算法运行效率。阈值过高使得无结果产生,用户不能得到高效用项集(HUIs);阈值过低导致算法运行时间无限增长并且占用大量内存,甚至导致内存溢出。设定合适的阈值是一个困难的问题。针对上述问题本文对高效用项集挖掘算法存在负效用项和阈值设定方面进行研究,研究工作主要如下:(1)针对数据集中包含负效用项的问题,提出含负效用项的高效用项集挖掘算法EHUIN(Efficient High Utility Itemsets Mining with Navigate utility)。算法在第一次扫描数据库时使用覆盖理论指导方法,在初始化链表时对事务加权效用值相等的项集进行覆盖操作。随后在含负效用的传递分支公式tenu(transitive extension with negative utility)帮助下,将链表中项集效用与其传递分支项集效用之和与用户设定最小效用阈值比较,若小于最小效用阈值则项集的传递分支项集均为低效用项集并舍弃。在构建效用链表时使用提前过滤策略,通过计算元组中效用值来判定该效用链表是否为低效用链表,从而降低运行时间,减少内存消耗,进一步提高挖掘效率。经过近60万条数据24组实验证明在数据集稠密程度不一致的情况下,EHUIN算法效率更高,尤其是在稠密数据集上表现更佳。(2)针对最小效用阈值设定的问题,高效用项集挖掘算法通过和Top-k算法结合,将设定阈值的问题转变成设定高效用项集数量的问题。目前Top-k高效用项集挖掘算法主要研究方向是改进数据结构和优化效用链表的构建过程,但忽略效用链表构建后的内存管理。随着数据量增大,挖掘高效用项集所需构建的效用链表增多却无法管理内存资源,之前的算法运行时占用系统大量内存空间和计算开销。针对这一问题,提出新的Top-k高效用项集挖掘算法TKBPH(Top-k Buffer Pool High Utility Mining)。TKBPH算法提出数据缓冲池(DBP)结构管理内存空间,高效存储与检索缓冲池内数据,并在挖掘过程中进行内存复用。在不同类型数据集实验结果证明,TKBPH算法在挖掘过程中执行速度更快,内存消耗更少。

二、流数据频繁项算法研究(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、流数据频繁项算法研究(论文提纲范文)

(1)网络未知协议语法的智能逆向分析方法研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 课题研究背景与意义
        1.1.1 研究背景
        1.1.2 研究的目的及意义
    1.2 研究现状
        1.2.1 协议逆向工程研究现状
        1.2.2 协议特征工程的研究现状
        1.2.3 研究现状总结
    1.3 主要研究内容
    1.4 论文组织结构
2 协议特征提取相关技术与方法
    2.1 协议语法分析与智能逆向相关概念
    2.2 特征提取相关算法
        2.2.1 无监督学习算法
        2.2.2 有监督学习算法
    2.3 关联规则挖掘算法
        2.3.1 频繁项提取算法
        2.3.2 FP-growth算法
    2.4 入侵检测相关方法
    2.5 本章小结
3 未知协议特征提取优化方法
    3.1 现有特征提取的问题研究
        3.1.1 Apriori算法
        3.1.2 关联规则概述
        3.1.3 AC算法简介
        3.1.4 CFI算法介绍
    3.2 特征提取优化算法流程
        3.2.1 算法结构
        3.2.2 数据预处理
        3.2.3 数据去噪
        3.2.4 获得项集过程
        3.2.5 去除包含操作
        3.2.6 特征去重
    3.3 实验结果及对比
        3.3.1 实验结果对比
        3.3.2 实验对比及分析
        3.3.3 算法不足
    3.4 本章小结
4 协议语法智能逆向分析方法
    4.1 相关概念和参数选取方法
        4.1.1 比特流数据特点概述
        4.1.2 卷积神经网络的选取
    4.2 协议逆向分析方法面临的挑战
    4.3 协议智能逆向分析过程
        4.3.1 总体结构
        4.3.2 数据预处理
        4.3.3 数据流图像化
        4.3.4 模型搭建及参数设计
        4.3.5 模型训练及预测
    4.4 实验及结果分析
        4.4.1 实验环境
        4.4.2 实验结果
        4.4.3 实验对比及结果分析
        4.4.4 不足之处
    4.5 本章小结
5 未知比特流协议分析逆向识别系统
    5.1 背景介绍
    5.2 系统分析及总体框架设计
        5.2.1 开发环境
        5.2.2 数据来源
    5.3 系统设计与实现
        5.3.1 用户界面
        5.3.2 协议处理
        5.3.3 协议分析
        5.3.4 协议识别
    5.4 本章小结
6 总结与展望
    6.1 工作总结
    6.2 研究展望
致谢
参考文献
攻读硕士学位期间主要研究成果

(2)面向高速流数据的sketch算法研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景和意义
    1.2 研究内容与创新点
        1.2.1 研究内容
        1.2.2 创新点
    1.3 本文结构
第2章 相关工作
    2.1 数据流模型
        2.1.1 界标窗口模型
        2.1.2 滑动窗口模型
        2.1.3 衰减窗口模型
    2.2 流数据的相关任务
        2.2.1 频数估计
        2.2.2 频数分布
        2.2.3 熵估计
    2.3 sketch研究现状
        2.3.1 sketch数据结构
        2.3.2 sketch相关工作
    2.4 本章小结
第3章 面向偏态流数据集的Rhombus sketch算法
    3.1 问题发现
        3.1.1 流数据集分布
        3.1.2 流数据索引值
    3.2 Rhombus sketch
        3.2.1 数据结构
        3.2.2 插入算法
        3.2.3 查询算法
    3.3 Rhombus sketch的准确率
    3.4 实验与分析
    3.5 本章小结
第4章 基于动态调整的DARS sketch算法
    4.1 DARS sketch
        4.1.1 数据结构
        4.1.2 插入算法
        4.1.3 查询算法
    4.2 DARS sketch的误差分析
    4.3 DARS sketch的其他用途
    4.4 实验与分析
    4.5 本章小结
第5章 总结与展望
    5.1 全文工作总结
    5.2 未来工作展望
参考文献
作者简介及科研成果
致谢

(3)考虑区域类型差异的高速公路事故风险识别与交通安全评价研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 立题背景与选题意义
        1.1.1 研究背景
        1.1.2 选题意义
    1.2 国内外研究现状综述
        1.2.1 相关理论方法发展动态和应用现状
        1.2.2 针对区域类型的高速公路事故风险和交通安全研究进展
        1.2.3 基于实时交通流状态的高速公路动态安全研究现状
        1.2.4 国内外研究现状评述
    1.3 高速公路区域类型划分依据
        1.3.1 高速公路区域类型划分的必要性
        1.3.2 国内外高速公路常见的分类方法
        1.3.3 本文高速公路区域类型划分依据
    1.4 研究内容及研究目标
    1.5 论文组织结构与技术路线
2 高速公路交通事故要素与特征分析
    2.1 高速公路交通安全相关研究数据概述
        2.1.1 我国相关数据现状
        2.1.2 美国相关数据现状
        2.1.3 本文所应用数据的合理性
    2.2 区域类型差异条件下的高速公路交通事故主要影响因素分析
        2.2.1 驾驶人维度影响因素分析
        2.2.2 车辆维度影响因素分析
        2.2.3 道路维度影响因素分析
        2.2.4 外部环境维度影响因素分析
    2.3 高速公路交通事故时空分布规律
        2.3.1 城区高速公路时空分布规律分析
        2.3.2 乡区高速公路时空分布规律分析
        2.3.3 山区高速公路时空分布规律分析
    2.4 高速公路交通事故特征统计
        2.4.1 城区高速公路事故特征统计分析
        2.4.2 乡区高速公路事故特征统计分析
        2.4.3 山区高速公路事故特征统计分析
    2.5 本章小结
3 基于关联规则挖掘的区域类型差异条件下的高速公路事故致因分析
    3.1 引言
    3.2 研究区域介绍与数据收集处理
        3.2.1 研究区域介绍与研究数据来源
        3.2.2 样本数据集特征
        3.2.3 样本结构设计
    3.3 基于WODMI-APRIORI关联规则挖掘算法的高速公路事故风险识别方法建模
        3.3.1 关联规则挖掘算法基本参数
        3.3.2 关联规则分类
        3.3.3 Apriori算法特性与基本步骤
        3.3.4 主客观联合赋权改进的Apriori关联规则挖掘算法
        3.3.5 考虑定向约束和指标赋权的多维度交互改进的Apriori关联规则挖掘算法(WODMI-Apriori)
    3.4 实例分析
        3.4.1 不同区域类型高速公路全映射事故致因关联规则挖掘
        3.4.2 不同区域类型高速公路维度交互关联规则挖掘
        3.4.3 不同区域类型高速公路事故维度自相关关联规则挖掘
    3.5 本章小结
4 区域类型差异条件下的高速公路动态交通流状态与事故风险关系评估
    4.1 引言
    4.2 研究数据介绍与样本结构设计
        4.2.1 数据源文件介绍
        4.2.2 事故数据预处理
        4.2.3 交通流数据预处理
        4.2.4 病例—对照配对式样本结构设计
        4.2.5 数据匹配
    4.3 相关理论与研究方法
        4.3.1 六级服务水平理论
        4.3.2 马尔科夫链蒙特卡洛方法(MCMC)
        4.3.3 基于MCMC的贝叶斯方法
        4.3.4 贝叶斯条件logistic回归
        4.3.5 随机森林算法
        4.3.6 贝叶斯logistic回归
    4.4 实例分析
        4.4.1 不同区域类型高速公路事故风险等级分析
        4.4.2 各区域高速公路事故征兆危险交通流变量识别
        4.4.3 不同区域类型高速公路事故发生机理
    4.5 本章小结
5 区域类型差异条件下的高速公路综合交通安全水平评价
    5.1 引言
    5.2 基于熵权改进的密切值法
        5.2.1 密切值评价方法概述
        5.2.2 信息熵赋权理论
        5.2.3 基于信息熵权重优化改进的密切值评价方法
    5.3 研究区域介绍
    5.4 基于熵权改进密切值法的高速公路交通安全评价建模
        5.4.1 评价矩阵建立
        5.4.2 模型基本假设
        5.4.3 评价指标数据的收集与处理
        5.4.4 数值评价矩阵的建立
    5.5 实例分析
        5.5.1 年度视角的评价指标权重计算
        5.5.2 季节划分视角的评价指标权重计算
        5.5.3 年度视角下的不同区域类型高速公路交通安全评价
        5.5.4 季节划分视角下的不同区域类型高速公路交通安全评价
        5.5.5 考虑区域类型和季节差异的全样本高速公路交通安全评价
    5.6 本章小结
6 结论与展望
    6.1 主要研究结论
    6.2 论文创新点
    6.3 研究展望
参考文献
附录A 缩略词注释表
附录B 交通事故源数据字段注释表
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集

(4)基于气象条件与交通流交互作用的高速公路事故风险分析及预测(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 研究目的、研究范围与研究内容
        1.2.1 研究目的
        1.2.2 研究范围
        1.2.3 研究内容
    1.3 研究思路与技术路线
    1.4 论文结构
2 理论方法与研究综述
    2.1 风险管理理论
        2.1.1 风险管理的含义
        2.1.2 风险管理的目标
        2.1.3 风险管理的一般程序
    2.2 高速公路安全预警工作研究现状
    2.3 高速公路事故风险识别研究现状
    2.4 高速公路事故风险评估研究现状
    2.5 高速公路事故风险预测研究现状
    2.6 研究现状总结
3 基于关联规则挖掘的高速公路事故风险识别
    3.1 概述
    3.2 高速公路事故与风险因素关联规则简介
        3.2.1 高速公路安全风险关联规则基本概念
        3.2.2 关联规则筛选标准
        3.2.3 高速公路事故与其风险因素之间关联规则分类
    3.3 高速公路事故与风险因素加权关联规则
        3.3.1 加权关联规则概述
        3.3.2 加权关联规则权重确定方法
        3.3.3 加权关联规则评价指标计算
    3.4 高速公路事故与风险因素关联规则挖掘
        3.4.1 Apriori关联规则挖掘算法
        3.4.2 关联规则有效性检验
        3.4.3 基于Apriori算法改进的多维多层AHP加权Top-k关联规则挖掘算法
    3.5 实例分析
        3.5.1 数据收集
        3.5.2 数据处理
        3.5.3 结果分析
    3.6 本章小结
4 基于气象与交通流特征关联风险的高速公路安全状态评价
    4.1 概述
    4.2 基于随机森林算法的影响高速公路安全状态评价指标筛选
        4.2.1 随机森林算法原理
        4.2.2 变量筛选评价指标
        4.2.3 随机森林算法筛选重要变量步骤
    4.3 基于模糊k-prototypes算法的高速公路安全状态划分
        4.3.1 算法描述
        4.3.2 算法实现
    4.4 基于贝叶斯Logistic回归的高速公路交通安全状态评估
    4.5 实例分析
        4.5.1 数据收集
        4.5.2 数据处理
        4.5.3 结果分析
    4.6 本章小结
5 基于天气与交通流特征交互效应的高速公路事故风险预测
    5.1 概述
    5.2 天气特征与交通流动态特征的交互作用
        5.2.1 变量交互作用介绍
        5.2.2 数据收集与处理
        5.2.3 模型估计结果分析
    5.3 基于学习率自适应随机梯度提升算法的高速公路事故风险预测
        5.3.1 集成学习概述
        5.3.2 梯度提升算法
        5.3.3 基于学习率自适应的随机梯度提升预测模型
    5.4 实例分析
        5.4.1 数据描述
        5.4.2 结果分析
    5.5 本章小结
6 研究结论及展望
    6.1 主要研究结论
    6.2 创新点
    6.3 研究展望
参考文献
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集

(5)通信网告警规则挖掘系统的设计与实现(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 课题背景及研究的目的和意义
    1.2 国内外研究现状分析
        1.2.1 告警相关性分析的国内外研究现状
        1.2.2 关联分析国内外研究现状
        1.2.3 大数据和数据流处理技术的国内外研究现状
        1.2.4 故障告警相关性研究存在的问题
    1.3 本文的主要研究内容和结构
        1.3.1 本文的主要研究内容
        1.3.2 本文的结构及章节安排
第2章 系统需求分析和关键技术
    2.1 系统业务需求分析
    2.2 系统功能需求分析
    2.3 非功能性需求分析
    2.4 关键技术
        2.4.1 频繁模式分析技术
        2.4.2 序列模式分析技术
        2.4.3 Spark机器学习和流数据处理技术
    2.5 本章小结
第3章 告警规则挖掘系统设计与实现
    3.1 系统总体设计
        3.1.1 系统架构设计
        3.1.2 系统功能结构设计
        3.1.3 系统数据库设计
        3.1.4 系统部署设计
        3.1.5 数据提取与预处理
    3.2 用户管理模块设计与实现
    3.3 算法配置与任务管理模块设计与实现
    3.4 数据分析模块设计与实现
    3.5 常规数据频繁模式算法分析模块设计与实现
        3.5.1 Apriori算法实现
        3.5.2 FP-Growth算法实现
        3.5.3 模块设计与实现
    3.6 常规数据序列模式算法分析模块设计与实现
        3.6.1 Prefix Span算法实现
        3.6.2 模块设计与实现
    3.7 大数据频繁模式算法分析模块设计与实现
    3.8 大数据序列模式算法分析模块设计与实现
    3.9 流式数据告警规则挖掘分析模块设计与实现
    3.10 本章小结
第4章 告警规则挖掘系统测试
    4.1 模块测试
    4.2 结果分析
        4.2.1 FP-Growth算法分析结果
        4.2.2 Prefix Span算法分析结果
    4.3 非功能性需求测试
    4.4 本章小结
结论
参考文献
致谢
个人简历

(6)基于时空轨迹的伴随车发现方法研究与实现(论文提纲范文)

摘要
abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 研究现状
        1.2.1 伴随车研究现状
        1.2.2 频繁项集相关研究
        1.2.3 增量计算相关研究
        1.2.4 轨迹相似性度量相关研究
        1.2.5 流式大数据研究现状
    1.3 主要研究内容
    1.4 论文组织架构
第2章 伴随车挖掘相关技术和理论基础
    2.1 伴随车相关技术介绍
        2.1.1 伴随车问题定义
        2.1.2 伴随车发现技术
    2.2 增量计算理论技术介绍
        2.2.1 频繁项集增量挖掘模型
    2.3 相似性度量理论技术介绍
        2.3.1 轨迹相似性度量技术
    2.4 流式数据实时挖掘理论技术介绍
        2.4.1 Spark Streaming特性
        2.4.2 Spark Streaming工作原理
        2.4.3 Spark Streaming常用算子
    2.5 本章小结
第3章 基于增量计算方法实时挖掘ANPR中伴随车组
    3.1 引言
    3.2 增量挖掘伴随车组模型相关定义
        3.2.1 相关定义
        3.2.2 问题形式化
    3.3 增量挖掘伴随车模型细节
        3.3.1 模型整体框架
        3.3.2 DF-tree的构建与维护方法
        3.3.3 伴随车发现方法
        3.3.4 模型算法设计
    3.4 实验结果及分析
        3.4.1 实验设置
        3.4.2 算法预测性能
    3.5 本章小结
第4章 基于TSDTW-LCSS实时挖掘GPS数据中伴随车
    4.1 引言
    4.2 问题描述
        4.2.1 相关定义
        4.2.2 问题形式化
    4.3 模型细节
        4.3.1 整体框架
        4.3.2 轨迹实时分段
        4.3.3 基于TSDTW-LCSS的实时轨迹相似性度量
        4.3.4 基于相似轨迹挖掘伴随车模型
    4.4 实验结果与分析
        4.4.1 实验设置
        4.4.2 算法预测性能
    4.5 本章小结
第5章 总结及未来工作
    5.1 主要工作与创新点
    5.2 未来工作展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果

(7)在线个体特征识别和行为预测研究(论文提纲范文)

摘要
abstract
第1章 绪论
    1.1 研究背景
    1.2 研究目的与意义
    1.3 国内外研究现状
    1.4 研究内容
    1.5 论文组织结构
第2章 基于多维轨迹集的用户个体特征识别
    2.1 引言
    2.2 用户行为数据描述
    2.3 MTS模型
        2.3.1 AUI行为模式分析
        2.3.2 多维轨迹集构建
        2.3.3 最大熵匿名用户分类
        2.3.4 CM识别结果修正
        2.3.5 MTS模型流程
    2.4 实验与结果
    2.5 本章小结
第3章 基于CMQ的用户点击行为预测模型
    3.1 引言
    3.2 构建基准奖励矩阵
        3.2.1 点击流网络
        3.2.2 基准奖励矩阵B-Reward
    3.3 构建权值奖励矩阵
        3.3.1 频繁点击项集
        3.3.2 权值奖励矩阵Wi-Reward
    3.4 CMQ预测算法
    3.5 RL-P预测模型
    3.6 实验与结果
    3.7 本章小结
结论
参考文献
致谢
个人简历、在学期间发表的学术论文及研究成果

(8)交叉口交通状态识别与拥堵传播规律挖掘方法研究(论文提纲范文)

中文摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 研究目的及意义
        1.2.1 研究目的
        1.2.2 研究意义
    1.3 国内外研究现状
        1.3.1 研究概述
        1.3.2 交通数据预处理研究
        1.3.3 交通状态的识别研究
        1.3.4 交通状态预测研究
        1.3.5 既有研究评述
    1.4 研究内容及技术路线
        1.4.1 研究内容
        1.4.2 论文结构和技术路线
第二章 基础数据描述及预处理
    2.1 数据描述
        2.1.1 数据采集方式介绍
        2.1.2 交叉口区位概述
        2.1.3 数据格式描述
    2.2 数据问题产生的原因
    2.3 数据异常和缺失的识别与修复
        2.3.1 数据异常
        2.3.2 数据缺失
    2.4 无检测器交叉口数据的计算
        2.4.1 相似聚类原理介绍
        2.4.2 模型依据
        2.4.3 改进模型的原因及效果分析
    2.5 数据的平滑处理
第三章 基于流量的交叉口交通状态参数估计
    3.1 交叉口交通状态参数概述
        3.1.1 交叉口交通状态定义及影响因素
        3.1.2 交通状态分类及特征
    3.2 交通状态参数介绍
        3.2.1 交通状态参数选取原则
        3.2.2 常用交叉口交通状态参数
    3.3 饱和度计算
        3.3.1 方法概述
        3.3.2 分析验证
    3.4 排队长度估算
        3.4.1 方法概述
        3.4.2 分析验证
    3.5 延误时间估计
        3.5.1 方法概述
        3.5.2 分析验证
第四章 区域交叉口拥堵传播规律挖掘
    4.1 区域交叉口拥堵传播机理
    4.2 Apriori数据挖掘算法概述
        4.2.1 数据挖掘技术介绍
        4.2.2 Apriori算法的应用
        4.2.3 Apriori算法中的相关定义
        4.2.4 Apriori算法的具体步骤
    4.3 拥堵传播规律挖掘模型建立
        4.3.1 基本原理
        4.3.2 时序数据库建立
        4.3.3 路网拓扑约束
        4.3.4 参数设置
    4.4 案例分析
        4.4.1 模型结果
        4.4.2 时间特征分析
        4.4.3 空间特征分析
        4.4.4 在拥堵预测系统中的应用
第五章 总结与展望
    5.1 研究成果总结
    5.2 创新点总结
    5.3 研究展望
参考文献
攻读硕士期间取得的成果
致谢
附录

(9)面向汽车电子标识的数据分析系统(论文提纲范文)

摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 伴随车辆检测
        1.2.2 交通拥堵识别
        1.2.3 短时交通流预测
    1.3 研究内容
    1.4 论文结构安排
第二章 汽车电子标识数据预处理
    2.1 汽车电子标识数据采集原理
    2.2 汽车电子标识数据的特点
    2.3 汽车电子标识数据的预处理
        2.3.1 汽车电子标识数据描述
        2.3.2 汽车电子标识数据整合
        2.3.3 冗余数据处理
        2.3.4 缺失数据处理
    2.4 本章小结
第三章 基于FP-growth的伴随车辆检测算法
    3.1 伴随车相关概念
    3.2 FP-growth算法分析
    3.3 伴随车辆检测算法
        3.3.1 伴随车辆检测
        3.3.2 伴随车辆轨迹对比
    3.4 本章小结
第四章 基于FCM的交通拥堵识别算法
    4.1 交通拥堵定义与分类
    4.2 交通拥堵状态参数分析
        4.2.1 交通量
        4.2.2 路段平均速度
        4.2.3 交通量和速度的关系
        4.2.4 拥堵识别模型
    4.3 基于FCM的交通拥堵识别
        4.3.1 聚类分析与模糊聚类
        4.3.2 FCM算法分析
        4.3.3 初始化聚类中心
        4.3.4 模糊指数和聚类数目的分析
        4.3.5 FCM算法有效性分析
    4.4 本章小结
第五章 基于ARIMA的短时交通流预测算法
    5.1 交通流
    5.2 模型评价指标
    5.3 基于ARIMA的短时交通流预测模型
        5.3.1 时间序列预测算法简介
        5.3.2 ARIMA模型
        5.3.3 ARIMA-GARCH模型
        5.3.4 模型有效性分析
    5.4 本章小结
第六章 汽车电子标识数据分析系统设计与实现
    6.1 系统需求
    6.2 系统概要设计
        6.2.1 总体设计
        6.2.2 功能模块设计
    6.3 系统详细设计
        6.3.1 核心功能设计
        6.3.2 系统数据库设计
    6.4 系统实现
        6.4.1 系统的开发环境
        6.4.2 功能模块实现
    6.5 系统测试
    6.6 本章小结
第七章 总结与展望
    7.1 工作总结
    7.2 展望
参考文献
致谢
作者简介

(10)高效用项集挖掘算法研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    §1.1 研究背景
    §1.2 研究现状
    §1.3 研究目的与意义
    §1.4 课题研究的主要贡献及组织结构
        §1.4.1 课题主要贡献
        §1.4.2 本文组织结构
第二章 相关理论与基础知识
    §2.1 频繁项集挖掘
        §2.1.1 频繁项集挖掘基本理论
        §2.1.2 频繁项集挖掘经典算法
    §2.2 高效用项集挖掘
        §2.2.1 高效用项集挖掘基础理论
        §2.2.2 高效用项集挖掘相关算法
    §2.3 本章小结
第三章 含负效用项的高效用项集挖掘算法研究
    §3.1 预备知识与问题定义
        §3.1.1 含负效用项的高效用项集挖掘
        §3.1.2 问题定义
    §3.2 EHUIN算法的提出
        §3.2.1 链表覆盖策略
        §3.2.2 提前过滤策略
        §3.2.3 传递分支修剪策略
        §3.2.4 EHUIN算法
        §3.2.5 算法复杂度分析
    §3.3 实验验证及评估
        §3.3.1 实验设置
        §3.3.2 运行时间分析
        §3.3.3 高效用项集数量和访问节点数量
        §3.3.4 内存消耗分析
    §3.4 本章小结
第四章 基于DBP的Top-k高效用项集挖掘算法研究
    §4.1 预备知识与问题定义
        §4.1.1 Top-k高效用项集挖掘
        §4.1.2 问题定义
    §4.2 数据缓冲池结构
    §4.3 TKBPH算法
    §4.4 算法复杂度分析
    §4.5 实验验证及评估
        §4.5.1 实验设置
        §4.5.2 运行时间
        §4.5.3 内存消耗
    §4.6 本章小结
第五章 总结与展望
    §5.1 研究工作总结
    §5.2 存在问题与展望
参考文献
致谢
作者在攻读硕士期间主要研究成果

四、流数据频繁项算法研究(论文参考文献)

  • [1]网络未知协议语法的智能逆向分析方法研究[D]. 白彬彬. 西安理工大学, 2021(01)
  • [2]面向高速流数据的sketch算法研究[D]. 苗艳微. 吉林大学, 2021(01)
  • [3]考虑区域类型差异的高速公路事故风险识别与交通安全评价研究[D]. 杨洋. 北京交通大学, 2020
  • [4]基于气象条件与交通流交互作用的高速公路事故风险分析及预测[D]. 于帅. 北京交通大学, 2020(03)
  • [5]通信网告警规则挖掘系统的设计与实现[D]. 李鹏. 哈尔滨工业大学, 2020(01)
  • [6]基于时空轨迹的伴随车发现方法研究与实现[D]. 陶虹妃. 重庆邮电大学, 2020
  • [7]在线个体特征识别和行为预测研究[D]. 雷岳甡. 西北师范大学, 2020(01)
  • [8]交叉口交通状态识别与拥堵传播规律挖掘方法研究[D]. 施佳呈. 苏州大学, 2020(02)
  • [9]面向汽车电子标识的数据分析系统[D]. 高翔. 西安电子科技大学, 2020(05)
  • [10]高效用项集挖掘算法研究[D]. 路昕宇. 桂林电子科技大学, 2020(04)

标签:;  ;  ;  ;  ;  

流数据的频繁项算法研究
下载Doc文档

猜你喜欢