数据挖掘技术理论与应用

数据挖掘技术理论与应用

一、数据挖掘技术的理论及应用(论文文献综述)

李阳[1](2021)在《基于比较视角的中美国家级实验室建设研究》文中指出当今时代,世界发展面临百年未有之大变局,科技革命进入新一轮发展阶段,加速了全球人才、信息、资本等生产要素的流动,世界各国间的科技力量在悄然间发生着变化。科技革命所引发的不仅是全球经济社会的变革,每一次革命过程也必然会改变大国之间的力量分布,重塑世界实力对抗格局。中国科技实力的快速崛起,美国科技霸主地位受到挑战、中美之间的科技博弈屡次触碰着科研工作者的神经。如何在未来科技竞争中处于领先位置,激发科研人员的创新活力,提高科技创新对于社会发展的带动作用,这一切都离不开一流科研机构的支撑,而国家级实验室就能发挥这样的作用,满足国家在不同发展时期的科技需求。国家级实验室作为大国科技博弈的重要体现,为保持国家科技竞争力提供了驱动力,也是建设世界科技强国的重要战略保障。美国庞大的国家级实验室体系距今已经历了八十余年的发展历史,积累了成功的管理经验,也是满足国家科技全球领先的重要支撑,在建设管理创新上以及科研实力上领先于全球。我国国家级实验室兴建于改革开放之初,伴随着我国科技体制改革之路不断发展壮大,但相较于世界发达水平,在建设管理经验、科技体制创新及科研实力等方面还有许多不足。因此,以美国国家级实验室作为参照标准进行深入比较,总结两国实验室建设历程的异同、发现建设经验的共性与个性、寻找科研实力比较中的优势与不足,为促进我国国家级实验室建设及发展寻找经验借鉴,对于丰富我国国家级实验室研究成果意义重大。基于此,本文希望通过研究回答以下几个问题:(1)从中美两国国家级实验室的建设历程来看,两国实验室各自经历了怎样不同的发展阶段,每个阶段建设的侧重点是什么,各阶段的科技政策对实验室发展有何导向,两国实验室建设历程的异同又有哪些?(2)从中美两国国家级实验室的建设运行来看,中美国家级实验室在制度体制、建设定位、资源要素、运行模式及科研合作方面各有什么特点,在这些方面中,中美两国实验室的建设特征又有什么异同,美国实验室的建设经验对中国有何启示?(3)从中美两国国家级实验室的科研实力来看,两国实验室在体现科技论文最高水平的ESI高被引论文产出方面、主导地位方面、论文影响力方面的科研实力差距有多少;基于文献属性数据的特征差异有哪些,这些差异对两国实验室论文产出、影响力及主导地位的影响又有哪些?本文以比较研究作为研究视角,重点进行了以下方面的研究工作:(1)对中美两国国家级实验室建设历程进行对比分析。对两国国家级实验室的建设历程进行了划分;结合时代政策背景,对两国实验室各自的发展建设过程、学科分布特点、部门及地域分布特点、建设成效、阶段性特征进行分析,深入了解每一阶段国家级实验室的发展变化;总结出两国实验室建设历程的相同点及差异。(2)对中美两国国家级实验室建设特征进行比较分析。梳理两国国家级实验室在建设方面的特点;围绕制度体制、建设定位、资源要素、运行模式、科研合作五个方面,总结中美两国国家级实验室建设方面的共性与个性。(3)基于目前代表科技论文最高水平的ESI高被引论文数据库,对中美两国国家级实验室科研实力进行比较分析。综合运用文献计量学、数据挖掘、Logistic回归模型、多元线性回归模型等统计分析工具,从ESI高被引论文产出、国际合作、影响力等角度进行量化比较,以明确中美国家级实验室科研实力的差异。最终,通过对中美国家级实验室多方面的比较分析,本文得到如下结论:(1)回答了中美两国国家级实验室建设历程及阶段特征的问题。中美国家级实验室兴起于不同的时代背景,经历了截然不同的建设历程。美国国家级实验室体系作为全球领先的科研机构,兴起于战争年代,维护国家安全与国家利益成为了其建设初衷。先后经历了五个发展阶段,且过程中出现了两次较大的争议。实验室的发展紧密围绕美国国家安全战略展开,进行学科建设的布局与前沿科学领域的探索,尤其是美苏冷战时期,持续增加的军费资助为实验室的研究发展印上了明显的军事化色彩。相较而言,我国的国家级实验室体系发展建设起步较晚,与改革开放后的我国科技事业的发展基本同步,基本依托重点高校及各部门进行运行管理,以材料科学、工程科学等工程类学科研究为主。在经历了改革开放初期艰难的起步后,实验室的发展也随着社会经济的不断推进走向市场化协同创新的道路,为国家经济和社会发展提供了重要的技术服务,在发展方面呈现出快速上升的态势。(2)回答了中美两国国家级实验室在建设运行中的特色及管理经验问题。中美国家级实验室在建设运行上既有共同的经验又各具特色。通过对中美典型国家级实验室的建设特征进行分析,作者发现中美国家级实验室在制度体制、建设定位、资源要素、运行模式及科研合作方面既有共性又有个性。中美两国实验室的兴起处于不同的时代背景,两国在科技、经济等发展阶段上处于不同节点,形成了美国国家级实验室的定位于人类终极科学问题的探索,我国的国家级实验室主要还是定位在满足国家科技战略需求层面。两国不同的制度体制也形成了不同的实验室管理模式,美国强调以市场参与为主,政府主导为辅,实验室体系的发展以“自下而上”科技决策体系为主;中国更强调决策主体集中,注重政府的政策引导,实验室多以执行上级科技政策为主。此外,两国实验室在科研经费的预算及拨付制度、实验室的监管主体及实验室主任的选聘与权责方面也都存在着显着差异。(3)回答了中美两国国家级实验室在基于ESI高被引论文产出方面的科研实力问题。中美国家级实验室在科研实力方面各有优势,美国在多个方面保持着相对优势,我国在论文产出方面取得了显着的进步。研究发现,在基于高被引论文产出数量的比较上,中国无论是在产出总量还是发展增速方面均有明显的优势;且通过关联规则算法对中美论文产出特征进行分析,发现作者数量为5人及以上为中美论文产出的最主要合作方式;中国论文产出受参与单位的数量作用不显着,当有国内基金参与资助时会显着提高两国实验室的发文量。在基于高被引论文主导地位的比较上,在中美两国间实验室的合作论文方面,美国的主导地位高于中国;在中美实验室参与国际合作论文方面,中国的主导地位强于美国;在中美国际合作论文主导地位的特征方面,论文流向国内对中美国际合作论文的主导地位均有正向影响;资助基金数量及资助基金类别为“无国内基金参与”时对中美国际合作论文的主导地位均有负向影响。在基于高被引论文影响力的比较上,美国在被引频次及影响因子方面的影响力均强于中国;在论文影响力的特征方面,中美高被引论文影响力均受到作者数量、出版时间、资助基金数量等相关因素的影响;作者数量、资助基金数量等对中国高被引论文影响力的作用程度大于对美国的影响。本研究的创新点可以概括地归纳为以下三个方面:(1)对以国家级实验室为代表的科研机构建设与改革进行了有益探索。美国是当今世界最强大的科学技术强国,拥有雄厚的资本及一流的人才储备,众多的国家级实验室成为了其科技研发的排头兵,也成为了国家科技创新力量的坚实保障。联邦国家实验室体系至今已有七十多年的历史,并积累了卓有成效的管理经验,拥有一套科学的管理体制和运行机制。他山之石,可以攻玉。研究美国联邦国家实验室建设及其规律,进而探索科研管理机制创新,为突破美国科技封锁,探索我国国家级实验室体系建设及科研机构改革创新很有价值。(2)拓展了文献计量学理论在科技评价中的应用与实践。国家级实验室是进行基础研究和原始创新工作的重要科研机构。科技论文是体现国家或科研机构基础研究工作的重要载体,同时也是反映国家或科研机构科研实力的主要方面。本文基于ESI及JCR等数据库,以高被引论文为视角,运用文献计量学的理论指导,通过对中美两国国家级实验室科研实力进行量化分析,可以进一步明确两国国家级实验室的发展现状及差异水平,对我国国家级实验室建设体系的成效进行了检验。另一方面,文献计量学理论以科技论文及各种文献数据特征为研究对象,可以实现对国家或地区、科研机构、学者等学科结构、产出数量、影响力变化等科研动态的科学评价,对于两国实验室科技论文产出及其深层次因素及规律进行探讨,在填补对国家级实验室定量化研究空白的基础上,逐渐丰富我国国家级实验室科研评价体系,以便指导政策实践。(3)为新一轮技术革命背景下,深化国家创新体系理论,丰富国家创新体系理论概念,指导政府科技政策的实施与制度创新,更好地参与全球化科技治理,实现科技的自立自强以促进我国国家级实验室体系建设提供了新思路。中国国家级实验室体系根植于独有的政治、文化背景,在治理模式和运行机制上不同于世界上任何一个国家,面临着独有的现实困境与发展难题。在深入研究美国国家实验室管理经验的基础上,不照搬照抄美国模式,坚定走社会主义道路方向,结合有益经验探索中国模式,缩小与先进水平的实力差距,不断探索适合我国国情的国家实验室的管理体制和运行机制。

崔淑洁[2](2021)在《数据挖掘的正当性论述及法律规制路径》文中研究说明数据挖掘作为大数据技术,是信息增值的必要条件、数字经济发展的技术引擎以及政府数据开放的内在要求,具有正当性。但其同时产生隐私侵权、社会歧视、利益分配等个人自治以及社会治理难题,引发正当性困境。对此,应构建数据挖掘的法律规制路径,确立"鼓励挖掘-安全保护-平衡协调"相统一的规制目标,完善数据立法以明确数据挖掘规制的规则,选择个人数据主体、数据挖掘主体、政府合作规制的规制方式及规制手段,赋予个人数据主体事后选择权,明确数据挖掘主体的保护义务并落实政府的数据推进和监管职责,以期实现技术与法律规制的互动融合,促进我国数据产业的良性发展。

李鑫[3](2021)在《铁路机车设备画像理论及关键技术研究》文中研究指明铁路机务专业是铁路运输系统的重要行车专业,主要负责各型机车的运用组织、整备保养和综合检修。作为重要的铁路运输生产设备,机车的运输生产效率、设备质量状态、整备检修能力、安全管理水平等均会对铁路运输生产能力的稳健提升和经营管理工作的稳步发展产生重要影响。随着各种监测检测设备以及各类信息管理系统的广泛应用,围绕机车积累了形式多样的海量数据,数据增量及质量均大幅提升,数据价值日益体现,铁路行业对于完善机车健康管理的需求十分迫切。当前铁路机务专业在进行机车健康管理的过程中,存在分析方法较少、大数据挖掘不足、管理决策科学性较弱、综合分析平台缺失等问题。铁路机车设备画像理论及关键技术研究作为实现机车健康管理的重要手段,致力于加强机车数据资源的整合利用,通过客观、形象、科学的标签体系全面而精准地刻画机车的质量安全状态,并以此为基础深入挖掘潜藏的数据价值,实现机车事故故障关联分析、安全状态预警盯控、质量安全态势预测、检修养护差异化施修、稳健可靠管理决策等目的,支撑起铁路运输生产及质量安全管理工作的科学化、数字化、智能化发展。本文主要对铁路机车设备画像理论及其一系列关键技术进行了研究与应用,取得了以下创新成果:(1)提出了铁路机车设备画像理论。通过梳理机车设备画像的含义及研究意义,明确了构建铁路机车设备画像理论的必要性及其定位。基于此,给出铁路机车设备画像理论的定义与内涵,梳理了符合现阶段机车运输生产管理需要的铁路机车设备画像理论的构成,阐述了关键技术的研究方法及之间的逻辑关系。同时,设计相匹配的应用架构,介绍了其所包含的核心应用、赋能应用、总体目标等6个方面内容。这为系统性地开展机车健康管理相关研究提供了崭新的理论和方法支持。(2)构建了基于设备画像的铁路机车画像标签体系。通过整合利用机车多维度数据,提出了机车设备画像3级标签体系技术架构,全面分析所包含的数据采集层、标签库层和标签应用层,详细阐释各级标签的内容构成,形成机车画像标签体系的构建方法。针对聚类这一标签产生方式,改进K均值(K-means)聚类算法的初始质心选取方法,提高标签获取的精度和稳定性。通过在某铁路局开展机车设备画像实地应用研究,获得了客观、精准、完整、可靠的机车画像。(3)提出了基于Ms Eclat算法的铁路机车事故故障多最小支持度关联规则挖掘方法。针对机车事故故障在关联规则挖掘中具有不同支持度的特点,提出了改进的等价变换类(Eclat)算法——多最小支持度等价变换类(Ms Eclat)算法,以各项目的支持度值为排序依据重新构建数据集,进而运用垂直挖掘思想获得频繁项集;为了进一步提高Ms Eclat算法在大数据分析场景中的执行效率,将布尔矩阵和并行计算编程模型Map Reduce应用于算法的计算过程,得到优化的Ms Eclat算法,设计并阐述了相应的频繁项集挖掘步骤。通过比较,Ms Eclat算法及其优化算法在多最小支持度关联规则挖掘方面有着极大的计算效率优势。通过在某铁路局开展实际应用研究,验证了算法的有效性、高效性和准确性。(4)设计了基于时变概率的PSO+DE混合优化BP神经网络的机车质量安全态势预测模型。通过总结反向传播(BP)神经网络、粒子群优化(PSO)算法和差分进化(DE)算法的原理及优缺点,设计了基于时变概率且融入了防早熟机制的PSO+DE混合优化BP神经网络预测模型,详细阐释了这一预测模型的训练步骤。以某铁路局的机车质量评价办法为依托,选用灰色关联度分析方法选择出运用故障件数、碎修件数等7个评价项点,预测机车未来3个月的质量安全态势。经过实验对比,新提出的预测模型有着更好的收敛能力,对于机车质量评价等级预测及分值变化趋势预测的准确度分别可以达到98%和91%以上。最后开展了实际预测应用及分析,为科学把控机车质量安全态势提供了较好的技术方法。(5)设计了基于铁路机车设备画像理论的铁路机车健康管理应用。通过总结梳理铁路机车健康管理应用与铁路机车设备画像理论及机务大数据三者间的关系,设计了基于铁路机车设备画像理论的铁路机车健康管理应用的“N+1+3”总体架构及其技术架构。基于此,从设备、人员和综合管理3个方面介绍了机车运用组织、机车整备检修、辅助决策分析等7个典型应用场景,并特别给出这些场景的数据挖掘分析思路及框架,为铁路机车设备画像理论的扎实应用奠定了重要基础。最后,将本文所取得的相关研究成果在某铁路局开展实地的铁路机车健康管理应用实践,通过搭建人机友好的应用系统,完成一系列机务大数据挖掘分析算法模型的封装,实现了机车画像标签生成及设备画像分析、机车事故故障关联分析、机车质量评价分析、机车质量安全态势预测分析等多项功能。通过实际的工程应用,实现了铁路机车设备画像理论及其关键技术的创新实践,取得了良好的效果。全文共有图56幅,表21个,参考文献267篇。

陈志奕[4](2021)在《基于数据挖掘技术的财务分析与预警系统构建及应用》文中研究表明

孙慧君[5](2021)在《基于数据挖掘的配电网工程全过程管控关键技术研究》文中提出

李昊宇[6](2021)在《数据挖掘技术在A企业招标审计中的应用研究》文中研究表明

孙阳[7](2021)在《基于数据挖掘的A企业内部审计信息化研究》文中研究表明

李政[8](2021)在《开源数据挖掘的伦理分析》文中研究说明

王如意[9](2021)在《大学生学业成绩与毕业去向的数据挖掘研究》文中研究说明

刘梦柳[10](2021)在《基于Apriori算法的《伤寒杂病论》“麻黄-石膏”的证-方-药关联分析》文中研究说明目的:建立《伤寒杂病论》麻黄-石膏的证-方-药关联规则网络模型,结合中医药专业理论知识分析出麻黄-石膏间的相关规律,为系统研究《伤寒论》等经典古籍提供新思路,最终真正实现中医经典方剂的数据化、可视化。方法:本研究首先对《伤寒杂病论》含麻黄、石膏的原文按方剂、中药、症状进行规范化处理,之后统计相应的频次、频率,并录入Microsoft Excel软件建立原始数据库;继而采用IBM SPSS Modeler 18.0软件包初步构建关联规则图;再用IBM SPSS Statistics 22.0软件绘制聚类分析图;之后依据置信度、支持度提取相关数据,最后依据所制图表结合相关中医专业知识将数学语言转换为中医专业语言并分析、归纳、总结其中隐藏的规律与关系。结果:(1)涉及麻黄、石膏的方剂中,使用最多的中药是甘草,麻黄汤、白虎加人参汤是使用最多的方子,常见药对是甘草-生姜-大枣。方剂主要分布在太阳病篇,除少阳经、太阴经外均有涉及,既重视六经辨证又采用脏腑经络辨证,太阳病的证治以伤寒、中风、风温分类,太阳主证用麻黄汤,兼证经气不利用葛根汤、兼有饮证用小青龙汤,变为肺热证时用麻黄杏仁甘草石膏汤等。(2)高频次、多链接的症状为脉浮、发热、汗出、喘、口渴,可作为一个症候群起到诊断与鉴别诊断的作用。脉浮、发热、汗出可辨为太阳伤寒,审证用方选麻黄汤,无汗时则是太阳中风,方证结合则用桂枝汤;仲景对于疾病的诊断注重色脉,对于色脉的掌握是很精到的:察色有“面色反有热色”、“面色缘缘正赤者”、“一身面目悉黄”、“黧黑”等,既描述了面色,又凸出了特点;诊脉,脉浮、脉浮紧、脉浮缓、脉浮滑,脉沉、脉沉迟等,体现了其重脉思想。结论:本次研究采用关联规则、聚类分析和频次、频率统计工具与方法,对《伤寒杂病论》涉及麻黄、石膏的原文从方剂、中药、症状等方面进行专业知识的梳理总结,分析得出证-方-药间的规律与复杂关系。本研究所展示的结果为:应用数据挖掘得到的关联规则网络与模型,其呈现的图形清晰、直观,有良好的具体化、可视化效果,实现了由点带面对《伤寒杂病论》辨证、遣方、用药规律的探索与解释。对精研张仲景辨证求因、审因论治、方证相合等规律有重要意义,同时也可指导后世流派,数据挖掘技术是系统研究《伤寒杂病论》相对科学而行之有效的工具。

二、数据挖掘技术的理论及应用(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、数据挖掘技术的理论及应用(论文提纲范文)

(1)基于比较视角的中美国家级实验室建设研究(论文提纲范文)

摘要
abstract
第1章 导论
    1.1 研究背景及问题
        1.1.1 研究背景
        1.1.2 研究问题
    1.2 研究目的及意义
        1.2.1 研究目的
        1.2.2 研究意义
    1.3 研究思路与内容
        1.3.1 研究思路
        1.3.2 研究内容
    1.4 研究方法及技术路线
        1.4.1 研究方法
        1.4.2 技术路线
第2章 文献研究综述及理论基础
    2.1 相关概念界定
        2.1.1 国家级实验室
        2.1.2 国家重点实验室
        2.1.3 联邦国家实验室
    2.2 文献研究综述
        2.2.1 中国国家重点实验室建设相关研究回顾
        2.2.2 美国联邦国家实验室建设相关研究回顾
        2.2.3 文献研究回顾述评
    2.3 相关理论基础
        2.3.1 协同创新理论
        2.3.2 国家创新体系理论
        2.3.3 文献计量学理论
        2.3.4 数据挖掘理论
    2.4 本章小结
第3章 中美国家级实验室建设历程比较研究
    3.1 中国国家级实验室建设历程研究
        3.1.1 萌芽起步阶段
        3.1.2 集中建设阶段
        3.1.3 快速发展阶段
        3.1.4 “中国特色发展”阶段
    3.2 美国国家级实验室建设历程研究
        3.2.1 快速起步阶段
        3.2.2 第一波争议阶段
        3.2.3 重整复苏阶段
        3.2.4 第二波争议阶段
        3.2.5 新时代发展阶段
    3.3 中美国家级实验室建设历程比较与启示
        3.3.1 中美国家级实验室建设历程的一般规律
        3.3.2 中美国家级实验室建设历程的主要差异
        3.3.3 启示
    3.4 本章小结
第4章 中美国家级实验室建设特征比较研究
    4.1 研究设计
        4.1.1 研究方法
        4.1.2 案例选取原则
        4.1.3 资料获取
        4.1.4 分析框架
    4.2 中国典型国家级实验室建设特征分析
        4.2.1 固体微结构物理国家重点实验室
        4.2.2 环境模拟与污染控制国家重点实验室
        4.2.3 土木工程防灾国家重点实验室
        4.2.4 核物理与核技术国家重点实验室
        4.2.5 工业装备结构分析国家重点实验室
    4.3 美国典型国家级实验室建设特征分析
        4.3.1 劳伦斯伯克利国家实验室
        4.3.2 喷气推进实验室
        4.3.3 SLAC国家加速器实验室
        4.3.4 普林斯顿等离子体物理实验室
        4.3.5 林肯实验室
    4.4 中美国家级实验室建设特征比较与启示
        4.4.1 制度体制的比较分析
        4.4.2 建设定位的比较分析
        4.4.3 资源要素的比较分析
        4.4.4 运行模式的比较分析
        4.4.5 科研合作的比较分析
        4.4.6 启示
    4.5 本章小结
第5章 中美国家级实验室科研实力比较研究
    5.1 中美国家级实验室ESI高被引论文属性数据预处理
        5.1.1 中美国家级实验室ESI高被引论文属性数据来源
        5.1.2 中美国家级实验室ESI高被引论文属性数据处理流程
        5.1.3 中美国家级实验室ESI高被引论文属性规约
        5.1.4 中美国家级实验室ESI高被引论文属性数据清洗
        5.1.5 中美国家级实验室ESI高被引论文属性构造
        5.1.6 小结
    5.2 基于ESI高被引论文产出的科研实力比较
        5.2.1 高被引论文产出及变化情况比较
        5.2.2 高被引论文单因素产出特征比较
        5.2.3 基于关联规则的高被引论文多因素特征比较
        5.2.4 小结
    5.3 基于ESI高被引论文主导地位的科研实力比较
        5.3.1 两国间高被引论文合作情况比较
        5.3.2 中美参与国际合作的高被引论文主导情况比较
        5.3.3 基于Logistic回归的国际合作论文主导地位特征比较
        5.3.4 小结
    5.4 基于ESI高被引论文影响力的科研实力比较
        5.4.1 高被引论文被引频次比较
        5.4.2 高被引论文期刊影响因子比较
        5.4.3 基于多元线性回归的高被引论文影响力特征比较
        5.4.4 小结
    5.5 本章小结
第6章 促进我国国家级实验室建设的对策建议
    6.1 政府统筹实验室体系顶层设计的安排
        6.1.1 强化政府战略规划,融入国家创新系统
        6.1.2 顺应科技发展趋势,引领学科交叉创新
        6.1.3 加强重大专项部署,支撑战略新兴产业
    6.2 积极推进实验室融入创新联合体建设
        6.2.1 以市场拉动需求,发挥龙头企业领军性作用
        6.2.2 以科研带动教学,发挥实验室平台教学功能
        6.2.3 以联合实现共享,发挥联合体协同创新优势
    6.3 努力推进实验室融入世界范围的步伐
        6.3.1 坚持国际交流与合作,保持科技的自立自强
        6.3.2 打造国际化人才团队,构筑全球性人才高地
        6.3.3 参与全球化科技治理,提高实验室国际影响
    6.4 本章小结
第7章 结论与展望
    7.1 研究的主要结论
    7.2 研究的创新之处
    7.3 研究局限与展望
参考文献
附录
作者攻读博士学位期间取得的研究成果
致谢

(2)数据挖掘的正当性论述及法律规制路径(论文提纲范文)

一、数据挖掘的正当性论证
    (一)数据挖掘的概念及应用价值
    (二)数据挖掘的正当性
        1.信息增值的必要条件
        2.数字经济发展的技术引擎
        3.政府数据开放的内在要求
二、数据挖掘的正当性困境:基于现存社会法律问题的分析
    (一)数据挖掘挑战传统隐私保护,带来个人自治困扰等私人问题
    (二)数据挖掘产生歧视等新型社会治理问题
    (三)数据挖掘形成数据利益分割难题等社会分配纠纷
三、数据挖掘的正当性归属:数据挖掘的法律规制路径
    (一)确立“鼓励挖掘安全保护平衡协调”相统一的规制目标
    (二)完善数据立法,明确数据挖掘规制的规则
    (三)选择个人、数据挖掘主体、政府合作规制的规制方式并确立规制措施
        1.赋予个人数据主体事后选择权
        2.明确数据挖掘主体的保护义务
        3.落实政府的数据推进和监管职责
四、结语

(3)铁路机车设备画像理论及关键技术研究(论文提纲范文)

致谢
摘要
ABSTRACT
前言
1 绪论
    1.1 研究背景及意义
    1.2 必要性及可行性分析
        1.2.1 必要性
        1.2.2 可行性
    1.3 本文拟解决的主要问题
    1.4 本文研究的主要内容
    1.5 本文组织架构及技术路线
    1.6 本章小结
2 国内外研究现状及发展趋势
    2.1 机务大数据研究及应用
        2.1.1 国外
        2.1.2 国内
    2.2 机车检修现状
    2.3 设备画像
        2.3.1 画像的概念
        2.3.2 构成要素
        2.3.3 模型与方法
    2.4 标签技术
        2.4.1 画像标签的定义
        2.4.2 标签分类
        2.4.3 标签构建原则
        2.4.4 标签构建方法
    2.5 设备健康管理
        2.5.1 国外设备健康管理现状
        2.5.2 国内设备健康管理现状
        2.5.3 我国铁路机务专业PHM技术发展差距
    2.6 本章小结
3 铁路机车设备画像理论
    3.1 机车设备画像概述
    3.2 铁路机车设备画像理论构建
        3.2.1 铁路机车设备画像理论的定义与内涵
        3.2.2 铁路机车设备画像理论的构成
        3.2.3 铁路机车设备画像理论的应用架构
    3.3 本章小结
4 基于设备画像的铁路机车标签体系构建
    4.1 问题概述
    4.2 面向设备画像的标签技术
    4.3 机车画像标签体系构建
        4.3.1 机车画像标签体系技术架构
        4.3.2 机车画像标签体系
    4.4 基于聚类的机车第三级标签获取方法
        4.4.1 K-means算法
        4.4.2 K-means算法的改进
        4.4.3 K-means算法与改进算法的比较验证
    4.5 机车画像标签体系构建实例
        4.5.1 K-means改进算法的应用
        4.5.2 机车完整标签体系的产生
    4.6 本章小结
5 基于MsEclat算法的铁路机车事故故障多最小支持度关联规则挖掘
    5.1 问题概述
    5.2 MsEclat算法的背景知识
        5.2.1 垂直格式数据集
        5.2.2 支持度、置信度与提升度
        5.2.3 概念格理论
        5.2.4 多最小支持度下的频繁项集判定
        5.2.5 面向有序项目集合的最小支持度索引表
        5.2.6 基于等价类的可连接性判定
    5.3 MsEclat算法原理
        5.3.1 Eclat算法简述
        5.3.2 改进的Eclat算法—MsEclat算法
    5.4 优化的Ms Eclat算法
        5.4.1 基于布尔矩阵的T_(set)位运算求交
        5.4.2 基于MapReduce的等价类并行运算
        5.4.3 大数据场景下优化的MsEclat算法的频繁项集挖掘步骤
    5.5 算法比较验证
        5.5.1 MsEclat算法与水平挖掘算法的对比
        5.5.2 MsEclat算法与其优化算法的对比
    5.6 机车事故故障关联规则挖掘分析
        5.6.1 待分析项目的选取
        5.6.2 关联规则挖掘结果分析
    5.7 本章小结
6 基于PSO+DE混合优化BP神经网络的铁路机车质量安全态势预测
    6.1 问题概述
    6.2 机车质量等级评价
    6.3 基于机车质量评价项点的特征选择
        6.3.1 灰色关联度分析
        6.3.2 机车质量等级的比较特征选择
    6.4 PSO+DE混合优化BP神经网络
        6.4.1 BP神经网络原理
        6.4.2 PSO算法原理
        6.4.3 DE算法原理
        6.4.4 基于时变概率的PSO+DE混合优化BP神经网络预测模型
    6.5 机车质量安全态势预测分析
        6.5.1 预测模型训练
        6.5.2 预测模型训练结果分析
        6.5.3 预测模型应用分析
    6.6 本章小结
7 基于铁路机车设备画像理论的铁路机车健康管理应用总体设计
    7.1 机务大数据与机车健康管理
    7.2 铁路机车健康管理应用设计
        7.2.1 设计目标及定位
        7.2.2 总体架构设计
        7.2.3 技术架构设计
    7.3 铁路机车健康管理应用的典型应用场景分析
        7.3.1 设备质量综合分析
        7.3.2 人员运用综合把控
        7.3.3 运输生产综合管理
    7.4 本章小结
8 某铁路局机车健康管理应用实践
    8.1 应用开发方案
        8.1.1 系统开发环境
        8.1.2 数据调用方式
        8.1.3 分析模型定时任务调用方式
    8.2 机车数据管理功能
        8.2.1 基本数据管理
        8.2.2 视频数据管理
        8.2.3 机务电子地图
    8.3 机车画像标签生成及分析功能
        8.3.1 机车画像标签管理
        8.3.2 单台机车画像分析
        8.3.3 机车设备画像分析
    8.4 机车事故故障关联分析功能
    8.5 机车质量评价分析功能
        8.5.1 单台机车质量安全分析
        8.5.2 机务段级机车质量安全分析
        8.5.3 机务部级机车质量安全分析
        8.5.4 全局机务专业质量安全综合分析
    8.6 机车质量安全态势预测分析功能
    8.7 本章小结
9 总结与展望
    9.1 本文总结
    9.2 研究展望
参考文献
图索引
FIGURE INDEX
表索引
学位论文数据集
TABLE INDEX
作者简历及攻读博士学位期间取得的科研成果

(10)基于Apriori算法的《伤寒杂病论》“麻黄-石膏”的证-方-药关联分析(论文提纲范文)

中文摘要
英文摘要
常用缩写词中英文对照表
前言
1 绪论
    1.1 研究背景
    1.2 研究目的及意义
    1.3 国内外研究现状
    1.4 论文组织结构
2 《伤寒杂病论》相关知识
    2.1 《伤寒杂病论》的学术渊源与成就
    2.2 《伤寒杂病论》中麻黄、石膏的作用
    2.3 《伤寒杂病论》对治“时行之气”
3 研究对象与方法
    3.1 数据收集
    3.2 数据整理与规范
    3.3 质量控制与数据挖掘方法
    3.4 网络图形构建
4 结果
    4.1 《伤寒论》相关数据
    4.2 《金匮要略》相关数据
    4.3 《伤寒论》《金匮要略》数据汇总
5 讨论
    5.1 方剂部分
    5.2 中药部分
    5.3 症状部分
6 结论与展望
参考文献
综述 中医药体系数据挖掘可视化
    参考文献
致谢
个人简介

四、数据挖掘技术的理论及应用(论文参考文献)

  • [1]基于比较视角的中美国家级实验室建设研究[D]. 李阳. 吉林大学, 2021(01)
  • [2]数据挖掘的正当性论述及法律规制路径[J]. 崔淑洁. 重庆邮电大学学报(社会科学版), 2021(04)
  • [3]铁路机车设备画像理论及关键技术研究[D]. 李鑫. 中国铁道科学研究院, 2021(01)
  • [4]基于数据挖掘技术的财务分析与预警系统构建及应用[D]. 陈志奕. 北京邮电大学, 2021
  • [5]基于数据挖掘的配电网工程全过程管控关键技术研究[D]. 孙慧君. 华北电力大学(北京), 2021
  • [6]数据挖掘技术在A企业招标审计中的应用研究[D]. 李昊宇. 太原理工大学, 2021
  • [7]基于数据挖掘的A企业内部审计信息化研究[D]. 孙阳. 太原理工大学, 2021
  • [8]开源数据挖掘的伦理分析[D]. 李政. 昆明理工大学, 2021
  • [9]大学生学业成绩与毕业去向的数据挖掘研究[D]. 王如意. 东北农业大学, 2021
  • [10]基于Apriori算法的《伤寒杂病论》“麻黄-石膏”的证-方-药关联分析[D]. 刘梦柳. 山西医科大学, 2021(01)

标签:;  ;  ;  

数据挖掘技术理论与应用
下载Doc文档

猜你喜欢