一、应用数据仓库技术实现决策支持系统(论文文献综述)
陈峰[1](2021)在《运筹学在整车物流智能调度决策支持系统中的研究与应用》文中提出本文基于整车物流智能调度决策支持系统的研发、实施与运维的成功应用,论述运筹学在智能化上的应用路径以及实践驱动的学术路径。该系统是国内较早在汽车物流企业实现落地的智能化调度系统,其所形成的思想理论与方法技术揭示了运筹学在智能化应用上的核心价值,以及实践驱动的学术价值,对解决"卡脖子"难题提供示范性思路。本文提出运筹学在智能化研发上"三环七步"的整体研发框架。首先,分析智能化需求的运筹学特征,详细介绍汽车整车物流的发展趋势、瓶颈及智能调度需求;其次,论述运筹学系统模型的作用与建模方法,分析汽车整车物流系统模型的决策要素、目标及约束,提出汽车整车物流智能调度的运筹学应用问题。然后,提出"模式装箱"的新装箱理论问题,明确问题的计算难解性、可解性及核心科学特征。进一步,建立汽车整车物流调度应用问题与科学问题的混合整数线性规划模型;提出求解汽车整车物流调度问题的分支定界算法,以及大规模问题求解的时空分解及滚动求解方法与技术;提出面向运筹应用的生产测试及压力测试方法,给出汽车整车物流调度的测试分析的流程与结果。此外,提出深度集成整车运输管理系统与仓库管理系统、优化算法引擎驱动的分布式、多视图、多系统融合的智能调度决策支持系统。最后,论述该系统在实施过程中的推广使用和运维情况,并对运筹学应用及实践驱动的科学研究进行总结与展望。
王营[2](2021)在《基于产品售后服务的闭环质量控制研究》文中研究指明近年来,制造业的高速发展,使得企业面临的挑战日益艰巨,企业也越来越认识到质量管理的重要性和紧迫性,售后服务质量控制是质量控制中不可缺少的一部分,其也越来越被广泛认为是在当今竞争激烈的环境中制造企业成功的关键因素。本文将围绕售后服务质量控制的实现框架及关键技术展开研究,通过数据挖掘技术发掘售后服务过程中所蕴含的质量问题,对于改进产品质量和服务质量,提高企业市场占有率和竞争力具有重要的现实意义。首先,针对在售后服务质量控制中对于质量问题的探究和反馈较少,难以从源头解决质量缺陷的问题,提出了基于产品售后服务的闭环质量控制框架,以支持设计、制造及售后服务阶段的质量控制和基于售后服务阶段的质量反馈,为后续关键技术研究奠定基础。其次,用户需求可以为质量改进提供决策支持,但目前难以全面地从用户评论中获取用户需求,基于此提出一种基于完善后的词典与依存句法相结合的用户需求挖掘模型。利用TF-IDF算法从评论数据中提取产品特征词与情感词,完善相关词典后与依存句法相结合对产品特征进行量化来获取用户需求。然后,虽然在保养、维修等服务过程中产生了海量数据,然而对这些数据分析较为匮乏,基于此提出一种基于改进FP-growth算法的服务数据挖掘模型。经实例对比分析得出,基于改进FP-growth算法的挖掘模型比利用改进前的算法得到的挖掘模型时间更短,挖掘结果相关性更高。接着,针对零件在服务过程中出现的质量缺陷难以追溯的问题,建立零件质量数据仓库,来集成与零件质量相关的数据,并在此基础上提出一种基于决策树C4.5算法的零件质量追溯模型,挖掘质量影响产品质量的关键因素。经实例分析得出,利用零件质量数据仓库与基于决策树C4.5算法的追溯模型能够有效完成质量追溯。最后,基于上述框架及关键技术的研究,设计基于产品售后服务的闭环质量控制系统的架构及功能模块,并利用开发平台、数据库及Python语言完成系统的开发。
张鹏[3](2021)在《基于数据仓库的中国中老年人胃肠疾病影响因素分析与患病风险评估研究》文中提出慢性病一直以来都是困扰中老年人健康生活的严重问题,胃肠疾病更是直接影响患病者的日常生活、饮食等方面。随着我国老龄化人口的加剧,公共医疗方面的负担也愈发加重。虽然目前关于胃肠疾病病理方面的研究较多,但较少见胃肠疾病空间分布与影响因素等方面的研究。因此针对中国地区中老年人的胃肠疾病开展空间分布、影响因素及患病风险评估方面的研究是对现有研究的有益补充,具有重要的科学意义和实际应用价值。本研究考虑到现代社会数据信息化的发展,从搭建以胃肠疾病为主题的数据仓库开始,结合地理信息系统和机器学习算法,参考空间流行病学方面的原理,以北京大学国家发展研究院主持开展,中国健康与养老跟踪调查报告数据为研究对象,首先利用统计分析、空间分析,对胃肠疾病患病情况进行探索,确定易患病的人群特征、地域范围及患病聚集区;其次,利用SPSS统计软件中的假设检验方法,确定统计学显着的患病影响因素;最后,基于确定的相关因素,通过重采样方法对用于搭建集成学习的分类器进行分析对比,选择效果较好的分类器搭建集成学习分类器,最终将集成学习分类器的分类结果通过GIS软件绘制得到患病风险地图,研究结果能够确定潜在的患病高风险地区并对各个地区的患病风险进行评估。本研究的主要内容为以下几点。(1)中老年人胃肠疾病主题的数据仓库搭建。通过搭建Hadoop集群,配置基于Flume和Kafka框架的数据采集模块。在数据仓库中,为使数据流转更加清晰条理,本研究设计了四层逻辑模型,每层承担不同功能,将原始数据与最终抽取使用的数据完全隔离开,增加了系统的鲁棒性,降低了数据耦合性。(2)患病情况的可视化统计分析。根据搭建好的数据仓库,抽取数据应用层数据表,通过B/S架构的可视化系统,对患病人群的地区分布、年龄分布、性别分布以及各个地区的患病率进行可视化。分析可视化结果发现,患病人群主要集中在45至64岁,女性患病人数多于男性,患病人数较多、患病率较高的地区均在我国的西南地区。其他地区如江西一带、内蒙古东部地区与河北地区也存在患病率较高且集中的现象,其他地区如东部沿海地区,只零星出现了几处高患病率地区。(3)相关影响因素的筛选以及传统Logistic回归模型的分析。通过抽取数据仓库中服务数据层数据,导入SPSS软件进行假设检验与传统Logistic回归建模。对于数值型数据使用T检验,类别型数据使用卡方检验。根据假设试验原理,选择具有显着性水平的因素(P<0.10)纳入Logistic模型的建立。在SPSS软件中,建立Logistic模型时会对影响因素进行进一步筛选,最终得到具有显着相关的20项影响因素。其中,身体状况对患病的影响最为显着,表现为身体健康状况越差,患病风险越高。另外情绪方面因素如睡眠质量、感到开心和因小事而感到烦恼对患病也有明显影响,具体表现为正面的情绪因素对是否患病有保护作用而负面的情绪因素有危险作用。此外,胃肠疾病的患病也与其他多种慢性病存在相关性,考虑慢性病之间存在并发关联。(4)基于筛选后的影响因素建立胃肠疾病患病风险评估模型,并绘制患病风险地图。首先通过三种重采样方法对数据仓库中的服务数据层数据进行处理,通过Python在每种采样方法后建立Logistic回归、决策树和支持向量机三种模型进行分类预测,研究结果显示在三种不同的重采样方法中,决策树对比另外两种分类器具有更好的性能。集成学习时,建立集成投票分类器、集成Stacking分类器和随机森林模型对原始数据进行分类预测,结果发现集成Stacking分类器与随机森林模型的分类性能由于集成投票分类器,拟合精度均在83%左右。基于此分类结果绘制中国地区胃肠疾病患病风险地图,研究结果显示我国西南地区是胃肠疾病的患病高风险地区,其他地区也存在部分分布较为分散、且影响范围较小的高风险地区。本研究通过建立数据仓库,对中国地区中老年人胃肠疾病的分布情况与患病影响因素进行分析,并建立胃肠疾病风险评估模型模拟各个地区的患病风险,研究结果能为公共卫生部门合理配置公共卫生资源和制定预防策略提供有效的科学理论依据和信息化决策工具。
杨彬[4](2021)在《数据驱动的铁路机车油耗及维修决策分析研究》文中研究表明
楚江涛[5](2021)在《基于Hadoop的电商大数据分析系统的设计与实现》文中指出随着大数据时代的到来,电子商务互联网公司每日会产生高达PB乃至EB的海量数据。因此,运用海量数据指导企业运营和加速产品升级、争夺市场份额,也成为了未来电子商务企业的共识。而传统数据仓库只能对关系型数据库中的GB级别的结构化数据进行简单处理,无法处理PB乃至EB级别的半结构化数据与非结构化数据。为了解决传统数据仓库面对大数据时出现的问题,本文结合当前主流的大数据技术开发了电商大数据分析系统。通过电商大数据分析系统对电商企业海量、真实的历史数据进行分析并生成可视化结果,帮助企业运营,提高产品的竞争力。论文主要工作如下:使用当前主流的大数据技术搭建大数据基础平台,设计实现了基于Hive的四层数据仓库,对颗粒度不同的数据进行分层处理;设计了一套基于FlumeKafka-Flume、Sqoop的数据ETL方案,保证海量异构数据采集时的数据一致性;利用Azkaban实现复杂工作流任务全自动调度,解决传统数据仓库人工调度任务、人工编写报表造成低效率、易出错等问题;最后基于Map File设计并实现了HDFS小文件存储方案,提高系统存储性能与处理效率。论文的创新之处如下:(1)设计并开发了基于Flume-Kafka-Flume的ETL方案,实现了海量、异构、多源数据24小时的实时采集与传输,并保证了在传输过程中数据的安全性、完整性。(2)基于Map File实现了HDFS的小文件优化方案,提高大数据分析系统的存储能力与运行效率,并通过添加文件大小检测器简化HDFS小文件的管理。
李大洲[6](2020)在《基于大数据的用户行为日志系统设计与实现》文中认为针对用户行为日志,提出基于大数据的用户行为日志系统设计方案。该方案在公司现有框架的基础上,对用户行为日志收集系统进行了重组,并提出了高可靠性和高可用的设计要求。采用Flume框架实时收集用户行为日志数据,通过编写ETL拦截器、Type拦截器,实现了对日志数据的过滤。通过优化参数配置,实现了多线程日志收集,提高了日志收集系统的可靠性和实用性。采用Kafka框架实时传输日志,通过对生产者端、Broker端和消费者端的优化,实现了消息传输的精确一次语义,使系统的消息传输与存储更加稳定和高效。采用Hive搭建数据仓库分层搭建数据仓库,通过分析用户主题的相关指标,为系统决策提供支持。实现数据可视化模块,为系统开发人员提供了方便且准确的可视化服务。
邱钟成[7](2020)在《基于改进决策树算法的快递客服绩效考核研究与应用》文中指出我国的快递行业已经历了近三十多年的发展,近几年得益于网络电子商务的高速发展,国内的快递物流公司更是以每年30%的增速发展壮大。随着快递物流服务需求的增大,随之而来的反馈问题将日益增多,目前的技术水平无法完全用计算机处理所有的反馈问题,必须有快递客服与计算机共同处理并解决这些问题,快递客服对快递行业提高客户满意度,保留客户,降低流通成本起到了重要作用,是每家快递公司都不可缺少的部分,而快递客服的工作绩效不同于一般职能部门的工作绩效,对其考核成为了快递公司的一大难题。因此,建立一个科学、合理、公正的快递客服评价体系显得尤为重要。本文以快递客服的绩效考核为研究内容,将数据仓库技术和数据挖掘技术应用于其中。在数据仓库的建立过程中,首先分析了海量数据从原始数据源到数据仓库的流程,接着详细介绍了绩效考核系统里的数据预处理过程,方法和处理规则,最后设计了数据仓库结构;在数据挖掘算法里,决策树算法具有很好的分类准确性和快速分类能力,根据快递客服的数据特点,采用决策树算法进行快递客服历史数据挖掘,现有决策树算法在计算复杂度和分类属性选取上有所不足,本文提出了基于协调测度信息熵的决策树算法对快递客服数据构建决策树模型,仿真结果验证了算法的优越性,最终模型展示显示了模型分裂属性的复杂化和差异化;针对快递客服绩效考核数据随时间增长而不断变化的问题,通过将贝叶斯算法与决策树算法结合解决问题,提出基于贝叶斯节点的增量决策树算法,通过实验结果对比分析,说明了基于贝叶斯节点的增量决策树算法对于快递客服历史数据处理建模的合理性;在数据处理和算法设计优化基础上,本文设计完整的快递客服绩效考核系统,具有数据管理、算法导入、数据建模的主要功能,并通过了基本的功能和性能测试,验证了系统满足设计需求。论文旨在短时间内传递有价值的信息到管理层人员,协助快递行业管理层人员辅助决策,使管理层人员能够根据分析结果制定针对性政策去管理协调客服工作。论文成果有利于提出适合客服工作的有效管理方法以及改进客服绩效的意见等,具有良好的理论价值和现实意义。
李英楠[8](2020)在《基于Hive的购销数据仓库系统的设计与实现》文中研究指明科学技术的发展带来了人们生活办公方式的转变,当今时代所倡导的人工智能,大数据等技术的发展都以数据作为基石。数据的价值在生活的方方面面都日益明显,而对于一个企业来说数据的价值更是在一个企业当中扮演着至关重要的角色,企业在日常经营与生产中积累了海量的数据,数据进入了DT时代,如何合理地处理和利用这些数据成了所有企业所关心的重要问题。大数据技术在这种背景下孕育而生,并在潮流之中稳步向前发展,在大数据的浪潮之中,Hadoop技术脱颖而出,并得到了学术界和工业界的广泛认可,Hadoop集群之上的开源数据仓库应用Hive具有模式自由、扩展性高和容错性高等特点,能够很好的为企业级数据仓库的建设提供服务,因此,越来越多的企业开始考虑如何很好地利用Hive数据仓库带来的优势,创建自己企业的数据仓库,使自身的信息化建设迈上一个新的台阶。数据仓库是一个面向主题,经过加工和集成,相对稳定并且随时间变化的数据集合,然而传统数据仓库扩展性、容错性等较低,处理大规模数据效果非常差劲,使数据仓库完全脱离了时代的潮流,发挥不出应有的功能。在数据仓库中,查询是其所有操作的重要组成部分,数据仓库中的数据会长期存在,方便用户直接进行查询操作。大数据背景下,新的数据仓库建设方案迫在眉睫。针对上面所提出的问题本文提出了一种大数据时代下新的数据仓库建设思路,更好的服务于当今社会背景下的企业的信息化建设。企业数据仓库为企业提供数据支持,方便企业更好地进行数据管理和数据挖掘工作,是企业信息化建设的核心所在。文章以数据仓库建设的背景和意义作为文章的开始,而后深刻地分析了现在国内外对数据仓库技术的研究成果,在对现有技术的研究之上,本文采用自动化的数据处理技术和新颖的数据分层思想,并且对目标系统进行了需求分析和设计得知数据处理、数据建模、数据仓库管理和可视化是我们目标系统的四个重要组成部分。因此本文的主要研究内容有:1、数据处理使用Hadoop平台,Hadoop为数据仓库提供高效且廉价的数据处理平台,利用Hive sql方便了数据处理流程,并且自主设计使用SHELL脚本实现了ETL自动化过程,通过实验分析得出最佳线程数,使用Yarn来进行资源管理提高数据仓库的稳定性和扩展性,并且利用Map Reduce并行计算的优势,能够很好地支持企业大规模数据的处理。2、数据建模数据建模的核心是逐层解耦。越到底层越接近业务发生的记录,越到上层,越接近业务目标。数据仓库的建设使用维度建模法,在建模的同时设计数据分层,使数据变得更加可靠,数据结构更加明确,方便我们对数据进行血缘追踪,为数据开发提供极大的便利。3、可视化部分利用spring MVC+spring+mybatis+Echars作为整个系统的框架,向企业展示他们所关心的关键购销数据。4、测试部分针对各个功能模块设计了相应的测试用例。根据我们所设计的测试用例对系统的性能、功能以及安全性进行测试,测试结果在我们的预料之中,系统运转正常。
孟文霞[9](2020)在《基于政府数据中心的数据治理与可视化应用》文中进行了进一步梳理随着我国信息技术水平的不断发展和提高,以及国家对信息化工作的不断重视和推进,移动互联网、大数据、云计算、人工智能等技术在近几年来得到迅猛发展,各行各业在信息服务建设上都在不断创新。在新的环境和挑战下,各行各业都在由信息技术向数据处理技术上进化,数字化、智能化、线上化、智慧化等需求几乎无处不在,而当前处在后疫情时代更是激增了很多类似的需求。对于政府机构而言,目前已有很多政府机构已实现了不同层次的政务信息化水平的建设,走在“智慧政府”建设的路上,但随着政务信息化建设的规模增大,信息化在给各方带来便利的同时,也带来了一些新的问题和挑战。伴随着“智慧政府”的建设,很多政务部门都建设了业务信息管理系统,形成了较为完整的政务信息化体系,同时随着业务的发展相应产生了大量的业务信息数据。如何以数据中心为基础进行数据的集中存储和利用,如何进行数据治理、数据管理和数据分析来增强各类业务系统数据的可利用性,如何通过提高信息利用效率来精细化政务管理和政务服务,从而促进“智慧政府”建设的发展,这些都成为当前政务信息化建设发展极需要解决的问题。数据治理作为一个新的领域有着非常大的发展潜力,而数据实践是终级目标,本文即是通过某区政府基于数据中心的数据治理和应用实例,进行相关的数据治理之路的探索。在研究思路上,本文首先以某区政府数据中心为基础背景来确定了数据治理的体系和目标,然后通过数据管理、数据共享等方面的剖析和实践构建和实现了数据治理的框架体系,最后以可视化应用的数据应用实例来验证了数据治理的成效。本文数据治理的架构体系既能从数据源头开始明晰数据流向和规划好权责,也能使各业务系统之间均通过数据中心来进行交互,既能实现业务数据的互通又能保持业务系统之间的相互独立,从而使各机构之间能进行共同的协同工作。
张朋[10](2020)在《基于ERP的证券行业财务会计信息系统构建研究 ——以D证券公司为例》文中进行了进一步梳理2020年注定是不平凡的一年,随着我国资本市场的不断发展和完善,国家决定在今年4月取消外资券商准入限制,引入市场竞争机制促进行业发展,同时加快打造航母级券商战略,证券业进入一个崭新的发展阶段。许多大型券商开始对外进行扩张,并购重组案例增多,但财务成本过高、缺乏管控手段等问题随之出现,中小型券商在市场份额被蚕食情况下如何参与竞争,为应对这些现实问题,券商开始探索财务管理创新。当前正好处在第四次工业革命起步阶段,自动化、智能化产业迅猛发展,为这种创新提供了可能,券商要想在激烈的国内外竞争中占得先机,就需要尽早实现信息化管理,将最先进信息技术运用到企业财务管理中,推进财务会计信息系统建设和完善,为企业生存发展保驾护航。本文以ERP、业务流程再造、系统集成论等相关理论为指导,将财务会计信息系统构建相关问题作为研究对象,采用理论与实际案例结合的研究方式,通过实地调研对证券行业会计信息系统的应用现状及存在问题进行了分析,提出以战略导向性、数据完整性、开放性、成本效益性为原则,基于ERP构建财务会计信息系统的整体框架和集成解决方案,将系统规划为传统会计、管理会计、分析决策、数据仓库四个部分,又对各系统包含的业务子系统构建进行详细深入研究。并最终选取笔者所在的D证券公司作为应用案例,介绍该公司业务流程再造和系统构建的全过程,对系统建设过程中可能遇到的主要风险点进行总结,对系统取得的应用效果量化分析,最后归纳了影响系统建设成败的五大关键因素。本文基于ERP构建的财务会计信息系统可协助企业开展战略规划、资源整合、成本管理、风险管控、绩效考核等各项财务管理活动,有效解决企业经营与战略脱节、缺乏管控抓手、业务与财务失联、管理会计功能缺失、财务数据质量差、利用效率低等问题,丰富了证券乃至整个会计行业在会计信息系统构建的理论研究。希望通过本研究,对证券同行在财务会计信息系统构建方面提供一些有益的借鉴和启示。
二、应用数据仓库技术实现决策支持系统(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、应用数据仓库技术实现决策支持系统(论文提纲范文)
(2)基于产品售后服务的闭环质量控制研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 质量控制发展及研究现状 |
1.2.2 用户需求获取研究现状 |
1.2.3 MRO研究现状 |
1.3 存在的问题 |
1.4 研究目的及意义 |
1.5 研究内容及论文章节结构 |
第2章 基于产品售后服务的闭环质量控制框架 |
2.1 质量控制 |
2.1.1 设计阶段 |
2.1.2 制造阶段 |
2.1.3 售后服务阶段 |
2.2 质量反馈 |
2.2.1 产品质量反馈 |
2.2.2 服务质量反馈 |
2.3 基于产品售后服务的闭环质量控制过程 |
2.4 本章小结 |
第3章 基于用户评论的需求挖掘与获取 |
3.1 用户需求挖掘模型 |
3.2 数据获取与预处理 |
3.3 词典构建与词对提取 |
3.3.1 基于TF-IDF算法的特征提取与词典构建 |
3.3.2 特征-情感词对提取 |
3.4 用户需求获取 |
3.4.1 特征量化 |
3.4.2 获取用户需求 |
3.5 本章小结 |
第4章 基于改进FP-growth算法的服务数据挖掘 |
4.1 服务数据分析和整理 |
4.2 改进FP-growth算法 |
4.2.1 FP-growth算法 |
4.2.2 改进FP-growth算法 |
4.3 实例验证 |
4.3.1 运行时间和规则相关性 |
4.3.2 规则说明 |
4.4 本章小结 |
第5章 基于数据的零件质量追溯 |
5.1 数据仓库基本概念及设计 |
5.2 零件质量数据仓库的建立 |
5.2.1 明确零件质量数据仓库的范围 |
5.2.2 零件质量数据仓库概念模型设计 |
5.2.3 零件质量数据仓库逻辑模型设计 |
5.2.4 零件数据仓库物理模型设计 |
5.3 基于决策树C4.5算法的零件质量追溯 |
5.3.1 决策树C4.5算法 |
5.3.2 基于决策树C4.5算法的零件质量追溯模型 |
5.4 实例验证 |
5.5 本章小结 |
第6章 基于产品售后服务的闭环质量控制系统设计与实现 |
6.1 系统功能模块 |
6.2 系统架构设计 |
6.3 系统开发环境 |
6.4 系统模块实例 |
6.4.1 用户登录界面 |
6.4.2 用户需求获取模块 |
6.4.3 服务知识挖掘模块 |
6.4.4 零件质量追溯模块 |
6.5 本章小节 |
总结与展望 |
总结 |
展望 |
参考文献 |
攻读硕士学位期间发表的学术论文 |
致谢 |
学位论文评阅及答辩情况表 |
(3)基于数据仓库的中国中老年人胃肠疾病影响因素分析与患病风险评估研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外现状 |
1.2.1 数据仓库的应用研究 |
1.2.2 数据仓库在医疗卫生方面的应用研究 |
1.2.3 慢性病预测评估模型 |
1.3 研究内容与结构安排 |
1.3.1 研究内容 |
1.3.2 结构安排 |
第2章 数据集与相关技术概念 |
2.1 数据集来源 |
2.2 相关技术理论 |
2.2.1 Hadoop分布式系统 |
2.2.2 数据仓库系统 |
2.2.3 空间自相关 |
2.2.4 高低聚类与热点分析 |
2.2.5 传统Logistic回归 |
2.2.6 不平衡数据处理方法 |
2.2.7 混淆矩阵与分类器评估 |
2.2.8 反距离权重插值与风险可视化地图 |
2.2.9 其他相关技术 |
2.3 本章小结 |
第3章 胃肠疾病主题数据仓库搭建及可视化 |
3.1 搭建准备 |
3.1.1 硬件准备 |
3.1.2 软件准备 |
3.2 数据仓库搭建 |
3.2.1 需求分析 |
3.2.2 详细设计 |
3.3 胃肠疾病数据可视化 |
3.4 胃肠疾病空间自相关分析 |
3.4.1 全局空间自相关 |
3.4.2 局部空间自相关 |
3.5 胃肠疾病高低聚类及热点分析 |
3.5.1 高低聚类分析 |
3.5.2 热点分析 |
3.6 本章小结 |
第4章 胃肠疾病建模与分析 |
4.1 传统二元Logistic回归建模 |
4.2 不平衡数据的处理方法 |
4.2.1 胃肠疾病原始数据的重采样 |
4.2.2 集成学习解决胃肠疾病数据不平衡问题 |
4.3 胃肠疾病的风险可视化地图绘制 |
4.4 同类研究内容的对比 |
4.5 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士期间发表的论文和科研成果 |
致谢 |
(5)基于Hadoop的电商大数据分析系统的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 选题背景 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 论文主要工作 |
1.4 论文组织架构 |
第二章 相关理论简介 |
2.1 Hadoop简介 |
2.1.1 MapReduce |
2.1.2 HDFS分布式文件系统 |
2.2 数据仓库 |
2.3 Hive |
第三章 电商大数据分析系统需求分析 |
3.1 系统功能性需求分析 |
3.1.1 数据埋点采集 |
3.1.2 数据ETL |
3.1.3 Kafka缓存 |
3.1.4 Azkaban任务调度 |
3.1.5 系统数据分析需求 |
3.1.6 数据可视化 |
3.2 系统非功能性需求 |
3.3 实体-联系图设计 |
3.4 数据流分析 |
第四章 电商大数据分析系统概要设计 |
4.1 系统技术架构 |
4.2 数据采集模块设计 |
4.3 数据存储模块设计 |
4.4 系统数据仓库设计 |
4.4.1 数据仓库原始数据层 |
4.4.2 数据仓库明细数据层 |
4.4.3 数据仓库服务数据层 |
4.4.4 数据仓库数据应用层 |
第五章 电商大数据分析系统实现 |
5.1 系统总体框架 |
5.2 基础平台搭建 |
5.2.1 Hadoop环境搭建 |
5.2.2 Hive环境搭建 |
5.2.3 Sqoop环境搭建 |
5.3 数据ETL实现 |
5.3.1 日志数据采集详细实现 |
5.3.2 结构化数据采集详细实现 |
5.4 数据仓库详细实现 |
5.4.1 ODS层数据仓库具体实施 |
5.4.2 DWD层数据仓库具体实施 |
5.4.3 DWS层数据仓库具体实施 |
5.4.4 ADS层数据仓库具体实施 |
5.5 数据分析与可视化 |
5.5.1 用户活跃度 |
5.5.2 用户留存率 |
5.5.3 用户转化率 |
5.5.4 交易行为GMV |
5.6 Azkaban全自动调度 |
5.7 系统优化 |
第六章 系统测试 |
6.1 测试环境 |
6.2 系统功能测试 |
6.3 系统性能测试 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
在校期间获得的成果 |
(6)基于大数据的用户行为日志系统设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题背景及意义 |
1.2 国内外研究现状 |
1.3 课题主要工作 |
1.4 主要创新点 |
1.5 论文结构 |
第二章 相关背景知识介绍 |
2.1 Flume日志收集系统 |
2.2 Kafka消息引擎系统 |
2.3 数据仓库技术 |
2.3.1 产生背景 |
2.3.2 定义及特性 |
2.3.3 相关概念 |
2.3.4 逻辑模型 |
2.4 Hive技术 |
2.5 本章小结 |
第三章 系统分析 |
3.1 系统现状 |
3.1.1 当前日志收集系统架构 |
3.1.2 当前日志收集系统的问题 |
3.2 需求分析 |
3.3 系统设计原则 |
3.4 本章小结 |
第四章 系统设计与实现 |
4.1 系统总体设计 |
4.1.1 系统架构设计 |
4.1.2 系统功能模块设计 |
4.1.3 系统业务流程的设计 |
4.1.4 系统开发环境 |
4.2 日志格式解析 |
4.3 基于Flume的日志收集模块设计与实现 |
4.3.1 拦截器配置 |
4.3.2 多线程日志收集 |
4.3.3 日志收集模块的实现 |
4.4 基于Kafka的消息引擎模块设计与实现 |
4.4.1 Kafka优化 |
4.4.2 消息引擎模块的实现 |
4.5 基于Hive的用户行为数据仓库模块设计与实现 |
4.5.1 数据仓库架构设计 |
4.5.2 数据仓库建模设计 |
4.5.3 数据仓库分层设计 |
4.6 数据可视化模块的设计与实现 |
4.6.1 Ganglia |
4.6.2 Kafka Manager |
4.6.3 Tree DMS |
4.7 本章小结 |
第五章 系统测试 |
5.1 测试环境 |
5.2 系统功能测试 |
5.3 系统性能测试 |
5.3.1 Flume性能测试 |
5.3.2 Kafka性能测试 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
附录1 程序清单 |
附录2 攻读硕士学位期间撰写的论文 |
致谢 |
(7)基于改进决策树算法的快递客服绩效考核研究与应用(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 课题来源及研究内容 |
1.3 本文的章节安排 |
第二章 相关技术研究 |
2.1 快递客服绩效考核概述 |
2.2 快递客服绩效考核常用方法 |
2.3 基于决策树算法的绩效考核研究现状 |
2.3.1 国内研究现状 |
2.3.2 国外研究现状 |
2.4 本章小结 |
第三章 快递客服绩效考核系统设计 |
3.1 系统设计目标 |
3.2 系统介绍 |
3.2.1 系统总框架设计 |
3.2.2 系统功能模块设计 |
3.3 数据预处理区设计 |
3.3.1 数据源分析 |
3.3.2 数据抽取 |
3.3.3 数据清洗与变换 |
3.3.4 数据装载 |
3.4 数据仓库设计 |
3.4.1 数据仓库体系结构 |
3.4.2 数据仓库内容 |
3.4.3 数据仓库模型 |
3.4.4 数据库表结构 |
3.5 本章小结 |
第四章 基于协调测度信息熵决策树的快递客服绩效考核方法 |
4.1 基于决策树算法的绩效考核方法分析 |
4.2 基于协调测度信息熵决策树的快递客服绩效考核方法 |
4.2.1 基于决策协调度的决策树算法 |
4.2.2 模糊集理论 |
4.2.3 基于协调测度信息熵的决策树算法 |
4.2.4 基于协调测度信息熵决策树的快递客服绩效考核方法 |
4.2.5 算法分析 |
4.3 本章小结 |
第五章 基于贝叶斯节点的增量决策树快递客服绩效考核方法 |
5.1 贝叶斯决策树算法应用分析 |
5.2 基于贝叶斯节点的增量决策树算法 |
5.2.1 贝叶斯决策树算法 |
5.2.2 基于贝叶斯节点的增量决策树算法 |
5.2.3 算法分析 |
5.3 本章小结 |
第六章 快递客服绩效考核系统实现与测试 |
6.1 系统实现与测试环境 |
6.2 快递客服绩效考核系统实现 |
6.2.1 系统架构 |
6.2.2 数据仓库部署 |
6.2.3 算法实现 |
6.3 快递客服绩效考核系统功能测试 |
6.4 本章小结 |
第七章 总结与展望 |
参考文献 |
附录1 攻读硕士学位期间申请的专利 |
致谢 |
(8)基于Hive的购销数据仓库系统的设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要研究内容 |
1.4 论文的组织结构 |
1.5 本章小结 |
第2章 相关理论基础 |
2.1 数据仓库技术 |
2.1.1 数据仓库的产生背景 |
2.1.2 数据仓库定义 |
2.1.3 数据仓库特点 |
2.1.4 数据仓库基本特性 |
2.1.5 数据仓库的相关概念 |
2.1.6 数据仓库的结构 |
2.1.7 数据仓库开发过程 |
2.1.8 数据仓库建模方法 |
2.2 ETL技术 |
2.2.1 ETL技术定义 |
2.2.2 ETL作用 |
2.3 sqoop技术介绍 |
2.4 Flume技术介绍 |
2.5 SSM框架 |
2.5.1 Spring |
2.5.2 Spring Mvc |
2.5.3 Mybatis |
2.6 ECharts |
2.7 本章小结 |
第3章 系统分析 |
3.1 业务需求分析 |
3.2 建设目标 |
3.3 系统功能性分析 |
3.4 系统性能需求 |
3.5 平台构建原则 |
3.6 本章小结 |
第4章 系统设计 |
4.1 系统架构设计 |
4.2 数据仓库设计 |
4.2.1 数据处理模块 |
4.2.2 数据建模模块 |
4.3 数据可视化 |
4.4 本章小结 |
第5章 系统实现 |
5.1 系统开发环境 |
5.2 系统主要功能实现 |
5.2.1 数据仓库实现 |
5.2.2 Web可视化实现 |
5.2.3 其它功能模块 |
5.3 本章小结 |
第6章 系统测试 |
6.1 测试环境 |
6.2 系统测试内容 |
6.2.1 系统功能测试 |
6.2.2 系统性能测试 |
6.3 本章小结 |
第7章 总结与展望 |
7.1 全文工作总结 |
7.2 未来工作展望 |
参考文献 |
致谢 |
(9)基于政府数据中心的数据治理与可视化应用(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 选题的背景和意义 |
1.2 国内外研究现状 |
1.3 主要内容和目标 |
1.4 论文的组织结构 |
第二章 相关理论与技术 |
2.1 数据治理 |
2.2 数据仓库 |
2.2.1 数据仓库基本概念 |
2.2.2 数据仓库生命周期模型 |
2.3 数据清洗 |
2.3.1 数据清洗概念 |
2.3.2 ETL技术 |
2.4 数据可视化 |
2.4.1 数据可视化概念 |
2.4.2 数据可视化的基本步骤 |
2.5 数据挖掘 |
2.6 本章小结 |
第三章 数据治理需求分析和框架设计 |
3.1 需求分析 |
3.1.1 数据管理需求分析 |
3.1.2 数据共享需求分析 |
3.1.3 数据应用需求分析 |
3.1.4 数据安全需求分析 |
3.2 框架设计 |
3.2.1 数据治理目标 |
3.2.2 框架设计 |
3.3 本章小结 |
第四章 数据治理的设计与实现 |
4.1 数据标准化 |
4.1.1 数据标准化概述 |
4.1.2 数据标准体系 |
4.1.3 编码规范与代码类型 |
4.2 数据交换 |
4.3 数据同步 |
4.4 数据集成 |
4.4.1 业务数据库 |
4.4.2 基础数据库 |
4.5 数据管理 |
4.5.1 数据源管理 |
4.5.2 信息类管理 |
4.5.3 数据元管理 |
4.5.4 代码集管理 |
4.6 数据共享 |
4.7 相关系统的部署 |
4.8 本章小结 |
第五章 数据治理的实践应用与验证 |
5.1 实际应用背景 |
5.2 数据可视化应用展现 |
5.2.1 经济信息统计分析 |
5.2.2 人口信息统计分析 |
5.2.3 综合报告查看 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 局限及展望 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
附件 |
(10)基于ERP的证券行业财务会计信息系统构建研究 ——以D证券公司为例(论文提纲范文)
致谢 |
摘要 |
abstract |
1 绪论 |
1.1 研究背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究对象和方法 |
1.2.1 研究对象 |
1.2.2 研究方法 |
1.3 研究思路与内容 |
1.3.1 研究思路 |
1.3.2 研究内容 |
1.4 可能的创新点 |
2 文献综述 |
2.1 会计信息系统构建相关文献 |
2.2 财务ERP系统应用相关文献 |
2.3 文献评述 |
3 证券行业财务会计信息系统的应用现状及问题分析 |
3.1 财务会计信息系统的应用现状 |
3.2 财务会计信息系统应用存在的问题分析 |
3.2.1 缺乏全局战略规划 |
3.2.2 信息化观念陈旧落后 |
3.2.3 存在严重信息孤岛现象 |
3.2.4 会计信息系统架构不完善 |
3.3 基于ERP构建财务会计信息系统的必要性 |
4 基于ERP的证券行业财务会计信息系统构建方案设计 |
4.1 ERP会计信息系统的原理与框架设计 |
4.1.1 ERP会计系统的基本原理 |
4.1.2 业务流程再造理论视角下的证券业务分析 |
4.1.3 ERP会计系统构建框架设计 |
4.2 ERP会计系统构建目标和原则 |
4.2.1 构建总体目标 |
4.2.2 构建基本原则 |
4.3 面向业务层方案 |
4.3.1 会计核算管理 |
4.3.2 费用控制管理 |
4.3.3 资金管理 |
4.3.4 税务管理 |
4.4 面向管理层方案 |
4.4.1 全成本管理 |
4.4.2 全面预算管理 |
4.4.3 绩效考核管理 |
4.4.4 流动性风险管理 |
4.5 面向决策层方案 |
4.5.1 财务分析 |
4.5.2 战略决策 |
5 D证券公司财务ERP系统构建案例分析 |
5.1 D证券公司背景 |
5.1.1 公司简介 |
5.1.2 财务信息化概况 |
5.2 财务ERP系统构建过程 |
5.2.1 流程再造分析 |
5.2.2 ERP系统构建 |
5.2.3 系统实施中的风险及对策 |
5.3 财务ERP系统构建应用效果 |
5.3.1 实现传统财务向现代化财务转变 |
5.3.2 建成以全面预算、绩效考核为核心的管理体系 |
5.3.3 实现由财务报表、财务分析到商业智能转变 |
5.3.4 建立以资金、税务、流动性为基础的风险管控体系 |
5.3.5 系统应用价值量化 |
5.4 财务ERP系统建设成功的关键因素 |
5.4.1 争取公司高层领导重视 |
5.4.2 完善的财务和内部控制制度 |
5.4.3 业务流程重组再造 |
5.4.4 复合型人才培养 |
5.4.5 整体规划分步实施 |
6 结论与展望 |
6.1 全文总结 |
6.2 研究展望 |
参考文献 |
四、应用数据仓库技术实现决策支持系统(论文参考文献)
- [1]运筹学在整车物流智能调度决策支持系统中的研究与应用[J]. 陈峰. 运筹学学报, 2021(03)
- [2]基于产品售后服务的闭环质量控制研究[D]. 王营. 山东大学, 2021
- [3]基于数据仓库的中国中老年人胃肠疾病影响因素分析与患病风险评估研究[D]. 张鹏. 云南师范大学, 2021(08)
- [4]数据驱动的铁路机车油耗及维修决策分析研究[D]. 杨彬. 中国矿业大学, 2021
- [5]基于Hadoop的电商大数据分析系统的设计与实现[D]. 楚江涛. 青海师范大学, 2021(09)
- [6]基于大数据的用户行为日志系统设计与实现[D]. 李大洲. 南京邮电大学, 2020(02)
- [7]基于改进决策树算法的快递客服绩效考核研究与应用[D]. 邱钟成. 南京邮电大学, 2020(03)
- [8]基于Hive的购销数据仓库系统的设计与实现[D]. 李英楠. 西南大学, 2020(05)
- [9]基于政府数据中心的数据治理与可视化应用[D]. 孟文霞. 华南理工大学, 2020(05)
- [10]基于ERP的证券行业财务会计信息系统构建研究 ——以D证券公司为例[D]. 张朋. 浙江大学, 2020(02)