研发机构统计数据质量和异常值的对数正态分布检验与识别

研发机构统计数据质量和异常值的对数正态分布检验与识别

一、研究与开发机构统计数据质量与异常点的对数正态分布检验与识别(论文文献综述)

李斌[1](2021)在《重力坝变形监控的智能分析方法研究》文中指出重力坝变形监测数据包含了大坝变形过程的重要信息,对其信息挖掘、分析预测、安全评价是掌握大坝安全性态至关重要的技术方法。随着大坝安全监控的发展,监测数据的采集方式越来越全面、越来越智能,数据量也越来越大,这就对数据的分析处理能力提出了更高的要求。如何在海量数据中挖掘更多的有用信息,是了解大坝运行性态的基础;如何对海量数据进行预处理,是提高数据质量的前提;而对效应量保持长期精准的预测以及科学合理的安全评价,是大坝安全管理的重要内容。因此,在人工智能快速发展的时代背景下,本文以重力坝变形监测相关数据为研究对象,引入数据挖掘、智能算法、机器学习等方法,用于监测数据的异常值检测、预测预报、安全评价等分析方法的研究。主要研究内容和成果如下:(1)通过理论分析与实测数据验证,总结了重力坝变形的一般规律。首先,对空间维度的面板数据进行了相关分析,结果表明不同坝段之间均具有高度线性相关性;在此基础上,提出了形状相似系数,用于描述不同测点在变形幅度上的大小关系,计算结果表明:以中间坝段为中心将坝体对称分开,一般情况下,处于对称位置的坝段变形相似度较高,同时相邻坝段的变形相似度也较高。然后,对时间维度的单测点数据进行了自相关和偏自相关分析,从而得知某个数据与其前1时刻、前2时刻、或前3时刻有显着相关性。最后,从整体、局部和空间3个方面对重力坝变形监测数据的变化特征进行了分析和总结,以期研究适合该类数据特征的异常值检测算法。(2)对重力坝变形监测数据中的异常值进行了定义,并总结了异常值的分类与特征。然后分析了基于距离的异常值检测算法在重力坝变形监测数据分析中的适用性,并借鉴该类算法的思想,提出了多重局部异常系数法,该方法通过提取待检测值前k个数据组成的局部窗口数据,并根据设定的判别准则,可简单、快速地进行异常值实时检测。该算法主要针对原位监测数据中异常值的预处理检测,目的是为了获得高质量数据,便于后续建模分析。(3)改进了自适应差分进化算法关于初始解的选择方式,得到了改进的自适应差分进化算法(Improved Self-Adaptive Differential Evolution Algorithm,ISADE),这提高了该算法的全局优化能力,然后将其用于在线极限学习机(Online Sequential Extreme Learning Machine,OSELM)的优化,提出并建立了基于ISADE-OSELM的重力坝变形预测模型。该模型仅通过训练最新数据便可更新已有模型的参数,可实现模型的自我更新,改善了传统模型的更新方式,同时结合优化算法,提高了模型的精度和泛化性。实例计算结果表明:ISADE-OSELM模型的综合性能优于逐步回归模型、ELM模型和OSELM模型。(4)在传统置信区间法拟定监控指标的基础上,考虑了监测数据的随机性和模糊性,将云模型融入其中,使得一个具有明确边界的置信区间,拓展为一个以区间为边界的置信区间。提出并建立了云置信区间法的重力坝变形监控指标,该方法以ISADE-OSELM预测模型的误差为研究对象,因此可随着ISADE-OSELM模型的更新而更新,这使得监控指标的拟定方式更加高效。实例计算结果表明,云置信区间不仅具有传统置信区间的功能,还可按一定隶属度评价接近置信区间边界数据的安全性,这种评价方式更符合实际情况,对大坝的变形监控更加合理。

王佳鑫[2](2021)在《基于多元统计分析的接触网状态评价方法研究》文中研究表明高铁接触网安全可靠运行是保证机车安全运行的基础。随着接触网检测技术的进步以及牵引供电6C系统的应用,接触网检测参数的获取更为方便、准确,为接触网状态评价提供了技术基础,对接触网状态进行准确的评价可以保证接触网状态检修顺利实施,提高铁路供电部门的精细化管理水平。本文研究了基于多维参数的接触网状态多元综合评价方法,依据可靠度将接触网划分为优良中差四个状态,基于多元统计分析思想,研究了多元均值控制图、多元离差控制图、多元小偏移控制图以及主成分分析控制图用于接触网状态评价的可行性及其实施方法,开发了相应的接触网状态多元统计分析系统,并对几种多元统计控制图用于接触网状态评价时的性能进行对比。首先,依据接触网的运行可靠度规律对接触网状态进行划分。采用威布尔分布搭建接触网系统的可靠度模型,对接触网的可靠度函数进行拟合,根据运行的可靠度将接触网状态划分为优良中差四个等级,建立接触网可靠度的定性描述与可靠度定量表达之间的对应关系,为后续接触网状态划分的标准提供依据。其次,对常用的多元统计分析方法用于接触网状态评价的可行性及实施方法进行了研究。采用多元均值控制图通过计算在接触网各检测参数间相关性不同的情况下,接触网各检测组数据与接触网参数的整体均值、标准值之间的偏移情况;多元离差控制图通过计算检测数据的广义方差,从而判断检测参数间的相关关系以及离散程度是否发生改变;基于多元小偏移控制图在考虑到历史数据下,判断数据的偏移方向,对数据的偏移进行累加,对数据的小偏移更为敏感;基于主成分分析的控制图主要是对异常原因的诊断,利用降维的思想,计算各检测参数对异常点的贡献率,找出异常原因。这些多元统计控制图都可将接触网的多维状态参数转化为一个统计量,并以图形化的形式展示出来,不仅能反映接触网状态参数与均值之间的偏离情况,还能反映参数之间关联关系的变化情况,能更准确、更简单、更直观的显示出接触网的状态,较宜用于接触网状态的评价。最后,基于Matlab开发了相应的接触网状态参数多元统计分析软件,可实现上述多种多元统计控制图的GUI显示,并利用ARL对各种多元统计控制图的性能进行对比分析。

耿国帅[3](2020)在《青海东昆仑成矿带东段地球化学数据处理方法及找矿靶区圈定》文中认为东昆仑成矿带东段处于青海省中部,与其周边地区共同构成青藏高原北部的重要地质单元,并以其丰富的金、铜、铁、多金属矿产资源,成为国内重要的矿产资源基地之一。目前该地区基本实现了 1:50万、1:20万或1:25万化探数据覆盖,前人基于这些数据,采用传统方法圈定大量的化探综合异常,取得了较好的效果。但仍然存在一些问题。论文以地球化学数据处理为主,把成分数据的处理方法和稳健统计分析的方法应用于数据处理中,充分挖掘地球化学数据的含量信息、空间信息与内部结构信息,综合地球化学各方面特征、应用层次分析法的思路,统计各网格单元的综合信息,从而圈定找矿靶区,取得了如下的成果:1)根据该区矿床产出的地质背景,结合研究区矿床类型划分,把该区的矿床类型分为以基性岩有关的成矿组合(SEDEX型、VHMS型和沉积变质型),与中酸性岩有关的成矿组合(矽卡岩型、斑岩型和热液脉型)和热液型金矿成矿组合(蚀变岩型和石英脉型)三种组合八种类型。2)提出并应用中值和几何平均值的差与变异常系数图,分析了昆北、昆中、昆南和北巴四个子区较有潜力的成矿元素。指出昆北W、Bi、Pb、Cr、As、Ag等,昆中 Hg、Au、Sb、Mo、Bi、Ag、Sn、W、As 等;昆南 Hg、Sb、Bi、Ni、Au、Cr、Mo、As、Cu、Ag;北巴Hg、Au、Sb、As、W等为该区较有潜力的成矿元素。3)采用两种方法圈定单元素异常,①利用ILR转换后造岩元素的稳健因子分析,进行地球化学分区,对元素含量进行分区标准化,从而圈定各元素异常。②提出利用改进的Aitchison距离方法来圈定单元素异常,从两种方法圈定的效果看,与矿床点的对应关系都较好,但相对而言,Aitchison距离由于考虑了与其它元素的关系,且消除了成分数据的闭合效应,圈定的异常更好。4)利用成矿元素的主成分分析,分别提取了以基性岩成矿、与中酸性岩成矿和与金矿成矿有关的主成分异常。利用主成分分析结果和矿床特征元素,选择Cu、Co、Cr、Ni、V、Zn;Ag、Cd、Pb、Mo、Sn;Au、As、Sb 和 Au、Bi、W四种元素组合,进行稳健马氏距离计算,并圈定马氏距离异常。5)综合分析了 Au、Cu、Co、Pb等元素含量在E、SE、S、SW四个方位的空间变化情况,总体上,元素NS向的空间变化率好于EW向的空间变化率,与区内矿床点的走向一致。对比Au、Cu两元素含量变化等值线图和空间变化率等值线图,认为元素的含量空间变化率等值线图比含量等值线图更具找矿意义。6)综合各类地球化学信息,利用层次分析法的思路,计算各网格单元的成矿信息量,根据信息量,圈定了三类靶区共32处,其中与基性岩成矿有关找矿靶区10处;与酸性岩成矿有关的找矿靶区10处;与热液型金矿有关的找矿靶区12处。在此基础上,圈定10处成矿远景区。在靶区验证中,热液型金矿找矿靶区内发现金、锑矿脉,在与酸性岩成矿有关的找矿靶区内发现了钨的矿化线索。

郑莉,彭星[4](2019)在《海洋经济统计数据质量控制方法探讨与实践》文中研究说明近年来,我国海洋经济统计在不断拓展范围、补充内容、疏通渠道、提高效率,而实际统计中数据质量控制工作仍较为滞后,存在审核方法简单、效率低、范围窄等不足。本文阐述了海洋经济统计数据质量控制内涵,即包括数据的完整性、准确性、可比性、有效性,并结合海洋经济统计调查工作相关实践数据,研究了基础性检验、逻辑性检验、值域范围检验、数理统计检验等主要质量控制方法在数据审核工作中的应用,并进行了案例分析。本研究解决了海洋经济统计数据质量审查与控制的一部分难题,以期为调查实践部门开展数据质量控制工作提供具有可操作性的参考依据,并不断推动海洋经济统计数据质量控制工作走上规范化、科学化。

张勇[5](2019)在《基于大数据的盾构机掘进参数研究》文中研究指明为了缓解城市化进程带来的交通压力,地铁建设已经称为盾构机最重要的应用场景之一。在实际的盾构掘进项目中,盾构机掘进参数的控制在很大程度上依赖于操作者的经验。如何使用之前多年积累的盾构掘进历史数据,确认各个参数间的关系,量化盾构机掘进参数的控制,成为一个亟待解决的问题。本文以南京长江隧道为工程实例,结合大数据分析流程,通过预处理、趋势统计、离散统计、回归分析和机器学习建模等对盾构机掘进参数进行研究,以确定各个参数之间的关系和各个地层的最优预测模型。本文的研究过程和结论如下:(1)本文设计的盾构机掘进参数辅助分析系统能帮助数据分析人员更加快捷地完成盾构机掘进参数的分析任务。(2)由平均值、标准差、变异系数和箱形图的统计分析可知,刀盘转速、贯入度和掘进速度三者在盾构机掘进时的变化趋势基本一致,并且这三个参数对含有砾砂和圆砾的地层十分敏感。总推力和泥水压力二者的变化趋势在各个地层基本一致。在项目的起始段和到达段,各个参数的离散程度明显偏大。(3)由盾构机掘进参数的一元回归分析和多元线性回归分析可知,一元回归公式在拟合优度较好的情况向下,预测能力很差,这种现象主要是由过拟合造成的。多元回归公式在拟合优度较好的情况下,预测能力较好,本文认为多元回归分析在盾构机掘进参数分析中应用效果更好。由盾构机掘进参数的多元线性回归分析的结果可知,掘进速度主要受刀盘转速和贯入度二者的影响,泥水压力、刀盘扭矩和总推力对掘进速度的影响较小。(4)本文使用机器学习算法中的K近邻算法、CART回归树、随机森林和BP神经网络分别对盾构机掘进参数进行建模分析,结合多元线性回归模型为各个地层选择最优模型。

汪运[6](2019)在《考虑噪声特性的鲁棒回归学习算法及应用研究》文中提出在开放环境下,由于数据采集环境、数据测量仪器精度以及人为因素等,导致所收集到的数据中包含很多不确定性,如数据噪声和数据缺失等。因此,构建考虑不确定性的机器学习方法尤为重要。本文主要从实际应用出发,分析风电数据中复杂的噪声特性,研究如何从噪声特性出发构建鲁棒的且适用于风电领域的回归建模方法。主要包括以下四方面的研究内容:(1)基于分层的多混合分布的不确定性建模。通过对数据中不确定性进行分析,本文用统一的不确定性表达方式,即概率分布函数,来表示数据中常见的不确定性,包括数据噪声、数据缺失以及异常点等。考虑到单一分布以及混合分布在描述复杂不确定性时性能的局限性,在混合分布的基础上,本文提出了分层的多混合分布的不确定性表示框架来描述复杂的不确定性。(2)基于混合高斯噪声分布假设的鲁棒回归建模。开放环境下,噪声会随着环境、气候、时间以及应用领域的变化而变化,进而呈现出复杂的非高斯特性以及异方差特性。考虑到当前基于特定噪声分布假设所构建的鲁棒回归模型的局限性,本文分别提出了基于混合高斯噪声分布假设以及贝叶斯异方差假设的鲁棒回归模型,进一步提升了鲁棒回归模型的普适性。模型在风电预测以及风功率曲线拟合上具有较好的效果。(3)考虑噪声差异性和关联性的鲁棒回归建模。在多输出回归任务中,由于每个输出变量的差异性导致相应的噪声分布具有差异性,又因为输出变量之间的关联性使得噪声分布也可能具有一定的关联性,本文分别提出了多混合高斯的噪声分布先验以及嵌入关联性的贝叶斯异方差先验来刻画多输出任务中噪声的差异性和关联性,进而构建了鲁棒的函数回归模型以及异方差多核学习模型,并将其应用到风速多步预测中。(4)基于混合非对称噪声分布假设的广义鲁棒回归建模。针对噪声分布的复杂非高斯特性以及非对称特性,考虑到混合高斯分布在拟合非对称噪声的局限性,本文利用混合非对称高斯分布以及混合非对称指数幂分布的噪声分布假设构建了鲁棒的非对称样条回归模型。通过分析发现,风功率曲线拟合误差具有复杂非对称特性,本文利用所提出的模型估计出了最好的风功率曲线。本文主要关注于风电数据噪声特性分析,以及根据噪声特性构建鲁棒回归模型,并将其应用到风电领域。然而,除了风电领域以外,本文所提出的鲁棒策略以及鲁棒模型在环境、金融等其它领域都具有一定的适用性。

董梦雨[7](2019)在《数据质量的统计诊断实证研究 ——以慢性肾病住院费用数据为例》文中研究表明社会经济发展需要真实、准确、全面的统计数据,数据的质量是各行业发展的一面镜子,质量的高低决定了镜子的清晰程度。统计数据的质量是数据质量的核心部分,尤其是医疗行业中的统计数据关系到患者的切身利益,其质量更要得到重视。为了了解复杂的医疗费用数据的构成情况,以及寻找影响其统计数据质量的原因所在,本研究特选取具有高昂医疗费用的慢性肾病作为研究对象,通过诊断其数据成分,从而判断出影响其数据质量的问题,以达到有效诊断数据,优化数据处理,科学管理医疗数据的目的。针对实际数据没有满足既定假设,使得分析结果不可靠等问题,越来越多的统计学者通过数学模型和方法对我国的统计数据进行诊断。在此背景下,本文借助慢性肾病住院费用的数据进行合理的统计诊断。研究从疾病患者的原始数据及实际现状出发,着眼于数据质量管理控制的理论基础,对影响慢性肾病住院费用影响因素进行分析,使用自变量选择的方法对影响因素进行初步筛选,通过SAS运行得出最优子集并建立回归模型;然后,基于数据删除模型和局部影响分析的理论基础,运用SPSS判断异常点,用R软件进行数据参数估计、统计推断等环节的多维度分析;最后,以实例认证进行模型拟合优度的数据对比,并进行数据变换处理,得出提高数据质量的结论。文章的研究目的是希望通过诊断数据点对回归模型的影响,寻找提高模型优化的切入点,以透过实际数据反映的问题来探索提升数据质量的本质,为现实中高昂的慢性肾病治疗费用的统计数据管理提供政策建议。

袁涛[8](2016)在《综掘工作面瓦斯涌出特征及异常辨识的研究》文中研究表明综掘工作面首先揭露煤层,瓦斯涌出量大,而综掘巷道又是个独头巷道,通风回路不完整,极易发生瓦斯积聚,增加了瓦斯灾害的发生的可能性。及时发现综掘工作面瓦斯浓度数据的异常,提前发出预警信息,来有效地减轻和避免瓦斯灾害,刻不容缓。综掘工作面瓦斯涌出量是表征煤层应力状态、瓦斯压力状态和煤质特征综合作用指标,它反映了前方应力、瓦斯压力和强度、煤层产状的变化情况。通过对文献资料的整理,得到二十个矿综掘时期工作面瓦斯浓度数据,在瓦斯浓度数据为非线性分布时,将瓦斯浓度数据视为随机变量,经过对数据的预处理,采用MATLAB软件来判别瓦斯浓度数据的分布情况,将瓦斯浓度数据随机变量的分布服从正态分布的矿井作为研究对象,利用正态分布检验方法对瓦斯异常点的位置进行辨识。研究结果表明,对瓦斯浓度数据随机变量的分布服从正态分布的综掘工作面,可以用正态检验方法来确定瓦斯涌出异常点的位置,经检验此方法是切实可行的。及时发现数据异常开始点,就可确定工作面前方应力及瓦斯压力和强度发生着显着变化,以此发出瓦斯灾害预警信息,这对瓦斯灾害的预防有着重大意义。

王欣[9](2016)在《修正Benford分布律及其在数据准确性评估中的应用》文中研究表明统计数据是统计决策的重要依据,其准确性直接影响着统计决策的正确性。统计数据已经被看作一种特殊的生产要素,准确的统计数据已经广泛应用于社会主义经济建设、民主和法制建设中。在此背景下,国内外学者研究了众多方法评估统计数据的准确性。其中Benford分布律是评估数据准确性的常用方法,被广泛用于会计、审计领域,宏观经济领域等多个领域的统计数据准确性评估。国内学者对Benford分布律统计性质方面的研究较少。适用于Benford分布律评估的数据需要满足一定的假设条件,这使得Benford分布律的应用存在一定的局限性。针对上述问题,在对国内外学者采用Benford分布律评估统计数据准确性的研究进行了梳理后,随机模拟比较了 Benford分布律与几种常见分布。并且,总结了 Benford分布律的局限性。针对Benford分布律不能用于有界数据集准确性评估的局限性,提出了修正Benford分布律。给出了修正Benford分布律的算法,以及用于数据准确性评估的方法,通过统计模拟分析,比较了修正Benford分布律与Benford分布律之间的差异,结果显示修正Benford分布律有较优良的统计性质,与传统的Benford分布律相比具有更好的适用性。并利用修正Benford分布律对367个县级城市的主要数据准确性进行了评估。

刘天[10](2014)在《异常点诊断技术在我国证券行业中的应用研究》文中研究指明通过数据建立模型来对经济现象进行分析时,我们对数据本身是做了很多严格的假设条件的,只有这些条件真正满足时,由此得到的模型及其以后基于此所做的推断才是可靠的。对于数据本身,我们经常假定数据是均匀同质的,即,假定数据集中每一个点对建模的影响是基本相同的,每个点对建模都有影响,但都很微小,单独一个或若干个点不应该对模型的总体变化趋势产生决定性的影响。而在实际中,这个条件往往不能得到满足。一个数据集中,经常会有一个或几个的点,它们基于现有建模手段的漏洞来产生影响,它们就是数据集中的异常点。那么,这些异常点对于市场机会的把握及建模到底有哪些影响?如何在数据集中对这些异常点进行识别和检测?异常点产生的原因以及处理又是怎样的?异常点诊断分析在实践中又有哪些应用?这就是本论文的要研究的主要内容。本论文共分六章。第一章是引言部分,首先给出选题意义,指出数据建模分析中异常点的影响应成为重要的考虑因素,其次给出文献综述,指出这方面的研究进展。最后给出的是研究方法概述,包括有关异常点的基本概念、研究思路和主要诊断统计量。第二章详细说明了异常点对于市场机会的把握的影响及几种识别与检测异常点的方法。第三章分析了异常点产生的原因及如何处理异常点的问题。第四章说明异常点诊断分析在我国股市异动中的应用。第五章说明异常点诊断方法在我国证券机构治理中的应用。第六章为结论与展望。论文的主要工作如下:1、论文对异常点的相关理论做出了全面详细的说明,介绍了建模分析常用的几个诊断统计量。异常点在实际数据集是广泛存在的,而现有建模手段并不完善。GARCH模型并没有捕捉到金融时间序列的所有特征,在其估计的标准化残差中大多还保留着过量的偏度和峰度,这种过量的偏度和峰度相当程度是由金融时间序列中异常点的出现而引起的。异常点能导致模型的误设定、预测失效、参数估计的偏差以及不可靠的统计推断,因此,异常点的识别与修正应该成为金融数据建模的一个重要考虑因素,对于异常点因素的忽视可能丧失市场机会或导致次优的市场选择。2、论文中对异常点的识别和检测技术进行了详细分析,并指出检测方法要适应不同的数据结构特点,常用的检测方法主要有:LOF异常点检测方法,金融时间序列异常点的累积和(CUSUM)检测方法,金融时间序列中基于小波技术的异常点检测方法。3、论文对于异常点的产生原因进行了深入分析,指出异常点产生的原因可分为三类:系统误差、随机误差、粗差。系统误差的出现一般是有规律的,其产生的原因往往是可知的或能掌握的。抵偿性是随机误差的最本质的统计特性,即,凡具有抵偿性的误差,原则上都可以按随机误差处理。系统误差与随机误差之间不存在不可逾越的鸿沟。随着对误差来源及其变化规律的认识加深,往往有可能把以往认识不到而归为随机误差的某项误差予以澄清而明确为系统误差,并加以技术上的适当处理。反之,当认识不足时,也常把系统误差当作随机误差,并在数据上进行统计分析处理。4、论文对于异常点的处理方法做出探讨,指出,异常数据的剔除,是不能依靠主观臆断来进行,而应当有较客观的较可靠的判断标准作为依据。采用的判断标准主要有3?准则,肖维勒准则,格拉布斯准则等。5、论文中给出了异常点诊断研究在实际中的应用,进行了如下实证分析,各个数据集中的异常点都得到较好定位,减少了搜索和试错成本。1)以中国证监会公布的三起违规案例为样本,以股价为响应变量,以市盈率和涨跌幅绝对值为自变量建立回归模型。利用数据建模诊断方法,对股价是否存在异动进行检测,确定重点怀疑数据,然后,删除这些可疑数据,再将删除前后表征模型优劣的若干个指标的变化情况进行比对。实证研究表明,三起查处案例中交易异常行为都较好地得到定位,与实际结果相符较好,这对于规范证券市场健康发展及保护投资者合法权益有积极意义。2)以近三年的46个全球主要股市指数为样本,以年收益率为响应变量,以平均日收盘价、平均日收益率等为自变量建立回归模型。利用数据建模诊断方法,对数据点是否存在异常进行检测。结果表明,三年数据中存在异常的指数都较好地得到定位,未发现中国的三个指数处于异常状态,这对于理解中国股市的现状,使得股市更好地服务实体经济有积极意义。3)以深圳证券交易所创业板具有2011年、2010年、2009年三个完整年报的58家公司为样本,以每股收益为响应变量,以高管人均年薪、高管人均持股比例及公司总股本为自变量建立回归模型。利用数据建模诊断方法,对每股收益是否存在异常进行检测,并进行综合交叉印证,确定重点怀疑数据,然后,删除这些可疑数据,再将删除前后表征模型优劣的若干个指标的变化情况进行比对。实证研究表明,三年数据中存在异常的公司都较好地得到定位,与实际结果相符较好,这对于规范证券市场健康发展、促进创业板上市公司加强内部治理结构调整及保护投资者合法权益有积极意义。4)以2011年的160家期货公司为样本,以净利润为响应变量,以净资本、客户权益等为自变量建立回归模型。利用数据建模诊断方法,对数据点是否存在异常进行检测。结果表明,数据中存在异常的公司都较好地得到定位,这对于规范期货市场健康发展、促进期货公司加强内部治理结构调整有积极意义。5)以近三年的94家证券公司为样本,以净利润为响应变量,以代理买卖证券业务净收入等为自变量建立回归模型。利用数据建模诊断方法,对数据点是否存在异常进行检测。结果表明,三年数据中存在异常的公司都较好地得到定位,这对于规范证券市场健康发展、促进证券公司加强内部治理结构调整有积极意义。

二、研究与开发机构统计数据质量与异常点的对数正态分布检验与识别(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、研究与开发机构统计数据质量与异常点的对数正态分布检验与识别(论文提纲范文)

(1)重力坝变形监控的智能分析方法研究(论文提纲范文)

摘要
abstract
1 绪论
    1.1 研究的目的和意义
    1.2 国内外研究现状
        1.2.1 大坝安全监测数据异常检测研究进展
        1.2.2 大坝安全监控模型研究进展
        1.2.3 大坝变形监控指标拟定研究进展
    1.3 问题的提出
    1.4 研究内容和技术路线
    1.5 创新点
2 变形监测数据的规律与特征分析
    2.1 引言
    2.2 重力坝变形影响因子及其规律分析
        2.2.1 水压因子
        2.2.2 温度因子
        2.2.3 时效因子
        2.2.4 重力坝的一般变形规律
    2.3 变形监测数据的相关性分析
        2.3.1 面板数据的相关性分析
        2.3.2 面板数据的形状相似性分析
        2.3.3 时序数据的自相关与偏自相关分析
    2.4 变形监测数据的特征分析
        2.4.1 整体特征
        2.4.2 局部特征
        2.4.3 空间特征
    2.5 本章小结
3 基于多重局部异常系数法的异常值预处理
    3.1 引言
    3.2 异常值的基本概念
        3.2.1 异常值定义
        3.2.2 异常值的分类
        3.2.3 异常值的特征
    3.3 基于距离的异常值检测算法
        3.3.1 距离的度量方法
        3.3.2 局部离群因子算法
        3.3.3 K近邻算法
    3.4 多重局部异常系数算法研究
        3.4.1 多重局部异常系数算法
        3.4.2 窗口长度的选择
        3.4.3 阈值的选择
        3.4.4 多重局部异常系数
        3.4.5 实例计算
    3.5 本章小结
4 ISADE-OSELM重力坝变形预测模型研究
    4.1 引言
    4.2 在线极限学习机
        4.2.1 单隐层前馈神经网络
        4.2.2 极小范数最小二乘解
        4.2.3 极限学习机
        4.2.4 在线极限学习机
    4.3 在线极限学习机的优化研究
        4.3.1 自适应差分进化算法
        4.3.2 自适应差分进化算法的改进
        4.3.3 ISADE-OSELM预测模型
    4.4 ISADE-OSELM预测模型应用研究
        4.4.1 工程概况
        4.4.2 模型拓扑结构
        4.4.3 参数选择
        4.4.4 ISADE-OSELM模型预测结果
    4.5 本章小结
5 基于云置信区间法的重力坝变形监控指标研究
    5.1 引言
    5.2 置信区间法的变形监控指标拟定
        5.2.1 置信区间法
        5.2.2 误差序列的分布检验
        5.2.3 置信区间法拟定的监控指标
    5.3 云置信区间
        5.3.1 云模型
        5.3.2 云置信区间的组成
        5.3.3 云置信区间的计算步骤
        5.3.4 云区间的选择
    5.4 云置信区间法的变形监控指标拟定
        5.4.1 数据转换
        5.4.2 云区间的计算
        5.4.3 云置信区间法拟定的监控指标
    5.5 本章小结
6 结论与展望
    6.1 结论
    6.2 展望
致谢
参考文献
攻读博士学位期间主要研究成果

(2)基于多元统计分析的接触网状态评价方法研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 接触网状态评价的研究现状
        1.2.1 接触网检测技术研究现状
        1.2.2 接触网状态评价方法研究现状
    1.3 多元统计分析研究现状
        1.3.1 多元统计分析控制图
        1.3.2 异常原因诊断
    1.4 论文的主要工作及路线
第二章 基于可靠度的接触网多状态划分
    2.1 接触网系统及其状态参数
    2.2 接触网系统的可靠度模型
        2.2.1 可靠度评价指标
        2.2.2 可靠度函数的求解
        2.2.3 接触网系统的可靠度模型
        2.2.4 可靠度参数的拟合优度检验
    2.3 基于可靠度的接触网状态划分方法
        2.3.1 接触网的状态划分
        2.3.2 基于可靠度的接触网状态划分实例
    2.4 本章小结
第三章 基于多元均值控制图的接触网状态评价方法
    3.1 多元统计分析的基本原理
    3.2 基于多元χ~2控制图的接触网状态评价
    3.3 基于多元T~2控制图的接触网状态评价
    3.4 本章小结
第四章 基于多元离差控制图的接触网状态评价方法
    4.1 多元离差控制图原理
    4.2 基于|Σ|控制图的接触网状态评价
    4.3 本章小结
第五章 基于多元小偏移控制图的接触网状态评价方法
    5.1 多元小偏移控制图的原理
    5.2 基于MEWMA控制图的接触网状态评价
    5.3 基于MCUSUM控制图的接触网状态评价
    5.4 本章小结
第六章 基于主成分分析控制图的接触网状态评价方法
    6.1 主成分分析控制图
        6.1.1 主成分分析方法原理
        6.1.2 主成分SPE控制图
        6.1.3 主成分T~2控制图
        6.1.4 主成分贡献控制图
    6.2 基于主成分控制图的接触网状态评价
    6.3 本章小结
第七章 接触网状态多元统计分析方法的实现及其性能分析
    7.1 设计思路
    7.2 基于MATLAB GUI的统计控制图实现
    7.3 不同统计控制图的性能比较
        7.3.1 控制图性能比较的实现原理
        7.3.2 控制图性能的比较结果
    7.4 本章总结
第八章 总结与展望
    8.1 本文总结
    8.2 展望
参考文献
个人简历 在读期间发表的学术论文
致谢

(3)青海东昆仑成矿带东段地球化学数据处理方法及找矿靶区圈定(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 选题背景及意义
        1.1.1 选题背景
        1.1.2 选题意义
    1.2 研究区范围及交通地理概况
    1.3 勘查地球化学的研究现状
    1.4 化探信息提取
        1.4.1 背景和异常的概念
        1.4.2 背景和异常确定方法的分类
        1.4.3 异常下限的确定
    1.5 化探数据处理的两个进展
        1.5.1 稳健分析
        1.5.2 成分数据
    1.6 东昆仑成矿带东段地球化学研究进展及存在问题
        1.6.1 地球化学研究进展
        1.6.2 存在问题
    1.7 科学问题、研究思路、研究内容及完成工作量
        1.7.1 科学问题
        1.7.2 研究思路
        1.7.3 研究内容
        1.7.4 完成的主要工作量
    1.8 两点说明
第二章 区域成矿地质背景
    2.1 区域地质
        2.1.1 区域大地构造背景
        2.1.2 区域地层
        2.1.3 研究区主要构造及构造单元划分
        2.1.4 岩浆岩
    2.2 区域地球物理特征
        2.2.1 区域重力场特征
        2.2.2 区域磁场特征
    2.3 区域矿产特征及成矿区带划分
        2.3.1 区域矿产特征
        2.3.2 成矿区带划分及各带成矿规律
    2.4 小结
第三章 区域地球化学特征
    3.1 区域地球化学总体特征
        3.1.1 元素分布特征
        3.1.2 元素富集离散特征
        3.1.3 元素的共生组合特征
    3.2 元素的时空分布规律
        3.2.1 元素的时间分布规律
        3.2.2 元素的空间分布规律
    3.3 元素在各地质子区中的具体特征
        3.3.1 昆北子区元素特征
        3.3.2 昆中子区元素特征
        3.3.3 昆南子区元素特征
        3.3.4 北巴子区元素特征
    3.4 小结
第四章 数据处理及异常识别
    4.1 数据处理和异常识别的原则及影响因素
        4.1.1 影响区域地球化学背景的因素
    4.2 单元素数据处理及异常圈定
        4.2.1 ILR变换后数据因子分区标准化方法
        4.2.2 Aitchison距离圈定地球化学异常的方法
    4.3 多元异常圈定
        4.3.1 主成分分析法
        4.3.2 马氏距离法
    4.4 元素含量的空间变化率
        4.4.1 具体做法
        4.4.2 主要成矿元素的空间变化率
    4.5 小结
第五章 基于地球化学数据的靶区圈定
    5.1 思路
    5.2. 具体做法
        5.2.1 选择地球化学参数
        5.2.2 确定各地球化学参数的权重系数
        5.2.3 各地球化学参数赋值及单元格划分
    5.3 3种类型的找矿信息量及靶区圈定
        5.3.1 与基性岩成矿有关的找矿靶区
        5.3.2 与中酸性岩成矿有关的找矿靶区
        5.3.3 与热液型金矿有关的找矿靶区
    5.4 典型成矿远景区评述
        5.4.1 小干沟-西藏大沟成矿远景区(Y_1)
        5.4.2 五龙沟一带成矿远景区(Y_3)
        5.4.3 诺木洪郭勒一波洛斯太一带成矿远景区(Y_5)
        5.4.4 大厂一扎陵湖一带成矿远景区(Y_7)
        5.4.5 东山根一沟里一带成矿远景区(Y_8)
        5.4.6 孟可特一冬给措纳湖一带成矿远景区(Y_(10))
        5.4.7 Y_1、Y_5、Y_7、Y_8四个远景区内金矿的找矿潜力分析
    5.5 远景区找矿发现
    5.6 小结
第六章 结束语
    6.1 主要结论及创新点
        6.1.1 主要结论
        6.1.2 创新点
    6.2 存在问题
致谢
参考文献
附录

(4)海洋经济统计数据质量控制方法探讨与实践(论文提纲范文)

引言
1 海洋经济统计数据质量内涵
    1.1 完整性
    1.2 准确性
    1.3 可比性
    1.4 有效性
2 海洋经济数据质量控制方法与实证
    2.1 基础性质控法
        (1)完整性检验
        (2)重复性检验
    2.2 逻辑性质控法
        (1)增减逻辑法
        (2)相关逻辑法
    2.3 值域范围检验法
        (1)指标极值法
        (2)指标增长率极值法
        (3)百分位数法
        (4)正态分布法
    2.4 关联系数检验法
    2.5 数理统计检验法
        2.5.1 统计分布检验法
        (1)基于常规统计分布的异常值检验法
        (1) 拉依达(3σ)检验法
        (2) 格拉布斯(Grubbs)检验法
        (3) 跳跃度检验法
        (4) 欧文(Irwin)检验法
        (2)基于探索性数据分析的异常值检验法
        (1) 茎叶图法
        (2) 字母值法
        (3) 箱线图法
        2.5.2 计量模型分析检验
        (1)回归模型检验法
        (2)时间序列模型检验法
3 结论

(5)基于大数据的盾构机掘进参数研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 研究内容、章节安排及创新点
        1.3.1 研究内容
        1.3.2 章节安排
        1.3.3 创新点
第二章 盾构机掘进参数辅助分析系统设计
    2.1 需求分析
    2.2 可行性分析
    2.3 系统模块设计与功能分析
    2.4 数据库设计
        2.4.1 实体关系
        2.4.2 数据库表设计
    2.5 系统测试
        2.5.1 系统测试环境
        2.5.2 系统操作流程
        2.5.3 系统测试结果
    2.6 本章小结
第三章 盾构机掘进参数预处理和基本统计
    3.1 样本数据介绍
    3.2 盾构机掘进数据预处理
        3.2.1 数据合并
        3.2.2 数据缺失检查
        3.2.3 去除离群点
    3.3 盾构机掘进数据一般统计
        3.3.1 平均值统计
        3.3.2 变异系数统计
        3.3.3 不同地层的参数对比
    3.4 南京长江隧道左线掘进数据综合描述
    3.5 本章小结
第四章 盾构机掘进参数回归分析
    4.1 常用连续分布检验
        4.1.1 常用连续分布
        4.1.2 常用连续分布检验结果
    4.2 盾构机掘进数据相关系数分析
        4.2.1 常用相关系数简介
        4.2.2 相关系数分析
    4.3 回归分析原理
    4.4 一元回归分析
        4.4.1 刀盘扭矩与总推力
        4.4.2 刀盘扭矩与泥水压力
        4.4.3 刀盘转速与掘进速度
        4.4.4 刀盘转速与泥水压力
        4.4.5 贯入度与掘进速度
        4.4.6 总推力与泥水压力
        4.4.7 一元线性回归分析结果
    4.5 多元线性回归分析
        4.5.1 逐步回归原理
        4.5.2 逐步回归分析
        4.5.3 多元线性回归预测效果对比
    4.6 本章小结
第五章 盾构机掘进参数机器学习建模
    5.1 机器学习算法
    5.2 K近邻算法
        5.2.1 K近邻算法基本概念
        5.2.2 K近邻算法分析过程
        5.2.3 K近邻算法分析结果
        5.2.4 K近邻算法预测效果对比
    5.3 CART回归树
        5.3.1 CART回归树基本概念
        5.3.2 CART回归树分析过程
        5.3.3 CART回归树分析结果
        5.3.4 CART回归树预测效果对比
    5.4 随机森林
        5.4.1 随机森林基本概念
        5.4.2 随机森林分析过程
        5.4.3 随机森林分析结果
        5.4.4 随机森林预测效果对比
    5.5 BP神经网络
        5.5.1 BP神经网络基本概念
        5.5.2 BP神经网络分析过程
        5.5.3 BP神经网络分析结果
        5.5.4 BP神经网络预测效果对比
    5.6 机器学习算法预测结果对比
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
个人简历、在学期间的研究成果及发表的学术论文

(6)考虑噪声特性的鲁棒回归学习算法及应用研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景和意义
    1.2 研究现状
        1.2.1 鲁棒回归建模
        1.2.2 风速概率分布拟合
        1.2.3 风速/风功率预测
        1.2.4 风功率曲线拟合
    1.3 研究内容和创新点
    1.4 论文章节结构
第二章 相关知识
    2.1 变分贝叶斯推断
    2.2 基于MMD的核函数构造方法
    2.3 多核学习模型
        2.3.1 基于多核学习的单输出回归模型
        2.3.2 基于多核学习的多输出回归模型
    2.4 函数回归模型
    2.5 截棍构造理论
    2.6 矩阵正态分布
    2.7 误差度量指标
        2.7.1 点预测误差度量指标
        2.7.2 概率预测误差度量指标
第三章 基于分层的多混合分布的不确定性建模
    3.1 引言
    3.2 数据中不确定性分析及表示
    3.3 分层的多混合分布模型
        3.3.1 分层的多混合分布框架
        3.3.2 基于嵌套EM算法的分层的多混合分布模型优化
    3.4 应用:风速不确定性描述
        3.4.1 数据描述
        3.4.2 实验设置
        3.4.3 风速概率分布拟合结果及分析
    3.5 本章小结
第四章 基于混合高斯噪声分布假设的鲁棒回归建模
    4.1 引言
    4.2 基于混合高斯分布的自适应鲁棒多核学习模型(ARMKR)
        4.2.1 模型ARMKR中参数先验分布
        4.2.2 基于变分贝叶斯推断的模型参数后验分布
        4.2.3 模型中参数优化过程及模型预测
        4.2.4 应用一:基于ARMKR的风功率点预测和区间预测
    4.3 基于异方差和无限混合高斯分布的鲁棒样条回归
        4.3.1 基于异方差特性的样条回归 (HSRM)
        4.3.2 基于无限混合高斯分布的鲁棒样条回归 (RSRM)
        4.3.3 应用二:基于HSRM和RSRM的风功率曲线拟合
    4.4 本章小结
第五章 考虑噪声差异性和关联性的鲁棒回归建模
    5.1 引言
    5.2 基于多混合高斯分布和稀疏贝叶斯的鲁棒函数回归(SR-FR)
        5.2.1 模型SR-FR中参数先验分布
        5.2.2 基于变分贝叶斯推断的模型参数后验分布
        5.2.3 应用一:基于SR-FR的多风机联合以及多步风速预测
    5.3 关联性已知的异方差多核学习模型(CH-MKL)
        5.3.1 模型CH-MKL中参数先验分布
        5.3.2 基于变分贝叶斯推断的模型参数后验分布
        5.3.3 应用二:基于CH-MKL的短期多步风速预测
    5.4 本章小结
第六章 基于混合非对称噪声分布假设的广义鲁棒回归建模
    6.1 引言
    6.2 基于混合非对称高斯分布的非对称样条回归(MoAG-ASR)
        6.2.1 模型MoAG-ASR的优化目标
        6.2.2 基于EM算法优化的MoAG-ASR模型
    6.3 基于混合非对指数幂分布的非对称样条回归(MoAEP-ASR)
        6.3.1 模型MoAEP-ASR的优化目标
        6.3.2 基于EM算法优化的MoAEP-ASR模型
    6.4 应用-基于SRM-MoAG和SRM-MoAEP的风功率曲线建模
        6.4.1 数据描述
        6.4.2 实验设置
        6.4.3 模拟风机数据中风功率曲线拟合
        6.4.4 真实风机数据中风功率曲线拟合
    6.5 本章小结
第七章 总结与展望
    7.1 总结
    7.2 展望
参考文献
发表论文和参加科研情况说明
致谢

(7)数据质量的统计诊断实证研究 ——以慢性肾病住院费用数据为例(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 研究意义
        1.2.1 理论意义
        1.2.2 现实意义
    1.3 研究现状
        1.3.1 国外研究现状
        1.3.2 国内研究现状
        1.3.3 文献评述
    1.4 研究主要内容
    1.5 创新之处
第二章 基本概念及相关理论
    2.1 统计数据质量的基本概念
        2.1.1 统计数据
        2.1.2 统计数据的质量
    2.2 统计数据质量的管理
        2.2.1 国际上统计数据管理体系
        2.2.2 统计数据质量评估框架的国际标准
    2.3 异常点和影响点
        2.3.1 异常点
        2.3.2 影响点
        2.3.3 数据删除模型
        2.3.4 均值漂移模型
第三章 慢性肾病医疗费用的模型建立
    3.1 模型准备
        3.1.1 数据来源
        3.1.2 预备知识
    3.2 数据预处理
        3.2.1 数据转换处理
        3.2.2 正态性检验
    3.3 模型的构建
        3.3.1 寻找最优子集
        3.3.2 模型分析及检验
    3.4 本章小结
第四章 统计诊断
    4.1 统计诊断概述
    4.2 基于数据删除模型的统计诊断
        4.2.1 残差统计量
        4.2.2 距离统计量
        4.2.3 影响统计量
        4.2.4 异常点检验理论
    4.3 局部影响分析
        4.3.1 线性回归中的局部影响分析
        4.3.2 方差扰动模型
        4.3.3 自变量扰动模型
    4.4 本章小结
第五章 慢性肾病住院费用数据质量的实例分析
    5.1 慢性肾病住院费用的统计数据质量
    5.2 总体影响分析
        5.2.1 数据删除模型的实证分析
        5.2.2 诊断结果分析
        5.2.3 逐步影响回归分析
    5.3 局部影响分析
        5.3.1 影响点的检测方法
        5.3.2 方差扰动下的局部影响分析
        5.3.3 自变量扰动下的局部影响分析
    5.4 数据变化
    5.5 本章小结
第六章 结论与展望
    6.1 结论
    6.2 对策建议
    6.3 局限性及展望
致谢
参考文献
附录A
附录B
攻读硕士期间发表论文

(8)综掘工作面瓦斯涌出特征及异常辨识的研究(论文提纲范文)

致谢
摘要
Abstract
1 绪论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 瓦斯灾害预警技术的研究现状
        1.2.2 瓦斯灾害预测方法的研究现状
    1.3 研究内容及技术路线
        1.3.1 研究内容
        1.3.2 技术路线
2 综掘工作面瓦斯涌出规律及特征分析
    2.1 综掘工作面瓦斯涌出影响因素分析
    2.2 综掘工作面瓦斯涌出规律分析
        2.2.1 煤壁瓦斯涌出规律
        2.2.2 掘进落煤瓦斯涌出规律
    2.3 综掘工作面瓦斯涌出特征及分布规律分析
        2.3.1 综掘工作面瓦斯涌出特征
        2.3.2 综掘工作面瓦斯涌出分布规律
    2.4 综掘工作面瓦斯浓度数据特征分析
    2.5 综掘工作面瓦斯浓度数据预处理方法分析
        2.5.1 瓦斯监测数据中数据异常的处理方法
        2.5.2 瓦斯监测数据中数据缺失的处理方法
        2.5.3 瓦斯监测数据小波消噪处理方法
    2.6 本章小结
3 二十个矿井综掘面瓦斯浓度数据分布情况统计分析
    3.1 瓦斯浓度数据的线性分布
    3.2 瓦斯浓度数据的非线性分布
        3.2.1 瓦斯浓度数据的正态分布
        3.2.2 瓦斯浓度数据的复杂非线性分布
    3.3 本章小结
4 二十个矿井中数据分布为正态分布的矿井瓦斯涌出异常的辨识
    4.1 淮南某矿瓦斯涌出异常的辨识
    4.2 寺河矿瓦斯涌出异常的辨识
    4.3 本章小结
5 综掘工作面瓦斯涌出异常辨识实例分析
    5.1 矿井概况
    5.2 地质构造
    5.3 煤与瓦斯突出特征
    5.4 瓦斯浓度异常点的辨识
        5.4.1 正态分布检验方法对瓦斯浓度异常点的辨识
        5.4.2 瓦斯涌出异常指标对瓦斯浓度异常点的辨识
    5.5 本章小结
6 结论和展望
    6.1 结论
    6.2 展望
参考文献
作者简历
学位论文数据集

(9)修正Benford分布律及其在数据准确性评估中的应用(论文提纲范文)

内容摘要
ABSTRACT
第1章 导论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 Benford分布律对审计、金融领域的数据准确性评估
        1.2.2 Benford分布律对宏观经济数据准确性评估
        1.2.3 Benford分布律性质探讨及改进方面的研究
    1.3 研究方法及基本框架
    1.4 创新之处
第2章 Benford分布律与常见分布的比较
    2.1 Benford分布律概述
    2.2 Benford分布律与正态分布的比较
    2.3 Benford分布律与指数分布的比较
    2.4 Benford分布律与对数正态分布的比较
第3章 修正Benford分布律及其统计模拟研究
    3.1 Benford分布律的局限性及其修正
        3.1.1 Benford分布律的局限性
        3.1.2 修正Benford分布律
    3.2 修正Benford分布律和Benford分布律的总体频率的模拟比较
    3.3 修正Benford分布律和Benford分布律的各首位数字频率的模拟比较
    3.4 修正Benford分布律和Benford分布律检验效果的模拟比较
第4章 基于修正Benford分布律的数据准确性评估
    4.1 经济类指标的数据准确性评估
    4.2 人口类指标的数据准确性评估
第5章 结论
参考文献
后记

(10)异常点诊断技术在我国证券行业中的应用研究(论文提纲范文)

摘要
abstract
1 引言
    1.1 选题背景及意义
    1.2 文献综述
        1.2.1 异常点的检测和识别技术方面的研究进展
        1.2.2 异常点的影响方面的研究进展
        1.2.3 异常点的应用方面研究进展
    1.3 论文结构
    1.4 研究方法概述
        1.4.1 异常点分析与统计诊断的关系
        1.4.2 异常点与强影响点的关系
        1.4.3 几个主要诊断统计量
    1.5 创新与不足
        1.5.1 论文的主要创新
        1.5.2 论文的不足之处
2 异常点的影响及检测
    2.1 异常点可能导致次优的市场选择
    2.2 LOF异常点检测方法
    2.3 IPO循环中金融时间序列异常点的检测方法
    2.4 金融时间序列中基于小波技术的异常点检测
3 异常点的产生原因及处理
    3.1 系统误差
    3.2 随机误差
    3.3 系统误差与随机误差的关系
    3.4 误差的非正态分布
    3.5 常用的异常点剔除准则
4 异常点诊断技术在股市异动中的应用
    4.1 上市公司股价异动诊断分析
        4.1.1 研究现状
        4.1.2 数据收集与回归分析过程
        4.1.3 回归结果分析过程
        4.1.4 对比分析及结论
    4.2 我国股市现状诊断研究
        4.2.1 研究现状
        4.2.2 数据收集与回归分析过程
        4.2.3 回归结果分析过程
        4.2.4 对比分析及结论
5 异常点诊断技术在证券机构治理中的应用
    5.1 创业板上市公司高管薪酬诊断分析
        5.1.1 研究现状
        5.1.2 数据收集与回归分析过程
        5.1.3 回归结果分析过程
        5.1.4 对比分析及结论
    5.2 我国期货公司经营状况诊断研究
        5.2.1 研究现状
        5.2.2 数据收集与回归分析过程
        5.2.3 回归结果分析过程
        5.2.4 对比分析及结论
    5.3 我国证券公司经营状况诊断分析
        5.3.1 研究现状
        5.3.2 数据收集与回归分析过程
        5.3.3 回归结果分析过程
        5.3.4 对比分析及结论
6 结论与建议
    6.1 论文的主要工作
    6.2 建议
参考文献
发表的论文及科研情况
后记

四、研究与开发机构统计数据质量与异常点的对数正态分布检验与识别(论文参考文献)

  • [1]重力坝变形监控的智能分析方法研究[D]. 李斌. 西安理工大学, 2021(01)
  • [2]基于多元统计分析的接触网状态评价方法研究[D]. 王佳鑫. 华东交通大学, 2021(01)
  • [3]青海东昆仑成矿带东段地球化学数据处理方法及找矿靶区圈定[D]. 耿国帅. 中国地质大学(北京), 2020(01)
  • [4]海洋经济统计数据质量控制方法探讨与实践[J]. 郑莉,彭星. 海洋经济, 2019(03)
  • [5]基于大数据的盾构机掘进参数研究[D]. 张勇. 石家庄铁道大学, 2019(03)
  • [6]考虑噪声特性的鲁棒回归学习算法及应用研究[D]. 汪运. 天津大学, 2019(06)
  • [7]数据质量的统计诊断实证研究 ——以慢性肾病住院费用数据为例[D]. 董梦雨. 昆明理工大学, 2019(04)
  • [8]综掘工作面瓦斯涌出特征及异常辨识的研究[D]. 袁涛. 辽宁工程技术大学, 2016(03)
  • [9]修正Benford分布律及其在数据准确性评估中的应用[D]. 王欣. 天津财经大学, 2016(10)
  • [10]异常点诊断技术在我国证券行业中的应用研究[D]. 刘天. 东北财经大学, 2014(02)

标签:;  ;  ;  ;  ;  

研发机构统计数据质量和异常值的对数正态分布检验与识别
下载Doc文档

猜你喜欢