一、Cache技术在万维网上的应用(论文文献综述)
王思源[1](2020)在《GPU加速的分布式图查询系统的设计与实现》文中研究指明资源描述框架(RDF)是W3C组织制定的一个标准数据模型,用来表示万维网上的关联数据。RDF将相互关联的数据描述成一系列的三元组,这些三元组构成一个高度连通的图(RDF图)。用户可以通过SPARQL查询语言检索RDF数据。在线图查询是访问关联数据的重要方式,其目标是在图数据中找到符合查询约束条件的顶点集合。图查询任务可以分为两种类型:小查询和大查询。小查询在执行时只需要遍历一小部分顶点和边,而大查询通常需要遍历大量的顶点,进而会导致较长的执行时间。现有的系统在面对大小查询混合的工作负载时,总体性能会急剧下降。原因在于两类查询的延迟差异巨大,大查询在执行时会占用大量的计算资源,从而阻塞了小查询的执行。幸运的是,硬件领域的不断进步使得先进的硬件开始逐渐普及。在数据中心里,服务器已经开始配备图形处理器(GPU)和支持远程直接内存访问(RDMA)技术的网卡。GPU能提供比CPU更多的计算资源和更高的内存带宽,RDMA能够降低跨机器远程通信的开销。先进的硬件特性给设计高性能的图查询系统带来了新的机会。本文提出引入GPU来加速RDF大查询的处理,而CPU专门负责处理小查询。基于此设计思想,本文设计并实现了首个能高效利用CPU和GPU混合并行性的分布式RDF图查询系统——Wukong+G。本文的主要贡献如下:1、通过分析现有图查询系统的特点和存在的问题,结合硬件技术的发展趋势,提出了构建异构的图查询系统来处理异构的查询任务的设计思想,即采用CPU处理小查询,GPU处理大查询。2、针对GPU上的查询执行,设计并实现了GPU友好的RDF内存式键值存储和RDF缓存,同时提出了一系列优化CPU-GPU数据传输的技术,包括查询感知的数据预取,匹配模式感知的流水线和细粒度的加载策略。3、通过对目前最先进的分布式RDF图查询系统(Wukong)增加GPU扩展实现了一个可用的原型系统。测试结果表明,在具有RDMA网络的5个节点构成的CPU/GPU集群(10个GPU卡)上,Wukong+G在单个大查询的延迟的性能上相比Wukong有2.3倍至9.0倍的提升,并且在混合的工作负载下将延迟和吞吐量提高了不止一个数量级。
黄灵[2](2019)在《Web数据挖掘中PageRank和Kmeans算法的改进研究》文中指出自20世纪90年代以来,互联网和万维网得到了迅猛发展,其功能和业务也在不断扩展和增加,这使得它们成为21世纪用户获取资源、数据和信息的主要场所,这也使得Web数据挖掘的任务迫在眉睫。当前,kmeans算法是最经典和使用最广泛的划分聚类算法,而PageRank算法是Web结构挖掘中使用最广泛的算法。基于此,研究了这两种算法的原理,并提出了两种算法的改进方法。传统kmeans算法选择初始聚类中心的方法是随机数法,这种方法易产生聚类结果陷入局部最优解和聚类精度低的问题,而且聚类结果受孤立点的影响很大。为了解决这一问题,提出了一种基于密度标准差的kmeans改进算法。首先计算数据集样本的平均值和标准差,接着计算每个数据点的密度分布函数值,然后计算样本的平均密度和密度标准差,若某一数据点的密度分布函数值小于样本的密度标准差,则划分为孤立点;搜索密度分布函数值数组中的最大值,那么最大值对应的样本点即为初始聚类中心,并将以初始聚类中心为原点,以样本平均值为半径的圆内各点的密度函数值赋值为0,如此重复,直到找到k个初始聚类中心。传统PageRank算法不考虑用户的喜好,存在主题漂移的现象,为了改进PageRank算法的两个缺点,提出了基于用户喜好和主题链接的改进PageRank算法。该算法首先计算网站的出度和入度的权威值,其次计算用户访问某一网站的概率,紧接着计算此网站的权威值,然后计算此网站内的网页的主题链接向量,接着计算主题链接向量的相似度,最后计算网页的PR值,以PR值的大小排序此网站内的网页,如此循环,直至网页全部排序完毕。两种传统算法和改进算法均由Python语言在PyCharm平台编码实现。通过实验对比传统算法和改进算法,实验结果表明,改进kmeans算法消除了孤立点的影响,具有更高的准确率和更好的聚类结果。改进PageRank算法能够根据用户喜好来排序网页,大大提升了用户的体验度,减少了用户自己筛选有用网页的时间。用户不同,得到的排序结果也是不同的。由于此改进算法是基于主题链接的相似度计算PR值的,故此算法在一定程度上可以改进主题漂移的现象。从而证明了两种改进算法的可行性。
郭家豪[3](2019)在《基于SPARQL的关联书目数据质量评价实证研究》文中研究指明信息高速发展是当下信息化时代的一大特征,人们越来越意识到信息的巨大价值所在,同时也意识到了对信息的整理和开放的重要性。加之媒体越来越发达,各种原创的信息得到了传播,在此基础上,人们如何在繁杂冗余的庞大信息中获取自己所需要的准确信息成为亟待解决的问题。图书馆作为信息的收藏者和传播者,其社会责任也日益增大。书目数据发明的本意就是为了让用户更好的寻找自己所需要的信息,关联书目数据则是图书馆在这一环境中的重大突破性进步。关联书目数据是将传统的MARC元数据作为关联数据发布在万维网上,让其变成机器可读的一种方式,不仅可以将图书馆的馆藏开放的提供给广大的用户,同时还可以提高其利用率,让更多的信息被读者发现和利用。作为图书馆给用户提供文献的依据,关联书目数据的质量很大程度上影响读者的使用体验。因此,发布优质的关联书目数据是保障图书馆文献更高效的被用户利用的基础和前提。本文总结了国内外学者对于关联数据和关联书目数据概念的界定,除此之外,还总结了广大学者对于关联数据质量评价的相关研究成果,其中以德国莱比锡大学信息研究所的Zaveri团队对于关联数据质量评价体系的研究为主。在此基础上结合关联书目数据的特点,提出关联书目数据控制体系。依照提出的具体评价指标,采用SPARQL Editor自动化统计和人工统计相结合的方式对目前已有的关联书目数据进行初步的评价分析。为保证我国今后发布优质的关联书目数据提供借鉴和参考。通过大英图书馆、法国国家图书馆的以及日本国立图书馆的评价对比,分析其各自的优劣所在,并以此为依据,为图书馆关联书目数据的发布提供质量控制的参考。希望通过本文的研究,可以让已发布关联书目数据的机构有所参考,优化其质量,对目前还未发布关联书目数据的机构有一个借鉴和启示的作用,为其发布优质的关联书目数据提供帮助。
金山(Kim San)[4](2019)在《知识图谱的扩展与检错关键技术研究》文中认为知识图谱作为当今最有影响力的数据共享源与知识解释工具,其重要程度不言而喻。如今在大数据环境下,随着事物的快速演变,知识图谱的扩展与检错工作成为了研究热点之一。知识图谱扩展与检错的核心任务可细分为两个方面,即对外部知识的理解与对自身内部知识的推理。因此,本文将分别介绍对外部数据源进行解析时遇到的困难与对自身内部知识进行推理时面临的挑战,并通过提出行之有效的解决方案来克服研究内容中的难点。论文主要的研究内容与贡献如下:1.基于集体推理的万维网表格语义理解与实体扩展:传统的集合相似度匹配方法无法对无重叠元素的两个集合进行匹配。由于知识图谱的不完整性与万维网内容的多样性,万维网表格与知识图谱中存在很多语义相似却无法匹配的列与类别。另外,较少的重叠元素还会导致低质量的列类匹配结果。因此,本文提出了一个全局集体推理框架来推理未知列的语义类别,同时还能够大幅度提高列类匹配的Top-k质量,尤其是Top-1的质量。另外,本文设计了一套有效的列语义匹配模型,其中包括了对列的特征抽取以及训练数据的自动生成方法。此外,考虑到数据集的规模,还提出了三种推理策略来提升整体的推理效率。最后,本文采用众包对列类匹配结果抽取出的实体进行验证后扩展到知识图谱中。2.基于众包技术的万维网表格模式解析与知识扩展:为了更好地理解万维网表格的语义,本章提出了一个人机结合的方式来解析万维网表格的语义模式。由于众包的高昂费用与延迟代价,本章采用快速排序连接算法设计了 一个全自动机器方法,并通过提前终止无意义的模式计算来快速生成优质的Top-k个模式候选,以减少众包问题的总数量。同时,为了提高众包的利用率,论文还设计了众包问题的分派优化算法,并通过设计问题的形式来保障众包答案的质量。最后,基于人机结合所选取的最优模式抽取出全新的知识,并实现对知识图谱的扩展。3.基于关系敏感嵌入式技术的知识图谱扩展与检错:针对知识图谱中存在的不一致性与不完整性问题,提出了一种基于关系敏感的嵌入式模型对知识图谱进行推理,以实现知识补全与错误检测的目的。论文设计了两种关联关系的评价函数,并采用动态聚类算法将高度关联的关系聚合到一起。因此,在知识图谱嵌入过程中,可以通过引入关联关系间的影响来修正知识图谱中的不一致性所带来的偏差。同时,本文的方法还可以与传统模型进行结合来达到更好的推理预测效果。
朱继召[5](2018)在《基于表示学习的知识图谱技术研究》文中研究说明近年来,以深度学习为代表的人工智能技术在语义搜索、自动驾驶、智能问答、机器翻译等领域的应用取得了巨大进步,极大地促进了机器智能化水平的提升。事实上,机器智能实现的背后依赖的正是知识图谱技术。知识图谱作为大数据时代下知识组织的重要方式之一,以结构化的形式描述客观世界中的概念、实体及其之间的复杂关系,为互联网上海量、异构、动态的大数据的组织、管理、理解和利用,提供了一种有效的方式。自2012年Google提出知识图谱以来,国内外互联网搜索引擎公司,如美国的微软必应、中国的百度和搜狗等,也纷纷宣布了各自的“知识图谱”产品。知识图谱迅速发展成为人工智能领域的研究热点,引起了学术界和工业界的高度关注。与此同时,随着深度学习、类脑科学等研究领域的不断发展,知识图谱将成为未来智能机器的大脑。本文针对知识图谱中的知识表示、知识抽取和知识融合三大核心技术进行了深入研究。具体研究内容如下。首先,针对客观世界的知识在计算机中如何表示和处理的问题,基于翻译操作提出一种利用关系相关性的知识表示模型。本文指出了现有的代表性知识表示模型在学习关系的向量表示过程中存在的问题,即关系被独立地映射到向量空间而忽略了它们之间内在的关联。考虑到不同关系可能会链接到同一实体,如知识三元组(Steve Jobs,PlaceOfBrith,California)和(Apple Inc.,Location,California)共用California作为尾实体,因此关系PlaceOfBrith和Location之间应存在着某些相关因素。对现有知识表示模型学得的关系表示矩阵分析,验证了关系间相关性的存在,并在关系表示矩阵上以低秩特征形式呈现。基于关系间相关性提出了一种新的知识表示模型,采用矩阵分解方法把关系表示矩阵分解为两个低维矩阵,从而显式地刻画其上的低秩特征。通过这种方式把关系表示矩阵的学习转化为对两个低维矩阵的学习,在知识表示的学习过程中能够有效地捕捉关系间的相关性特征。在公开的数据集上通过标准的知识表示评测任务,验证了所提模型的有效性。其次,提出了一种词级的注意力机制卷积神经网络模型用于实体间语义关系的抽取。本文认为句子中词信息量的大小不同,并且词信息量的大小与语义关系有关,即同一个词对于不同的语义关系来说,其信息量的大小可能不同。基于以上考虑,提出一种词级的注意力机制卷积神经网络模型,根据当前考虑的语义关系动态调整词的权重值,构造出更加精准的句子表达,有效地提升了语义关系抽取的结果。然后,针对传统的运行在单节点上的条件随机场(conditional random fields,CRFs)算法在面向大规模文本数据实体抽取任务时遇到的问题。采用“分而治之”的思想,基于分布式计算框架Spark设计了集群环境下的CRFs并行化方案,实现一种运行在集群模式下的分布式CRFs——SparkCRF。在公开数据集上通过大量实验,验证了本文设计和实现的SparkCRF能够适用于大规模文本数据的实体抽取。最后,提出了一种基于表示学习的知识图谱实体对齐算法。实现多源知识的融合,从顶层构建一个大规模、统一的知识图谱,能够有效地增强机器对底层数据的理解能力。针对知识融合过程中的实体对齐算法进行研究,首先在低维向量空间下,采用表示学习技术得到相应的知识表示,它蕴含了知识图谱的内在结构信息及实体属性特征。然后,将人工标注的实体对作为先验知识,学习知识图谱间实体对的映射关系。经实验验证了本文方法能够有效提高知识图谱实体对齐的精确率。通过上述研究,本文在知识表示、知识抽取和知识融合方面分别提出了新的技术方法和思路。希望本文工作可以为知识图谱技术的发展和应用起到进一步推动作用。
刘为[6](2018)在《基于语义网的傣族历史档案信息资源开发研究》文中进行了进一步梳理随着人类认知世界和改造世界的能力不断增强,计算机技术与网络技术也飞速发展。万维网(World Wide Web)作为互联网(Internet)的一种应用成为了人们在网络环境中最常用的平台与工具。在Web1.0环境中,人们只能单向被动地阅读和获取信息;在Web2.0环境中,所有人既可以作为信息的接收者也可以作为信息的创造者和提供者在这一全球化信息空间中进行信息交流。为适应人们不断升级的信息需求,语义网(Semantic Web)作为Web3.0的主要组成部分被提出。信息资源在语义网中被层层递进相互继承的置标语言在不同粒度、维度、层次上进行描述与揭示,从而使得这些信息资源能够被机器处理和理解。语义网打破了机器与机器之间、人类与机器之间的壁垒,使得人类获取信息和知识的方式内容以及人类社会的运作模式呈现出全方位的关联性与智能化。在语义网环境下,利用相关语义方法与技术对信息资源进行开发和管理,能充分挖掘信息资源的价值并在最大程度和范围内发挥其作用。傣族历史档案信息资源作为我国档案信息资源体系中的重要组成部分和人类知识资源中不可替代的部分,也应顺应这一趋势被开发管理。本文首先结合现有研究基础和傣族历史档案实际管理工作情况,对傣族历史档案信息资源进行了重新界定,并结合语义网的特性为档案信息资源开发赋予了新的内涵。接着,本文针对基于语义网的傣族历史档案信息资源开发工作在微观、中观、宏观三个层面上的实施进行了论述。微观层面,本文根据傣族历史档案信息资源的特性对其进行了科学分类,设计了傣族历史档案信息资源元数据方案以期能够充分揭示其各方面的特征,在此基础上提出构建傣族历史档案信息资源本体,并以傣族医药知识领域本体构建为例说明了该工作实施的方法和优越性,实现了傣族历史档案信息资源的语义组织。中观层面,本文提出基于关联数据技术将傣族历史档案信息资源创建为关联数据集,并构建了基于关联数据的傣族历史档案信息资源整合模型,实现了傣族历史档案信息资源在档案馆之间、与其他信息机构之间、以及语义网信息空间中其他信息源之间的资源整合与知识融合。宏观层面,为实现和保障前两个层面的工作,本文提出在语义网环境下传统档案信息资源开发工作模式应实现转型,并融合政策法规、标准规范、合作交流、人才培养等方面构建了相关保障机制,从现实层面提供了基于语义网的傣族历史档案信息资源开发实施策略。
张萌[7](2016)在《课程知识图谱组织与搜索技术研究》文中认为随着语义网相关理论和技术的发展,知识图谱、语义搜索等内容的研究逐步深入,这些研究为互联网逐步从超链接的文档万维网(Web of Document)转变为实体相关联的数据万维网(Web of Data)奠定了坚实的基础。知识图谱(Knowledge Graph)本质是一种语义网络,其构建目标在于描述真实世界中存在的各种实体和概念,以及这些实体、概念之间的关系。通过知识图谱,搜索系统可以更好的理解用户的查询,从而为用户提供与查询更相关的内容。用户利用知识图谱,可以探索更广泛、更深入的信息,获取知识的效率将大为提高。知识图谱的构建主要涉及两个层面的工作,一是在模式层面进行组织,语义网中所有的概念及其关系都具备一定的结构,这些结构的语义通常使用本体来描述。模式的构建是通过对知识的提炼和标识构建本体,遵循给定的模型不仅有助于知识的标准化,更有利于知识查询等后续处理。二是在数据层面对本体进行实体丰富与扩充,从无结构或半结构的Web文档中抽取结构化信息,并将其关联至实体,建立实体间的关系。基于知识图谱的语义搜索是一种智能化的搜索,由于在现有的搜索结果上额外提供了实体相关结构化信息,因此可以满足更为精确的信息搜索需求,搜索结果的形式也不再局限于匹配查询关键词的链接,取而代之的是基于实体以及关系的搜索答案。当前万维网上存在着海量的服务于教育教学的课程数据,由于传统电子学习平台和教育资源库的局限,这些数据未能在数据层面实现课程数据之间的关联。传统的数据组织方式不仅阻碍了各种数据在语义层面的共享,而且使得异构数据之间的互操作难以实现。鉴于此,本文结合万维网国际组织推荐的语义网技术和本文作者所在课题组研发的国家863计划电子学习系统研发成果,研究了课程知识图谱组织方法和语义搜索技术,其特点是在数据层面采用关联数据技术对于课程资源中的实体及关系进行提取和关联;在模式层面,对实体相关的概念进行加工和处理,使之演进为知识本体,进而为提供智能化的搜索服务奠定基础。本文在论述了语义网、知识图谱、语义搜索理论和关键技术基础上,研究了课程知识图谱组织和语义搜索技术,研究工作主要体现在以下几个方面。(1)针对数据层面关联技术特点和资源组织规范,详细分析了关联数据组织的流程、策略、方法和技术。依据课程数据的特点,提出了一种新的关联课程数据组织方法,该方法主要由数据转换、数据关联、存储与索引、数据应用等步骤组成,通过该方法,传统的教学资源可以构建成符合国际组织规范的关联课程数据,这有利于知识的整合与重用。(2)综合研究知识图谱构建方法和过程,详细阐述了模式层本体组织和数据层实体对齐的方法。在分析本体构建方法和实例填充的基础上,结合课程数据的特点,给出了课程知识图谱构建的方法。该方法通过利用知识点到学习对象映射以及知识点间的关系,构建课程数据相关本体模型,经过对模型的解析和实例填充,形成网状知识点关联的领域知识图谱。(3)在语义搜索方面,研究了本体搜索、子图搜索以及实体搜索的特点和方法。在知识图谱的背景下,探索使用本体表示用户概貌,通过计算实体间的语义相似度,并结合个性化的语境信息为用户提供更为精确的推荐结果。同时设计了新的语义扩展算法,缓解了搜索过程中的数据稀疏问题,提高了个性化搜索的精确度。(4)进行了课程知识图谱组织与搜索的实验,主要是选取具有高质量语义关系的表格资源作为实验对象。具体的过程是先将表格的列映射为合适的本体类,然后将单元值关联至实体或字符常量,接着确定列头部间的关系,生成合适的RDF三元组,然后利用关联开放数据资源(LOD)作为背景知识,通过消息传递算法在图模型中完成语义知识的推断,并生成课程知识图谱。实验中的转换方法避免了大量的联合概率分布表计算,提升了对表格语义含义的理解,通过选择合适的URI对表格的模式和实例进行表示,完成了生成课程知识图谱的复杂任务。搜索实验结果表明表格资源的转换方法有利于信息的整合,同时提高了用户体验的满意度。综上所述,本文对课程知识图谱的组织和搜索进行了深入的研究,研究涉及知识图谱数据层实体的处理、模式层本体的学习以及实体语义搜索等具体的内容。本文依据课程数据的特点提出了新的转换和组织方法,基于关联课程数据集的实验表明本文的研究是有效的,课程知识图谱和语义搜索的研究具有理论意义和应用价值。
韩军[8](2014)在《基于万维网资源的双语词典构造和查询处理技术研究》文中提出自万维网诞生以来,以万维网资源为基础的应用技术研究有力地推动了万维网技术的发展。所谓以万维网资源为基础的应用技术研究,是指以万维网上的数据、用户等各种可用资源为支撑,解决万维网发展过程中出现的科学和技术问题,例如数据提取与知识库的构建,Web搜索与查询,社交网络等。本文以这一研究领域为背景,围绕Web的网页、知识库、用户等三方面不同资源的利用,选择了双语词典的自动构建,Web查询处理这两个研究方向,取得了以下三方面的研究成果。1.基于万维网网页的双语词典构造。中文万维网上存在数十亿的双语网页,如何利用这些资源构建双语词典是一项很有意义的研究。本文采用一种完全以万维网网页数据为中心的思想,提出了一种新的构造双语词典的方法SDDB。该方法不借助事先建立的语言资源,而是从抽取的双语网页中构造所需的资源库,在算法上采用词频统计的方法筛选双语词汇,从而克服了机器学习算法在处理海量网页资源的性能瓶颈问题,并且可以更多地覆盖到传统词典没有收集的流行词汇。2.基于万维网知识库的语义增强的空间关键词搜索。传统的空间关键词搜索方法仅考虑关键词与POI点(Point of interest)在文本上的匹配程度,忽略了查询的语义信息。针对传统方法的局限,论文提出了基于万维网知识库的语义增强的空间关键词搜索方法S3。该方法应用万维网上的知识库对POI数据进行语义扩充,之后S3采用基于图的语义距离度量方法,结合语义距离和空间距离进行评价,并对结果中POI点综合排序。此外,为了满足在大规模数据上即时地返回搜索结果的要求,论文提出一种语义-空间混合索引结构GRTree,有效地保证了查询的实时性能。3.基于万维网用户众包的查询结构解释。现有的查询结构解释方法要求被分析的所有查询属于确定的目标应用领域,即这些方法是领域相关的,这在很多情况下是不现实的。为了解决领域无关的查询结构解释问题,论文提出一种基于万维网用户众包的人机结合的方法。该方法选择少量查询关键词,让众包用户给出解释,然后由计算机推导出其余的解释,推导的原理是论文提出的以查询关键词相似图为基础的交互式概率推导模型。该模型通过度量领域相关度和增益,保证在给定成本预算的前提下效果最大化。
侯金灿[9](2014)在《基于链接遍历关联数据的查询技术研究》文中认为近年来,越来越多的关联数据被发布到网上而逐渐形成了一个全球分布式的数据空间,但由于这个数据空间的分布式特性和开放性,对关联数据的查询面临着各种各样的挑战,如何有效的查询并利用这些关联数据已经成为目前的研究热点。与传统查询方法通过把远地数据拷贝进本地存储里并在本地执行查询不同,基于链接遍历的关联数据查询方法引进了一个新的查询执行模式,它不需要相关数据源的先验知识而是在执行时间发现相关数据源,它可以保证查询结果数据是最新的并且它的查询范围是整个数据空间。为了提高基于链接遍历关联数据查询方法的效率,本文提出了一个缓存策略,给出了相应的索引结构来缓存频繁查询模式及其相关数据源,当再次查询索引结构中的查询模式时,根据索引中对应的相关数据源可以直接检索得到数据并减少不相关数据源的检索量,进而提高查询的效率。在对查询选择相关数据源之后为了更好的利用数据万维网的语义信息来提高结果的查全率,本文又提出了基于链接遍历关联数据查询方法的推理机制。首先本文扩展了推理规则集,通过引入模式层语义规则使推理不仅能处理实例层含义同时也能处理模式层含义。接着提出了基于推理规则的推理算法,把推理应用到链接遍历的过程中。最后本文通过抓取万维网上的真实数据集进行测试研究并通过对实验结果进行分析,证明了本文提出的方法和算法的可行性。
钱海忠[10](2013)在《语义万维网服务若干关键技术的研究》文中指出随着面向服务计算模式深入应用,语义万维网服务作为万维网服务与语义万维网两大技术融合的一个领域成为研究热点。语义万维网服务是目前实现“云计算”按需服务的关键技术。传感器万维网、物联网以及“云计算”等诸多新兴领域的兴起,使得语义万维网服务若干关键技术的研究不仅具有重要的理论意义,也具有实际的应用价值。近年来国内外针对语义万维网服务中的万维网服务语义标注、万维网服务注册与发现以及万维网服务自动组合等若干关键问题取得了许多有价值的研究成果,但是这些问题还有待深入研究。论文针对这几个关键问题展开了深入的研究工作,并把一些研究成果初步应用到传感器万维网中。论文主要贡献可归纳为以下几个方面:(1)提出了一种基于语义词典的万维网服务语义标注方法。现有语义标注方法的前提条件是各方需要使用共同认知的领域本体库,但是在万维网这类互联网环境下,这个前提条件是难以做到的。本文提出了一种基于语义词典的服务语义标注方法,解决服务语义标注方法对共同认知领域本体库依赖的问题。仿真实验表明基于语义词典的服务语义标注方法,能够提高服务发现的准确率,同时该方法容易被用户使用,并且与现有的一些万维网服务语义标注方法(例如SAWSDL)相兼容。(2)提出了语义万维网服务检索树的构造算法,解决了注册万维网服务信息的有效组织问题,同时给出了基于语义万维网服务检索树的服务语义快速发现算法。语义万维网服务检索树可部署在一个服务注册中心,把那些在语义层面上具有相同输入参数集合的服务聚集在一个树干节点之上,而对应的每个服务作为该节点的叶子节点,以此缩小万维网服务发现算法的搜索空间。本文采用元素检索矩阵的方法,快速查找到语义万维网服务检索树的树干节点:首先在服务注册过程中给树干节点赋予一个唯一值并建立该值和节点之间的索引;然后利用树干节点中存储的所有参数集中的元素(万维网服务的输入参数或是它们的交集)建立一个元素检索矩阵,树干节点的值可以通过查询元素检索矩阵得到并快速找到相应节点;最后服务发现算法将在此节点依据请求服务的功能属性查找在语义上匹配的服务。虽然语义万维网服务检索树的构造要花费一定的时间,但是该过程可作为一种预处理的手段,减少了服务发现阶段的语义计算时间。实验表明基于语义万维网服务检索树的服务发现算法与同类服务发现算法中有较快的响应时间。(3)提出了一种基于状态演算理论的服务动态组合优化算法。本文把万维网服务动态组合过程看成是一个状态演算过程。用户请求的输入参数集合作为初始态,用户想要获得的结果集作为终止态,而每个万维网服务都看成一个能促使状态变迁的动作。注册中心的万维网服务不需要按照传统算法进行形式化转换,服务组合算法根据当前状态的信息(用户提交的和中间过程中产生的),采用服务快速发现算法去匹配和发现满足条件的原子服务,直到状态变迁到满足结果集为止。整个状态的变迁过程中可以记录各个原子服务之间的依赖关系和执行先后顺序,因此可以简化服务组合方案。与同类算法进行仿真实验比较,结果表明本文提出的算法具有较好的时间效率。(4)把基于语义万维网服务检索树的服务注册与发现算法应用到传感器万维网领域,解决了传感器万维网中服务的注册和基于语义的服务发现问题。SWE采用OGC目录服务来管理和发现传感器万维网服务,但是这种服务发现还是处于语法层面。本文结合观测与测量O&M (Observation and Measurement)标准,对O&M中每个评测项用具体参数集合进行细化。例如,用(一氧化碳、二氧化硫)来细化观测空气污染程度,以满足语义万维网服务检索树的构造性质,便于利用语义万维网服务检索树来管理和发现传感器万维网服务。本文从实际应用角度研究了当前语义万维网服务中若干需要解决的问题,并提出了相应的解决方案。这些研究成果在推动语义万维网服务在实际中的深入应用具有一定的理论意义和应用价值。
二、Cache技术在万维网上的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、Cache技术在万维网上的应用(论文提纲范文)
(1)GPU加速的分布式图查询系统的设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.2.1 RDF图查询系统 |
1.2.2 基于GPU的异构系统 |
1.3 论文研究内容 |
1.4 论文结构安排 |
第二章 相关技术背景 |
2.1 RDF和 SPARQL |
2.1.1 CPU上的查询处理 |
2.1.2 全历史剪枝 |
2.1.3 SPARQL查询的异构性 |
2.2 硬件发展趋势 |
2.2.1 硬件的异构性 |
2.2.2 高速的网络通信 |
2.2.3 异构系统的机会 |
2.3 本章小结 |
第三章 Wukong+G系统的总体架构 |
3.1 应用场景 |
3.2 设计目标 |
3.3 架构概览 |
3.3.1 查询引擎 |
3.3.2 图存储层 |
3.4 技术挑战 |
3.5 关键技术 |
3.6 本章小结 |
第四章 查询引擎的设计与实现 |
4.1 高效的CPU-GPU数据传输 |
4.1.1 查询感知的数据预取 |
4.1.2 匹配模式感知的流水线 |
4.1.3 细粒度的加载策略 |
4.2 GPU并行查询处理 |
4.3 分布式查询处理 |
4.3.1 Fork-Join执行模式 |
4.3.2 查询任务通信协议 |
4.3.3 关键技术实现 |
4.4 本章小结 |
第五章 存储层的设计与实现 |
5.1 GPU友好的内存图存储结构 |
5.1.1 基于谓词的数据分组 |
5.1.2 技术实现 |
5.2 GPU显存中的RDF缓存 |
5.2.1 缓存查询流程 |
5.2.2 缓存替换策略 |
5.3 本章小结 |
第六章 实验与评测 |
6.1 实验环境 |
6.2 单个查询处理的性能 |
6.3 性能提升因素分析 |
6.4 GPUDirect RDMA的性能获益 |
6.5 可扩展性 |
6.6 混合并发工作负载下的性能 |
6.7 显存中的RDF缓存 |
6.8 其他数据集 |
6.9 本章小结 |
第七章 总结与展望 |
7.1 全文总结 |
7.2 工作展望 |
参考文献 |
致谢 |
攻读硕士学位期间已发表或录用的论文 |
(2)Web数据挖掘中PageRank和Kmeans算法的改进研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 论文研究背景 |
1.1.1 互联网和万维网的产生 |
1.1.3 万维网的特点 |
1.1.4 研究意义 |
1.2 国内外研究现状 |
1.2.1 k_means算法的研究现状 |
1.2.2 PageRank算法的研究现状 |
1.3 论文研究内容 |
1.4 论文组织结构 |
2 Web数据挖掘的相关理论 |
2.1 Web数据挖掘的定义 |
2.1.1 什么是数据挖掘 |
2.1.2 什么是Web数据挖掘 |
2.2 Web数据挖掘的特点 |
2.3 Web数据挖掘的分类 |
2.3.1 Web结构挖掘 |
2.3.2 Web内容挖掘 |
2.3.3 Web使用挖掘 |
2.4 Web数据挖掘的应用 |
2.5 本章小结 |
3 Web数据挖掘算法分析 |
3.1 k_means算法的原理 |
3.1.1 基本定义 |
3.1.2 算法思想 |
3.1.3 算法步骤 |
3.2 PageRank算法的原理 |
3.2.1 基本概念 |
3.2.2 一般解法 |
3.2.3 线性代数解法 |
3.3 本章小结 |
4 k_means算法的改进研究 |
4.1 基本定义 |
4.2 改进k_means算法原理 |
4.2.1 改进算法的思想 |
4.2.2 改进算法的步骤 |
4.3 孤立点的处理 |
4.4 实验结果分析 |
4.4.1 模拟实验数据的结果分析 |
4.4.2 UCI实验数据的结果分析 |
4.4.3 现有改进算法的结果分析 |
4.5 本章小结 |
5 PageRank算法的改进研究 |
5.1 基本概念 |
5.2 改进PageRank算法原理 |
5.2.1 改进算法的相关定义 |
5.2.2 改进算法的思想 |
5.3 实验结果分析 |
5.4 本章小结 |
结论 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(3)基于SPARQL的关联书目数据质量评价实证研究(论文提纲范文)
中文摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 国外研究现状 |
1.3.2 质量评价体系相关研究 |
1.3.3 国内研究现状 |
1.4 研究内容和方法 |
1.4.1 研究内容 |
1.4.2 研究方法 |
第二章 关联数据与关联书目数据 |
2.1 关联数据与关联书目数据 |
2.1.1 关联数据的概念 |
2.1.2 关联书目数据的概念 |
2.2 关联书目数据的发布过程 |
第三章 关联书目数据的质量评价指标体系 |
3.1 数据质量的定义 |
3.2 关联数据的质量评价指标 |
3.3 关联书目数据的质量评价指标 |
第四章 关联书目数据质量评价要素 |
4.1 关联书目数据质量评价方法 |
4.1.1 关联书目数据统计方法 |
4.1.2 关联书目数据用户反馈 |
4.1.3 关联书目数据规则约束 |
4.2 数据集的选取 |
4.2.1 选取所要评价的数据集方式 |
4.2.2 大英图书馆关联书目数据BNB简介 |
4.2.3 法国国家图书馆关联书目数据BNF简介 |
4.2.4 日本国立图书馆关联书目数据简介 |
4.3 SPARQL查询 |
第五章 关联书目数据质量评价实证研究 |
5.1 可用维度评价 |
5.1.1 可用性 |
5.1.2 许可性 |
5.1.3 相关性 |
5.1.4 可用维度评价结果 |
5.2 内在维度评价 |
5.2.1 语法正确性 |
5.2.2 一致性 |
5.2.3 简洁性 |
5.2.4 完整性 |
5.2.5 内在维度评价结果 |
5.3 语境维度评价 |
5.3.1 可信性 |
5.3.2 及时性 |
5.3.3 语境维度评价结果 |
5.4 表达维度评价 |
5.4.1 描述的多样性 |
5.4.2 互操作性 |
5.4.3 表达维度评价结果 |
5.5 评价结果总结 |
5.6 对我国关联书目数据发布的启示 |
第六章 总结与展望 |
参考文献 |
致谢 |
个人简况及联系方式 |
(4)知识图谱的扩展与检错关键技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 选题背景与研究动机 |
1.1.1 基于集体推理的万维网表格语义理解与实体扩展 |
1.1.2 基于众包技术的万维网表格模式解析与知识扩展 |
1.1.3 基于关系敏感嵌入式技术的知识图谱扩展与检错 |
1.2 主要研究内容与贡献 |
1.3 章节安排 |
第2章 基于集体推理的万维网表格语义理解与实体扩展 |
2.1 引言 |
2.2 预备知识 |
2.2.1 数据模型 |
2.2.2 相关算法 |
2.2.3 问题定义 |
2.2.4 相关工作 |
2.3 全局集体推理框架的体系架构 |
2.3.1 全局集体推理方法的建模过程 |
2.3.2 全局集体推理框架概述 |
2.4 列语义图构建 |
2.4.1 基于支持向量机的列语义相似度计算模型 |
2.4.2 列向量的特征抽取 |
2.4.3 训练数据的自动生成方法 |
2.5 基于主题敏感网页排名的推理算法 |
2.5.1 语义推理计算过程 |
2.5.2 语义推理策略 |
2.6 实验 |
2.6.1 实验设置 |
2.6.2 知识图谱与万维网表格数据集的覆盖率 |
2.6.3 列类匹配质量评估 |
2.6.4 推理性能评估 |
2.6.5 实体扩展评估 |
2.7 结论 |
第3章 基于众包技术的万维网表格模式解析与知识扩展 |
3.1 引言 |
3.2 预备知识 |
3.2.1 数据模型 |
3.2.2 问题定义 |
3.2.3 相关工作 |
3.3 人机协作解析框架的体系架构 |
3.4 表格语义模式候选生成方法 |
3.4.1 类别与关系候选生成方法 |
3.4.2 语义模式评分模型 |
3.4.3 Top-k语义模式生成算法 |
3.5 基于众包的模式验证 |
3.5.1 众包问题的分派优化算法 |
3.5.2 众包问题的容错机制 |
3.5.3 基于表格语义模式的知识扩展 |
3.6 实验 |
3.6.1 实验设置 |
3.6.2 模式解析质量评估 |
3.6.3 众包验证质量评估 |
3.6.4 知识扩展质量评估 |
3.7 结论 |
第4章 基于关系敏感嵌入式技术的知识图谱扩展与检错 |
4.1 引言 |
4.2 相关工作 |
4.3 预备知识 |
4.3.1 问题描述 |
4.3.2 问题定义 |
4.4 关系敏感嵌入式模型的体系架构 |
4.5 关系关联函数与动态聚类算法 |
4.5.1 基于概率的关联度函数 |
4.5.2 基于向量的关联度函数 |
4.5.3 动态聚类算法 |
4.6 关系敏感嵌入式模型 |
4.6.1 RSEA模型定义 |
4.6.2 RSEA模型训练过程 |
4.7 实验 |
4.7.1 实验设置 |
4.7.2 错误事实检测质量评估 |
4.7.3 缺失事实预测质量评估 |
4.8 结论 |
第5章 总结与展望 |
5.1 论文主要研究工作总结 |
5.2 进一步研究工作与展望 |
参考文献 |
致谢 |
个人简历、在学期间发表的学术论文与研究成果 |
(5)基于表示学习的知识图谱技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 本文动因 |
1.3 本文工作 |
1.3.1 研究内容 |
1.3.2 研究成果 |
1.4 本文组织 |
第2章 相关工作 |
2.1 知识表示 |
2.1.1 知识表示的概念和原则 |
2.1.2 主要的知识表示方法 |
2.2 知识抽取 |
2.2.1 关系抽取 |
2.2.2 实体抽取 |
2.3 知识融合 |
2.4 本章小结 |
第3章 基于关系相关性的知识表示模型 |
3.1 知识表示模型分析 |
3.2 关系相关性分析 |
3.2.1 奇异值分解方式 |
3.2.2 皮尔逊相关系数方式 |
3.3 基于关系相关性的知识表示模型 |
3.3.1 关系相关性建模 |
3.3.2 知识表示模型 |
3.3.3 复杂性分析 |
3.4 实验结果与分析 |
3.4.1 数据集 |
3.4.2 链接预测 |
3.4.3 三元组分类 |
3.4.4 实验结果分析 |
3.5 本章小结 |
第4章 面向大规模文本数据的知识抽取 |
4.1 基于注意力机制的关系抽取算法研究 |
4.1.1 关系抽取算法分析 |
4.1.2 基于注意力机制的关系抽取算法 |
4.1.3 实验结果与分析 |
4.2 面向大规模文本数据实体抽取的并行CRFs算法设计 |
4.2.1 实体抽取技术分析 |
4.2.2 基于Spark的并行CRFs算法 |
4.2.3 实验结果与分析 |
4.3 本章小结 |
第5章 基于表示学习的知识图谱实体对齐算法研究 |
5.1 实体对齐算法分析 |
5.2 基于表示学习的知识图谱实体对齐算法 |
5.2.1 算法整体框架 |
5.2.2 知识表示的学习 |
5.2.3 实体间对齐关系的学习 |
5.2.4 实体对齐预测 |
5.2.5 复杂性分析 |
5.3 实验结果与分析 |
5.3.1 数据集 |
5.3.2 实验设置 |
5.3.3 结果与分析 |
5.4 本章小结 |
第6章 结论与展望 |
6.1 本文总结 |
6.2 未来展望 |
参考文献 |
攻读博士学位期间的主要成果 |
致谢 |
作者简介 |
(6)基于语义网的傣族历史档案信息资源开发研究(论文提纲范文)
中文摘要 |
abstract |
1 绪论 |
1.1 研究背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究现状与评析 |
1.2.1 语义网国内外研究现状 |
1.2.2 傣族历史档案信息资源开发研究现状 |
1.2.3 相关研究述评 |
1.3 研究内容与设计 |
1.3.1 研究内容 |
1.3.2 思路设计 |
1.4 创新点 |
2 相关概念与理论阐述 |
2.1 傣族历史档案信息资源开发相关概念和理论 |
2.1.1 傣族历史档案信息资源相关概念 |
2.1.2 傣族历史档案信息资源开发相关理论 |
2.2 语义网相关理论 |
2.2.1 语义网概述 |
2.2.2 语义网信息组织方法与本体理论 |
2.2.3 语义网最佳实践——关联数据 |
2.3 语义网和傣族历史档案信息资源开发的关系 |
2.3.1 语义网是傣族历史档案信息资源开发的外部环境 |
2.3.2 语义网为傣族历史档案信息资源开发提供技术方法 |
2.3.3 语义网的实现得益于傣族历史档案信息资源开发 |
3 基于语义网的傣族历史档案信息资源开发总体方案设计 |
3.1 傣族历史档案信息资源开发管理工作现状 |
3.1.1 收集与保管的现状 |
3.1.2 整理、翻译和编目的现状 |
3.1.3 传播和传承的现状 |
3.2 基于语义网的傣族历史档案信息资源开发的必要性 |
3.2.1 必需手段:充分实现傣族历史档案信息资源的价值 |
3.2.2 必要条件:发挥档案工作作用和适应学科发展规律 |
3.2.3 必需方法:顺应社会发展规律和满足社会利用需求 |
3.3 基于语义网的傣族历史档案信息资源开发的可行性 |
3.3.1 实体储备与数字资源基础 |
3.3.2 业务规范与技术标准支持 |
3.3.3 理论研究和实现方法参考 |
3.4 基于语义网的傣族历史档案信息资源开发工作内容与方法 |
3.4.1 基于语义网的傣族历史档案信息资源开发工作内容与基本任务 |
3.4.2 基于语义网的傣族历史档案信息资源开发实施步骤与技术方法 |
4 傣族历史档案信息资源的语义组织 |
4.1 傣族历史档案信息资源的分类 |
4.1.1 傣族历史档案信息资源的分类现状 |
4.1.2 傣族历史档案信息资源分类体系构建 |
4.2 傣族历史档案信息资源元数据方案设计 |
4.2.1 傣族历史档案信息资源元数据方案设计原则与步骤 |
4.2.2 傣族历史档案信息资源相关元数据方案分析 |
4.2.3 傣族历史档案信息资源元数据方案构建 |
4.3 傣族历史档案信息资源本体构建 |
4.3.1 傣族历史档案信息资源本体构建原则 |
4.3.2 傣族历史档案信息资源本体构建方法与工具 |
4.3.3 傣族历史档案信息资源本体构建的实现——以傣族医药本体构建为例 |
5 基于语义网的傣族历史档案信息资源整合 |
5.1 基于语义网的傣族历史档案信息资源整合的目标与任务 |
5.1.1 基于语义网的傣族历史档案信息资源整合目标 |
5.1.2 基于语义网的傣族历史档案信息资源整合任务 |
5.2 基于语义网的傣族历史档案信息资源整合模型设计 |
5.2.1 基于关联数据的傣族历史档案信息资源整合的优势分析 |
5.2.2 基于关联数据的傣族历史档案信息资源整合参考模型 |
5.2.3 基于语义网的傣族历史档案信息资源整合模型构建 |
5.3 基于语义网的傣族历史档案信息资源整合实现方法 |
5.3.1 傣族历史档案关联数据创建模块的实现方法 |
5.3.2 傣族历史档案关联数据发布模块的实现方法 |
5.3.3 傣族历史档案关联数据融合模块的实现方法 |
6 基于语义网的傣族历史档案信息资源开发实现策略 |
6.1 面向语义网环境的档案信息资源开发工作模式转型 |
6.1.1 传统档案信息资源开发工作模式的局限性 |
6.1.2 基于语义网的档案信息资源开发工作模式 |
6.2 基于语义网的傣族历史档案信息资源开发保障机制构建 |
6.2.1 意识观念与政策法规保障机制 |
6.2.2 组织管理体制与合作交流机制 |
6.2.3 标准规范建设与人才培养机制 |
总结与展望 |
参考文献 |
攻读博士学位期间完成的科研成果 |
致谢 |
(7)课程知识图谱组织与搜索技术研究(论文提纲范文)
本文的创新点 |
摘要 |
ABSTRACT |
第1章 引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状及发展趋势 |
1.2.1 知识图谱的研究现状及发展趋势 |
1.2.2 语义搜索的研究现状及发展趋势 |
1.3 论文的研究内容 |
1.4 论文的组织结构 |
第2章 相关理论技术综述 |
2.1 语义网 |
2.1.1 语义网概念 |
2.1.2 语义网体系结构 |
2.1.3 语义网核心技术 |
2.2 知识图谱 |
2.2.1 知识图谱概述 |
2.2.2 知识图谱技术 |
2.2.3 知识图谱应用 |
2.3 语义搜索 |
2.3.1 语义搜索概述 |
2.3.2 语义搜索架构 |
2.3.3 语义搜索流程 |
2.4 本章小结 |
第3章 关联课程数据 |
3.1 课程数据组织基础 |
3.1.1 数据描述规范 |
3.1.2 RDF数据模型 |
3.2 关联课程数据技术基础 |
3.2.1 概念定义 |
3.2.2 关联规范 |
3.2.3 关联特点 |
3.3 关联课程数据组织方法 |
3.3.1 规范化 |
3.3.2 模型化 |
3.3.3 数据转换 |
3.3.4 加工与外联 |
3.4 关联课程数据组织架构设计 |
3.5 本章小结 |
第4章 课程知识图谱组织 |
4.1 知识图谱组织概述 |
4.1.1 知识图谱的特点和优势 |
4.1.2 知识图谱的模式层 |
4.1.3 知识图谱的数据层 |
4.2 知识图谱模式层组织 |
4.2.1 术语抽取 |
4.2.2 概念抽取 |
4.2.3 分类关系抽取 |
4.2.4 非分类关系抽取 |
4.2.5 公理与规则处理 |
4.3 知识图谱数据层处理 |
4.3.1 实体学习 |
4.3.2 实体数据填充 |
4.3.3 实体对齐 |
4.4 课程知识图谱构建实例 |
4.4.1 课程知识本体 |
4.4.2 概念的提取 |
4.4.3 关系的构建 |
4.4.4 课程本体模型 |
4.4.5 数据层处理 |
4.4.6 课程知识图谱展示 |
4.5 本章小结 |
第5章 基于知识图谱的语义搜索 |
5.1 语义搜索概述 |
5.2 基于图谱的搜索 |
5.2.1 本体搜索 |
5.2.2 实体搜索 |
5.2.3 子图搜索 |
5.3 语义搜索策略及方法 |
5.3.1 搜索策略 |
5.3.2 语义索引 |
5.3.3 查询处理 |
5.3.4 相似度计算 |
5.3.5 个性化排序 |
5.4 基于知识图谱的语义扩展 |
5.4.1 语义扩展方法 |
5.4.2 个性化搜索推荐 |
5.5 实验与评估分析 |
5.6 本章小结 |
第6章 课程知识图谱与搜索实验 |
6.1 表格资源转换概述 |
6.2 表格转换处理方法 |
6.3 查询与排序 |
6.3.1 查询 |
6.3.2 排序 |
6.4 表格数据联合推断 |
6.4.1 概率图模型 |
6.4.2 图模型参数化 |
6.4.3 关联推断 |
6.5 实验与评估分析 |
6.5.1 本地课程资源 |
6.5.2 外部数据资源 |
6.6 本章小结 |
第7章 总结与展望 |
7.1 研究工作总结 |
7.2 本文的主要创新 |
7.3 对未来工作的展望 |
参考文献 |
致谢 |
(8)基于万维网资源的双语词典构造和查询处理技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 选题背景和研究动机 |
1.1.1 万维网网页资源与双语词典构造 |
1.1.2 万维网知识库与空间关键词查询 |
1.1.3 万维网用户众包与查询结构解释 |
1.2 主要研究内容及贡献 |
1.3 章节安排 |
第2章 基于万维网网页资源的双语词典构造 |
2.1 研究背景 |
2.2 SDDB流程 |
2.3 I-tree的剪枝 |
2.3.1 问题定义 |
2.3.2 问题解决方案 |
2.4 实验结果 |
2.4.1 与有道词典的比较 |
2.4.2 利用wikipedia进行评测 |
2.4.3 利用品牌名进行评测 |
2.4.4 可扩展性的评测 |
2.5 相关工作 |
2.6 总结 |
第3章 基于万维网知识库的语义增强的空间关键词搜索 |
3.1 研究背景 |
3.2 S~3方法 |
3.2.1 方法概览 |
3.2.2 语义增强空间关键词搜索的形式化定义 |
3.3 GRTree |
3.3.1 基本思想 |
3.3.2 GRTree结构 |
3.3.3 索引结构 |
3.4 搜索算法 |
3.5 实验结果与分析 |
3.5.1 实验设置 |
3.5.2 搜索质量评测 |
3.5.3 搜索性能评测 |
3.6 相关工作 |
3.6.1 语义度量 |
3.6.2 基于图的关键词搜索 |
3.6.3 空间关键词搜索 |
3.7 总结 |
第4章 基于万维网用户众包的查询结构解释 |
4.1 研究背景 |
4.2 问题定义 |
4.3 众包方法 |
4.3.1 概率迭代传播模型 |
4.3.2 众包查询概念的选择 |
4.4 实验 |
4.4.1 实验设置 |
4.4.2 迭代参数α的影响 |
4.4.3 众包查询概念选择算法评测 |
4.4.4 与现有方法的比较 |
4.5 相关工作 |
4.5.1 查询结构解释 |
4.5.2 众包 |
4.6 总结 |
第5章 总结和展望 |
5.1 论文主要研究工作总结 |
5.2 进一步研究工作及展望 |
参考文献 |
致谢 |
附录A 论文中的图表索引 |
个人简历、在学期间发表的学术论文与研究成果 |
(9)基于链接遍历关联数据的查询技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.2.1 传统查询方法 |
1.2.2 现有查询方法 |
1.3 本文的研究内容及意义 |
1.4 论文组织结构 |
第2章 相关理论知识 |
2.1 关联数据的基本概念和技术架构 |
2.1.1 关联数据的基本概念 |
2.1.2 关联数据的技术架构 |
2.2 基于链接遍历查询的基本知识 |
2.2.1 相关概念和定义 |
2.2.2 基于链接遍历查询方法(LTBQE)思想 |
2.2.3 三种查询处理策略 |
2.2.4 基于流的关联数据查询处理过程 |
2.3 RDFS、OWL和推理规则 |
2.4 本章小结 |
第3章 关联数据查询中的数据源选择策略 |
3.1 数据源缓存 |
3.2 数据源索引 |
3.2.1 相关数据源 |
3.2.2 数据源选择索引结构 |
3.3 频繁模式挖掘算法 |
3.4 数据源选择算法 |
3.5 本章小结 |
第4章 基于链接遍历关联数据的查询推理算法 |
4.1 推理规则及推理过程 |
4.1.1 T-split规则 |
4.1.2 权威T-split规则 |
4.1.3 RDFS规则扩展 |
4.1.4 OWL 2 RL/RDF规则扩展 |
4.2 可判定性和完整性 |
4.3 对LTBQE进行推理扩展 |
4.3.1 推理过程 |
4.3.2 推理算法 |
4.3.3 根据模式数据对LTBQE进行推理扩展 |
4.4 本章小结 |
第5章 系统设计与实验分析 |
5.1 系统设计 |
5.2 实验环境及数据集 |
5.3 结果分析 |
5.3.1 数据源选择查准率分析 |
5.3.2 基准查全率分析 |
5.3.3 应用推理后的查全率分析 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(10)语义万维网服务若干关键技术的研究(论文提纲范文)
摘要 |
Abstract |
目录 |
图表索引 |
缩略语 |
第一章 绪论 |
1.1 本文研究背景及意义 |
1.1.1 万维网服务应用需求 |
1.1.2 万维网服务技术存在的不足 |
1.1.3 本文的研究意义 |
1.2 本文研究目标 |
1.3 本文研究内容 |
1.4 本文结构安排 |
第二章 万维网服务关键技术研究综述 |
2.1 万维网服务技术 |
2.1.1 万维网服务协议栈 |
2.1.2 语义万维网服务 |
2.2 万维网服务若干技术研究现状 |
2.2.1 万维网服务的发现 |
2.2.2 万维网服务注册与发布 |
2.2.3 万维网服务组合 |
2.3 传感器万维网 |
2.3.1 传感器万维网的特征 |
2.3.2 传感器万维网服务注册与发现 |
2.3.3 传感器万维网应用框架 |
2.4 本章小结 |
第三章 服务语义标注及匹配算法 |
3.1 问题提出 |
3.2 基于语义词典的服务语义标注及匹配算法 |
3.2.1 语义词典 |
3.2.2 算法思想及基本概念 |
3.2.3 万维网服务输入/输出参数语义标注 |
3.2.4 服务匹配模型 |
3.2.5 实验与结果分析 |
3.3 本章小结 |
第四章 服务注册信息的高效组织与发现算法 |
4.1 问题提出 |
4.2 语义万维网服务检索树 |
4.3 基于语义万维网服务检索树的服务发现算法 |
4.3.1 语义万维网服务检索树的树干节点查找算法 |
4.3.2 万维网服务快速发现算法 |
4.4 语义万维网服务检索树构造(服务注册)算法 |
4.5 基本实验与结果 |
4.6 性能分析及例外处理 |
4.6.1 语义万维网服务检索构建时间开销 |
4.6.2 服务构造参数节点的处理 |
4.7 基于语义万维网服务检索树的应用方案设计 |
4.7.1 应用方案的数据结构 |
4.7.2 应用方案中服务发布算法 |
4.7.3 新注册中心节点加入 |
4.7.4 Hybrid_SWSQT服务查找 |
4.7.5 实验仿真 |
4.8 本章小结 |
第五章 基于状态演算的服务组合优化算法 |
5.1 问题提出 |
5.2 基于状态演算的服务自动组合优化算法 |
5.2.1 状态演算 |
5.2.2 状态演算不足之处 |
5.2.3 基于状态演算的服务组合优化算法 |
5.3 简单场景演示 |
5.4 基本实验与分析 |
5.5 本章小结 |
第六章 万维网服务在传感器万维网的应用 |
6.1 服务注册与发现 |
6.1.1 问题提出 |
6.1.2 扩展观测注册中心 |
6.1.3 试验与分析 |
6.1.4 小结 |
6.2 面向服务应用框架 |
6.2.1 问题提出 |
6.2.2 基于万维网服务的应用框架 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 本文主要贡献 |
7.2 今后研究方向 |
参考文献 |
四、Cache技术在万维网上的应用(论文参考文献)
- [1]GPU加速的分布式图查询系统的设计与实现[D]. 王思源. 上海交通大学, 2020(01)
- [2]Web数据挖掘中PageRank和Kmeans算法的改进研究[D]. 黄灵. 兰州交通大学, 2019(03)
- [3]基于SPARQL的关联书目数据质量评价实证研究[D]. 郭家豪. 山西大学, 2019(01)
- [4]知识图谱的扩展与检错关键技术研究[D]. 金山(Kim San). 清华大学, 2019(02)
- [5]基于表示学习的知识图谱技术研究[D]. 朱继召. 东北大学, 2018(01)
- [6]基于语义网的傣族历史档案信息资源开发研究[D]. 刘为. 云南大学, 2018(01)
- [7]课程知识图谱组织与搜索技术研究[D]. 张萌. 武汉大学, 2016(06)
- [8]基于万维网资源的双语词典构造和查询处理技术研究[D]. 韩军. 清华大学, 2014(05)
- [9]基于链接遍历关联数据的查询技术研究[D]. 侯金灿. 东北大学, 2014(08)
- [10]语义万维网服务若干关键技术的研究[D]. 钱海忠. 南京邮电大学, 2013(05)