以数据为中心的XML文档存储研究与实现

一、以数据为中心的XML文档存储研究及实现（论文文献综述）

郝玲玲^[1]（2020）在《基于DDS的空战模拟仿真系统的设计与实现》文中研究说明在现如今这个信息科技飞速发展的时代,战场环境日趋复杂,战术需求也随之增加,一体化的联合作战也成为了以信息为主导的战争。在联合作战仿真系统中,部署在不同作战空间的指控节点、显示节点及评估节点等各种仿真实体连接成一个网络体系,各仿真节点通过该网络体系来实现战场环境态势的高度共享、作战任务的灵活变化,其目的就是通过信息共享来加快节点间交互速度,评估作战任务和装备效能,从而提高作战效能。因此如何让不同仿真节点共享和灵活运用网络体系中的数据信息就成为联合作战中的关键问题。本文中的空战模拟仿真系统共涉及多个仿真节点,解决多个仿真节点间的数据共享和互通就需要比较不同的数据集成技术的优缺点,来屏蔽仿真节点间的差异,实现空战模拟仿真系统中各节点的互联互通互操作。因此本文采用OMG组织提出的,以数据为中心的数据分发服务（DDS）的数据集成技术,设计出满足本系统的基于DDS的集成框架,通过对DDS底层特定的业务逻辑进行封装,向分布式仿真节点提供了有意义的服务接口,方便了各分布式仿真节点的后期开发,使分布式底层通信完全透明于上层应用,加快了节点间的集成速度;但是在空战模拟仿真系统中存在各仿真节点间的数据转换和数据结构不一致问题,因此本文根据XML描述性强、可扩展性大等优点,设计了基于DDS和XML的数据集成模型框架,利用XML技术来作为节点间的数据转换格式,利用XML文档来描述仿真节点的所属域、数据结构、主题和节点信息,增强数据结构的可扩展性,将各仿真节点的数据结构进行统一化,解决了分布式节点间数据结构不一致等问题。最后本文对整个系统进行性能和大数据包传输测试,实验结果表明,高吞吐量模式适用于系统中数据包长度较大的情况,而高实时性模式则适用于系统中数据包长度较小,且对实时性要求较高的情况下;大数据包传输能力测试结果则表明该系统在传输大数据包的情况下可靠性更高。两个测试实验表明DDS能够满足空战模拟仿真系统的通信需求。

高芬莉^[2]（2019）在《基于S1000D标准的IETM系统的设计与实现》文中研究表明自交互式电子技术手册（Interactive Electronic Technical Manual,IETM）产生及发展以来,已经被很多国家广泛地应用与军事、航空及医疗等各个领域,它从根本上克服了传统纸质资料的各种弊端,有效地提高了装备维修及综合保障的效率。IETM作为“持续采办与寿命周期保障（Continuous Acquisition and Life-cycle Support,CALS）”的关键技术之一,对装备信息综合保障技术智能化与一体化的发展有着深刻的意义。我国对IETM的研究起步较晚,目前还处于发展阶段。鉴于此背景,在分析与借鉴了国内外大量的成熟的研究理论的基础上,设计了一款基于S1000D标准的IETM创作系统,该系统由IETM的创作编辑部分、内容管理部分以及显示发布部分组成。本论文的主要工作如下:（1）本论文分析了国内外IETM的研究现状,介绍了IETM相关的理论基础,对本课题中使用的S1000D标准进行了详细的阐述及研究,分析了S1000D标准被诸多国家广泛应用的独有优势,并且深入学习了S1000D标准的核心内容。（2）在S1000D标准的基础上,设计了该项目的总体系统体系结构,将IETM创作系统按照功能要求分为IETM的创作编辑、内容管理与IETM的显示与发布三大部分,并且分别对每部分内容进行详细地需求分析、概要设计、详细设计与实现,并进行了系统测试。（3）深入分析了数据模块类型及特点,对装备技术资料的各类数据进行分析总结,并采取关系型数据库与计算机文件系统结合的方式存储技术信息,设计公共源数据库实现数据存储及共享。（4）详细设计了IETM创作系统的主要功能,包括数据模型的设计、IETM的内容编辑功能的设计、内容管理功能的设计以及技术信息的显示及发布功能的设计等。最终,以某型号柴油发电机为案例,成功创作了该柴油机的IETM产品。

曾庆玲^[3]（2011）在《基于模式的复杂XML文档到关系数据库存储的研究》文中提出随着XML作为数据表示的重要载体变得越来越重要,特别是其在数据交换方面起着至关重要的作用,而大量XML数据的产生引起各种对XML数据存储问题的研究。基于关系数据库的成熟性,目前大多数研究都将XML文档存入关系数据库中。在众多的基于XML模式的XML文档到关系数据库的存储方法中,最为显着的方法是PSchema （Physical XML Schema）、BSchema （Basic XML Schema）以及CSchema （Complex XML Schema）。但是,这些方法仍然存在着很多的不足：PSchema对多值元素的定义非常模糊,未区分多值元素是多次出现的值还是多次出现的元素结构；BSchema则未对XML中语义进行约束,也没有保存模式信息,这种映射方式不利于XML文档的重构及还原；CSchema虽然对PSchema和BSchema进行了继承和扩展,但是,CSchema在对递归复杂元素、多命名空间信息、重复结构、面向未来可扩展元素与属性的映射方法过于复杂,而且没有考虑到XML文档中对语义约束等信息,也没考虑到新增XML文档对数据库中的数据表的影响。因此,本文对CSchema进行了改进,提出了一种CSchema++的映射方法,同时还对X-RESTORE查询中间件进行改进,提出了将XPath转换为SQL查询的算法,并通过代价估计来比较CSchema与CSchema++的效率。论文主要从以下三个大的方面展开工作：（1）基于CSchema重新对XML模式进行了语义分析,提出了一种改进的CSchema++。该模型将复杂XML文档中的复杂信息进行分类定义,如命名空间信息、重复结构、递归复杂元素、面向未来可扩展元素与属性,并重新归纳了这些复杂信息的提取方法和映射规则,去掉了利用层次（layer）的方法来存储递归复杂元素,将CSchema的提取映射简单化、完善化。与CSchema相比,CSchema++最大的改进在于利用改进的元素表来动态保存XML模式信息,即随着XML文档的动态增长,元素表以及XML文档对应的数据表都将会动态增长。由于元素表的操作非常频繁,CSchema++将元素表通过数组置于内存中,相比CSchema直接将元素表置于磁盘中,CSchema++大大提高了存储和查询效率。另外,本文对数据库中主键、外键、唯一性和非空等约束信息进行了分析,保存了XML的语义信息,实现了XML文档的无损映射,同时保证了映射过程的可逆性,不仅实现了XML文档到关系数据库的映射,同时实现了关系数据库到XML文档的还原。（2）将XML文档按照CSchema++的映射规则存入关系数据库之后,需要将XML查询转换为关系查询。而XML查询是半结构化查询,关系查询是结构化查询,这就需要用到查询中间件。其中,最为着名的是X-RESTORE查询中间件。X-RESTORE所响应和执行的查询是XQuery查询,由于XQuery的基础是XPath,所以熟悉XQuery的人都会使用XPath,为了方便用户,本文对X-RESTORE查询中间件进行改进,提出了将XPath转换为SQL查询的算法。算法分为两个步骤：首先,将用户输入的XPath查询语句转换为XPathExpression图,其中,XPathExpression图的作用等同于复杂XML文档存储的中间模式CSchema++。然后,将XPathExpression图转换为SQL语句,利用图中的边来实现文档节点顺序的保存,通过将节点和边的信息转换为SQL语句中Select、from以及where子句中的内容,实现了XML用户输入XPath查询。（3）由于,XML文档存储模式的代价主要由查询操作的代价来衡量,因此本文结合现有的代价估计方法,通过DOM树结构查找节点所需代价来估计关系查询所耗费的代价,将基于模式的复杂XML文档存储代价定义为DOM树结构查找节点所需代价,即查找节点和对节点数据筛选的代价和。为证实CSchema++的优越性,本文通过所提出的代价估计方法来比较CSchema与CSchema++的存储和查询代价,证实了CSchema++映射的存储和查询方式代价更小,存储和查询效率明显得到提高。

蔺旭东^[4]（2010）在《基于语义的XML查询及规范化研究》文中研究指明摘要：XML在诸多领域中得到了越来越广泛的应用,发展基于XML的成熟完善的数据管理系统,正成为研究者努力的目标。而确立与XML的数据特点相适应的查询方法和规范化机制,是基于XML的数据管理系统走向实用化的基础。为此,我们选取XML查询和XML规范化作为本文的两个主要研究方向。目前,XML查询的研究主要沿着两个方向展开：结构化查询和关键字查询。结构化查询强调查询用例与XML节点在路径上的匹配,导致查询者必须了解所查询XML数据的结构才能给出查询用例,且查询用例极易受到XML结构变化的影响。而关键字查询则只是寻求关键字与XML节点标签的匹配,使得查询结果中必然包含许多不相关的节点,查询的准确性无法保证。在XML规范化的研究方面,目前主要以XML节点的路径信息作为研究的基础。这一方面带来表达式冗长、表达意义不明确、易受到XML结构变化影响等表达性缺陷,另一方面也带来无关节点参与、约束缺失或约束冗余等语义性缺陷,使得我们无法依靠它们对XML中复杂的数据关系进行准确的描述和分析。针对上述的缺陷,本文在开展工作时最大的改进,就是在XML节点的路径信息和标签信息之外,强调对节点语义信息和用户所掌握的常识性信息的充分利用,从而在提高XML查询方法的实用性、效率和准确性,以及表达XML数据依赖关系和消除XML数据冗余方面,取得了显着的突破。具体来讲,我们主要开展了下列的工作：（1）在XML数据模型中引入实体片断的概念,并将XML节点与实体片断相关联,使XML数据模型具备了反映节点语义的能力,从而为开展基于语义的XML查询研究和XML规范化研究奠定了基础。我们对XML文档的数据存储特点进行了重新审视,在对XML节点进行分类的基础上,提出了实体片断的概念,将XML文档看作由一个个实体片断而不仅仅是独立的XML节点所组成的层次结构。进而将XML节点与实体片断关联起来,使它们具备了语义的特性。这正是我们开展基于语义的XML查询研究和XML规范化研究的基础所在。（2）提出了一种基于关键字分组分类表达式的XML查询方法,在用户指明查询关键字语义的情况下,实现查询过程的语义匹配,使XML查询方法在实用性和查询的准确性方面有了很大改进。首先,我们提出了一种新的类关键字XML查询语言——关键字分组分类表达式,使得用户在不了解XML结构、不掌握复杂语法的前提下,可以利用其掌握的常识性信息,赋予查询用例中各关键字以明确的语义；其次,在关键字分组分类表达式中引入多样化的操作符,进一步增强了其语义表达能力；再次,提出了一种新的XML编码方式——C-Dewey编码,对XML节点与实体片断间的关联关系进行了标识；最后,构造FQRI查询算法,实现了查询用例中的关键字与XML节点在语义上的匹配。实验结果表明,FRQI算法能够在保证效率的前提下返回与用户意图高度匹配的查询结果。（3）提出了两阶段XML关键字查询方法,在用户未指明查询关键字语义的条件下,实现查询过程的语义匹配,提高了语义匹配的XML查询方法的适用性。首先,利用XML树中相同标签节点的数量庞大但语义有限这一有利条件,XML节点语义被公式化为节点语义三元组；其次,利用节点语义三元组建立起一种新型XML索引结构——节点语义索引,使得按照语义对XML节点进行检索成为可能；最后,构造TPKQ算法,将XML查询首先在XML节点语义集合中展开,然后再扩展至整个的XML文档,从而实现查询用例中的关键字与XML节点在语义上的匹配。实验表明,TPKQ算法在查询效率和查询精度上较之传统关键字查询算法都有较大改进。（4）提出了一种基于XML节点语义特性的XML规范化方案,改善了XML数据依赖的表达方式,提高了XML范式消除数据冗余的有效性。第一步,提出了XML属性依赖的概念,来表示XML中的数据依赖关系,使XML节点在数据依赖表达式中第一次不以其路径信息,而是以能够反映其语义特性的实体属性的形式来进行标识。第二步,借助于对XML数据依赖表达方式的改进,我们进一步提出了新的XML主键定义和XML范式；第三步,采用“丢失-恢复”的方法,证明了XML范式在消除数据冗余上的有效性。

刘东玉,胡然^[5]（2010）在《一种基于XML的电子信息装备试验数据采集软件设计》文中提出针对电子信息装备试验数据的多样性和复杂性,提出了基于XML的数据采集方法,设计了雷达侦察距离试验的数据概念模型和图形概念模型,并生成了XML Schema,研究了如何存储试验数据XML文件,最后设计并实现了数据采集软件。

王唯贤^[6]（2010）在《XML数据库技术研究》文中指出对XML数据库技术进行了总体分析,介绍了XML的最新研究进展,并将其与传统的数据库技术进行了比较,指出了其目前需要改进的方面.

汪陈应^[7]（2010）在《XML数据编码与存储管理关键技术研究》文中指出在过去的十余年里,XML得到了迅速的发展和极其广泛的应用,XML数据凭借其灵活的半结构化特征成为当今各个领域广泛采用的新的数据形式。呈指数级增长的XML数据给数据库研究领域注入了新鲜的血液,半结构化数据管理已成为现代数据库技术的一个重要分支。XML数据管理应以XML数据模型为中心,从XML数据的本质特征出发,探求支持其独特树形结构的高效管理方案,即原生XML数据管理方案是解决问题的关键所在。本文正是对原生XML数据管理中相关的关键技术进行了研究,一方面是设计和实现了一种完全独立的原生XML数据库的物理存储方案,它完整地体现了XML数据逻辑模型,支持各种XML索引结构,并能高效的进行XML查询；另一方面,针对传统基于关系数据库管理XML数据所造成的语义丢失以及性能下降问题,本文设计和实现了一种无缝集成关系数据库系统的原生XML存储方案,该方案最大幅度地重用关系数据库的存储管理器,解决了XML数据逻辑模型与关系模型之间的差异,能够以最自然的方式存储和索引XML数据。在分析近几年来国内外相关研究成果的基础上,本文对原生XML编码、存储、索引、更新、文档相似性度量等问题进行了系统深入的研究。主要贡献与创新点如下：●提出了一种基于二进制分数的动态XML节点编码方案BSC。给出了BSC编码方案的基本定义及其扩展定义,设计了BSC的静态和动态编码算法,分析和对比了多种节点编码串行化方法的效率和局限性,最后实验验证了BSC编码方案的高效性。●参与设计了一种节点级原生XML存储方案XN-Store。该方案以节点记录为最小单位,直接在分页文件上构建持久化的XML数据逻辑模型,节点记录的文档序存储可以支持快速的XML文档发布和节点的随机访问,能够支持各种XML辅助索引和高效的查询处理。实验证明XN-Store是一种高性能的原生XML存储方案。●基于XN-Store存储方案,本文设计了一种高效的XML数据更新策略XN-Store+。在XN-Store的基础上,该方案添加前向链接记录以保持移动记录的虚拟地址不变,进而维护各种索引结构的正确性；添加重定位记录以保持实际节点记录的文档序存储,很好地解决了XML数据高效更新和索引维护困难之间的矛盾。●提出了一种基于关系的原生XML存储方案NXRel。基于模型映射的方式,NXRel解决了XML数据逻辑模型和关系模型之间的差异所引起的各种问题,在关系表的基础之上构建了XML数据逻辑模型,能够以自然的方式存储和索引XML文档,支持高效的XML数据更新。实验证明NXRel处理各类XML数据集都具有稳定的表现,各种索引结构能够对XML查询提供强有力的支持。●基于双向路径约束模型,本文提出了一种综合考虑各种因素的XML文档相似性的度量方法。提出了双向路径约束模型以精确刻画XML文档结构特征,设计了基于集合和基于N-Gram的路径约束相似性度量方法,综合各种权重代价,给出了基于双向路径约束模型的文档相似性度量方法。通过聚类实验证明,该方法能够提高聚类效果的准确率和召回率。

杨化林,邓芳,史俊友^[8]（2010）在《产品平台中基于XML的工艺资源表示技术》文中指出分析产品平台中基础支持数据,并定义其中的工艺资源之间的四种关系,根据工艺资源数据的不同粒度和要求,建立以数据为中心的工艺资源和以文档为中心的工艺资源的XML描述方式,并讨论以碎片式、结构式和整体式三种可扩展标记语言（XML）资源到关系数据库的存储模式。建立基于XML的描述模板来定义资源数据显示模式,实现了数据与模板的分离。建立工艺资源信息的解释映射机制,实现术语的规范性以提高后续推理设计的高效性;提出产品平台中工艺资源数据与CAD系统定义零件属性的映射方法。最后根据工艺资源的不同粒度和表示方法,建立工艺信息的权重学习规则,把用户最常用的信息资源优先提供给用户。通过这些机制,使得工艺资源在整个产品平台中可为产品设计、工艺规划和组织生产等提供最便捷的支持。

郭永明^[9]（2010）在《XML文档交互式信息检索技术研究》文中进行了进一步梳理XML作为互联网上信息描述和数据交换事实上的标准,已经被业界广泛采用。随着Web上大量XML文档的涌现,如何对XML文档进行有效的检索成为了一个具有实际应用价值的重要研究课题。由于XML文档是一种半结构化的数据,具有明显的结构标记,可表达一定的语义信息。因此,可以利用XML文档所含有的结构信息,改进传统的基于关键词的信息检索,从而提供更加全面准确的检索结果。但是,由于XML文档结构的复杂性、异构性以及可扩展性,使得如何在信息检索的过程中有效利用XML文档的结构信息成为了XML信息检索所面临的首个挑战。源于数据库的XML查询语言可以表达复杂的信息需求,但是要形成有效的结构化查询对于最终用户来说是非常困难的事情。因为用户可能并不熟悉文档结构,所以很难提出准确的“内容+结构”的结构化查询。基于关键词的XML信息检索依然面临着用户需求表达模糊的问题。XML信息检索实际上也是一个交互式的检索过程,相关反馈、检索结果聚类等交互式信息检索技术在XML信息检索中依然存在,而且有其独特的特点。例如,如何利用关键词检索的简单性迅速返回查询结果,然后根据用户的相关反馈等信息,系统自动形成或帮助用户形成内容+结构查询,以清晰地表达用户信息需求；如何根据XML文档的内容和结构特征聚类XML信息检索结果,以帮助用户迅速找到满足其需求的信息。因此,如何利用交互式信息检索技术改进XML信息检索的准确性是XML信息检索所面临的又一个挑战。本文从XML信息检索所面临的这两个挑战入手展开研究,以XML文档交互式信息检索技术作为研究课题,主要研究两个问题：第一个问题是如何有效地结合结构信息和内容信息实现XML信息检索,主要包括XML节点编码、索引、检索模型和查询处理算法；第二个问题是如何进一步解决XML信息检索中同样存在着的用户信息需求表达模糊的问题,即研究相关反馈、检索结果聚类等交互式XML信息检索的一些关键技术。本文所做的主要工作和贡献包括以下几个部分：1) XML节点编码模式及索引结构的研究。提出了一种新颖有效的节点编码模式,详细论述了该节点编码模式的定义和性质。在这个新的节点编码模式的基础上,构建了一种有效地集成结构索引和文本内容索引的混合索引结构HID。该混合索引结构HID能够有效地支持XML信息检索,包括关键词检索和结构化查询。对比实验结果表明本文所提出的新的混合索引结构HID在索引构建时间和空间消耗上具有较佳的性能。2)XML信息检索模型及查询处理算法的研究。提出了一种用于XML信息检索的模糊结构向量空间模型。通过将文本内容特征词的概念扩展为结构化特征词,对向量空间模型进行扩展,使其能够包含结构信息的匹配和度量；同时将特征词在文档中出现的概念由一个精确的集合隶属关系,扩展为一个模糊集合隶属度的概念,以实现内容和结构信息的整体匹配,而且能够区别结构的匹配程度,建模不同程度的匹配为不同程度的重要性。该检索模型可统一建模关键词查询、标记关键词查询和路径关键词查询。最后给出了有效实现检索模型相应的查询处理算法,并实现了一个XML信息检索原型系统。对比实验结果表明本文所构建的XML信息检索原型系统具有较高的检索准确率和较快的查询响应时间。3)XML信息检索相关反馈技术研究。提出了一种新的结合内容和结构的XML信息检索结构化相关反馈方法,能够有效地结合内容和结构特征等多种证据源,实现将初始的关键词查询扩展为内容+结构的结构化查询。该结构化相关反馈方法通过内容查询词扩展、查询词路径扩展和检索元素粒度相关反馈三种算法扩展初始的关键词查询。内容查询词的扩展和重新权重综合考虑了出现特征词的相关公共元素的数目、特征词在相关元素中的重要性、特征词邻接距离和结构语义等多种证据。实验结果表明本文所提出的结构化查询相关反馈方法可以有效地改进XML信息检索的准确率。4) XML信息：检索结果聚类技术研究。针对XML文档的特点,提出了一种新的结合内容和结构特征的XML文档特征建模方法,能够有效地度量XML信息检索结果文档片断间的相似性。将XML信息检索结果聚类问题建模为k-中心聚类问题,通过改进解决k-中心聚类问题的贪心算法,提出了一种新的XML信息检索结果快速聚类算法。实验结果表明基于本文所提出的XML文档特征建模方法和新的XML信息检索结果快速聚类算法实现了较好的聚类质量和较快的聚类速度。

胡川^[10]（2009）在《本原GML空间数据存储与索引研究》文中认为GML是开放式地理信息系统协会（Open Geospatial Consortium, Inc.?, OGC）制定的、基于XML的地理信息编码规范,它中立于任何厂商、任何平台,为地理信息包括地理要素的空间与非空间特征信息的建模、传输和存储提供了统一的框架。它的出现为空间数据的共享和互操作提供了很好的解决方案,同时也给Web GIS技术的发展开辟了新途径。GML是XML数据编码在空间信息系统中的扩展。因此,它既具有XML基于文本、可扩展、自描述、能够嵌套表达复杂数据模型等特征,也具有空间数据的海量、复杂、不可排序等特征。目前GML已成为空间数据编码、交换的国际标准,大量GML空间数据的不断涌现,给我们带来了新的挑战,如何有效地管理、操纵这些GML空间数据,如何建立良好的索引机制以实现高效地检索数据量大大增加的GML文档是当前急待解决的问题之一。利用数据库管理操作海量的GML数据和文档目前是最有效的方法。根据数据模型和编码方式的不同,GML空间数据的管理方式可分为有两种:一种是利用传统关系数据库或面向对象的数据库管理方式,另一种就是本文的研究重点,利用本原NGD数据库系统来管理GML空间数据。本原GML空间数据库（Native GML Database简写为NGD）是在Native XML数据库的基础之上发展而来,是用来专门管理GML空间数据的数据库系统。GML空间数据库具有通常XML数据库的特性,能够使用XML数据库的一些技术来处理GML中的一些常规问题。但是GML数据是用来专门实现空间数据共享的标准数据,其对空间数据的存储、索引、查询等操作都具有其自身的特殊性。它们的关系好比信息管理系统与地理信息系统的区别,也好比数据库和空间数据库之间的关系。仅使用XML数据库的常规技术是很难实现对GML空间数据的高效率存储、索引及查询功能。因此,有必要对存储GML的数据库进行研究来提高对GML的管理和利用效率。本文主要对GML的标准规范、GML空间数据的特点、Native XML数据库的存储索引特性等进行了研究分析。设计了本原GML空间数据库的系统框架,在开放原代码的本原XML数据库eXist的基础上,结合Eclipse开发平台,利用Java技术实现了本原GML空间数据库原型系统。由于时间仓促本文主要实现了原型系统的存储模块和索引模块以及一些相关的功能。根据这些研究文中提出了GML空间数据模式聚类存储机制以及在此基础上提出基于线型区间扩展编码的GML空间数据数字索引模式。

二、以数据为中心的XML文档存储研究及实现（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、以数据为中心的XML文档存储研究及实现（论文提纲范文）

（1）基于DDS的空战模拟仿真系统的设计与实现（论文提纲范文）

摘要

abstract

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 研究目标与内容

1.3.1 研究目标

1.3.2 研究内容

1.4 本文组织结构

2 关键技术

2.1 数据集成技术

2.1.1 联邦数据库系统(FDBS)

2.1.2 数据仓库结构

2.1.3 中间件结构

2.1.4 数据集成系统体系结构的比较

2.2 OMG DDS规范

2.2.1 以数据为中心的发布/订阅的DCPS层

2.2.2 数据分发的核心思想

2.2.3 服务质量QoS

2.3 XML相关技术

2.3.1 XML文档

2.3.2 XML解析

2.3.3 XPath

2.4 本章小结

3 基于DDS的空战模拟仿真系统的设计

3.1 需求分析

3.2 系统框架设计

3.2.1 硬件结构

3.2.2 软件结构

3.2.3 系统工作流程

3.3 基于DDS的中间件设计

3.3.1 数据结构和主题

3.3.2 节点间的发布/订阅关系

3.3.3 基于DDS的集成框架设计

3.3.4 基于DDS和 XML的数据集成模型设计

3.3.5 QoS策略设计

3.4 仿真节点的设计

3.4.1 主要功能

3.4.2 基于DDS规范的仿真系统软件框架设计

3.4.3 工作流程

3.5 本章小结

4 基于DDS的空战模拟仿真系统的实现

4.1 基于DDS的中间件的实现

4.1.1 数据结构和主题的实现

4.1.2 基于DDS集成框架的实现

4.1.3 基于DDS和 XML的发布/订阅消息总线的实现

4.2 各个仿真节点的实现

4.2.1 系统总控

4.2.2 计算机生成兵力

4.2.3 战场环境态势显示

4.2.4 智能空战

4.2.5 模拟器

4.2.6 综合评估

4.3 性能测试实验

4.3.1 不同模式下性能测试

4.3.2 大数据包压力传输测试

4.4 本章小结

5 结论

5.1 总结

5.2 展望

参考文献

攻读硕士学位期间发表的论文

致谢

（2）基于S1000D标准的IETM系统的设计与实现（论文提纲范文）

摘要

abstract

1 绪论

1.1 课题研究背景

1.2 国内外研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.3 课题研究内容

1.4 课题研究目的及意义

1.5 论文主要组织结构

2 IETM相关基础理论与S1000D标准研究

2.1 IETM理论

2.1.1 IETM概述

2.1.2 IETM的互操作性与交互性

2.2 欧洲S1000D国际规范

2.2.1 公共源数据库技术

2.2.2 数据模块技术

2.3 IETM信息描述语言

2.3.1 XML概述

2.3.2 XML相关技术

2.4 本章小结

3 基于S1000D标准的IETM系统概要设计

3.1 基于S1000D标准的IETM开发流程

3.2 IETM系统需求分析

3.2.1 系统功能性需求分析

3.2.2 系统业务性需求分析

3.3 系统体系结构设计

3.4 公共源数据库设计

3.4.1 数据存储方式研究

3.4.2 数据库设计

3.5 系统开发环境及平台

3.6 本章小结

4 基于S1000D标准的IETM系统详细设计

4.1 数据模型设计

4.2 信息管理功能

4.2.1 基础数据配置设计

4.2.2 创建项目设计

4.3 内容编辑功能

4.3.1 创建数据模块设计

4.3.2 创建插图设计

4.3.3 创建出版物模块设计

4.4 技术信息的显示与发布设计

4.4.1 技术信息的显示设计

4.4.2 技术信息的发布设计

4.4.3 技术信息的目录导航设计

4.4.4 技术信息的检索设计

4.5 本章小结

5 IETM创作系统的应用案例

5.1 信息集的确定

5.2 基础数据配置管理

5.3 创建项目

5.4 生成数据模块需求列表

5.5 数据模块的制作与管理

5.5.1 数据模块编码制作

5.5.2 数据模块内容制作

5.5.3 数据模块管理

5.6 插图的制作与管理

5.7 出版物模块的制作与管理

5.8 技术信息的显示与发布

5.9 系统测试及分析

5.9.1 系统功能测试

5.9.2 系统性能测试

5.9.3 测试结果

5.10 本章小结

6 结论

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间发表的论文

致谢

（3）基于模式的复杂XML文档到关系数据库存储的研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究的背景和意义

1.1.1 XML的应用及其存储的研究

1.1.2 将XML存入关系数据库的原因

1.2 XML文档的特点

1.2.1 以数据为中心的文档(DATA-CENTRIC DOCUMENTS)

1.2.2 以文档为中心的文档(DOCUMENT-CENTRIC DOCUMENTS)

1.3 复杂XML文档

1.4 本文的主要工作

1.5 本文的组织结构

第2章 XML文档到关系数据库的存储方法

2.1 XML文档存储技术的研究现状

2.2 XML模式到关系模式的映射方法的概述

2.2.1 DTD与XML SCHEMA简介

2.2.2 基于模式的XML文档到关系模式的存储方法

2.3 P_Schema(Physical XML Schema)

2.4 B Schema(Basic XML Schema)

2.5 C_Schema(Complex XML Schema)

2.6 本章小结

第3章基于C_Schema++的复杂XML文档存储方法

3.1 C Schema++

3.2 C_Schema++到关系模式的映射

3.2.1 命名空间信息的映射

3.2.2 元素表的建立

3.2.3 元素和属性的映射

3.2.4 完整性约束

3.3 与其他映射模式的比较

3.4 实例映射

3.4.1 实例文档存储过程

3.4.2 从关系数据库中还原XML文档

3.5 本章小结

第4章基于C_Schema++模式的查询处理

4.1 XML查询语言相关介绍

4.1.1 XML-QL

4.1.2 XPATH(XML PATH LANGUAGE)

4.1.3 XQUERY

4.1.4 限制与不足

4.2 基于C_Schema++和查询中间件的XML查询到关系数据查询

4.2.1 查询中间件

4.2.2 基于C_SCHEMA++的XML查询

4.2.3 XPATH转换为XPATHEXPRESSION图

4.2.4 XPATHEXPRESSION图转换为SQL查询

4.2.5 查询结果的显示

4.3 本章小结

第5章代价估计

5.1 代价模型

5.1.1 XML文档存储模式的代价

5.1.2 查询代价公式

5.1.3 代价公式分类

5.2 统计信息

5.2.1 DOM树中的数据筛选

5.2.2 统计信息表的生成

5.3 本章小结

第6章总结

6.1 论文工作总结

6.2 论文的进一步工作以及展望

参考文献

附录1 第1章1.3节复杂XML文档的模式

附录2 第3章3.2.2节实例文档2

附录3 第5章5.2.2节C_Schema与C_Schema++的统计信息

攻读硕士学位期间发表的论文

致谢

（4）基于语义的XML查询及规范化研究（论文提纲范文）

致谢

摘要

ABSTRACT

1 绪论

1.1 引言

1.2 XML技术研究现状

1.2.1 XML存储策略

1.2.2 XML索引结构

1.2.3 XML节点编码方法

1.2.4 XML查询技术

1.2.5 XML流管理

1.2.6 多数据源集成

1.2.7 XML规范化

1.3 本文主要工作及组织结构

2 XML数据模型

2.1 XML文档分类

2.1.1 以数据为中心的XML

2.1.2 以文档为中心的XML

2.1.3 本文的研究对象

2.2 XML树

2.3 实体片断

2.3.1 XML节点的语义

2.3.2 XML节点的分类

2.3.3 实体片断的定义

2.3.4 连接节点的处理

2.4 本章小结

3 基于语义的XML查询研究

3.1 引言

3.2 相关定义及表示方法

3.3 基于关键字分组分类表达式的XML查询方法

3.3.1 关键字分组分类表达式

3.3.1.1 产生动机

3.3.1.2 语法结构

3.3.2 基于关键字分组分类表达式的查询用例分析

3.3.2.1 关键字分类

3.3.2.2 关键字分组

3.3.2.3 操作符

3.3.2.4 操作优先级

3.3.2.5 查询用例的特例

3.3.3 查询算法

3.3.3.1 C-Dewey编码

3.3.3.2 索引结构

3.3.3.3 FRQI算法

3.3.3.4 FRQI算法时间复杂度分析

3.3.4 实验

3.3.4.1 有效性实验

3.3.4.2 效率实验

3.4 两阶段XML关键字查询方法

3.4.1 产生动机

3.4.2 XML节点的语义三元组

3.4.2.1 语义三元组的定义

3.4.2.2 XML节点语义索引

3.4.3 查询算法

3.4.3.1 TPKQ算法

3.4.3.2 TPKQ算法时间复杂度分析

3.4.4 实验

3.4.4.1 有效性实验

3.4.4.2 效率实验

3.5 本章小结

4 基于语义的XML规范化研究

4.1 引言

4.2 现有XML数据依赖表示方法的缺陷分析

4.3 基于实体片断的XML数据依赖表示方法

4.3.1 属性依赖

4.3.2 属性分类与XML主键

4.3.3 与现有XML数据依赖表示方法的比较

4.4 基于实体片断方法的XML范式

4.4.1 实体片断的类型分析

4.4.2 XML数据冗余分析

4.4.2.1 不合理的属性依赖所引起的数据冗余

4.4.2.2 XML主键值重复所引起的数据冗余

4.4.3 XML范式

4.4.3.1 XML范式定义

4.4.3.2 XML范式证明

4.5 本章小结

5 总结与展望

5.1 本文总结

5.2 研究展望

参考文献

作者简历

攻读博士学位期间发表的学术论文(第一作者)

学位论文数据集

（6）XML数据库技术研究（论文提纲范文）

1 XML数据库系统的组成

1.1 XML数据库的数据区以及存储机制

1.2 XML数据库数据模型

1.3 XML数据库查询和操作语言

1.4 XML数据库处理工具

2 XML文档类型

3 XML数据库产品及其与传统数据库的比较

3.1 NXD产品概述

3.2 NXD与传统数据库RDB的比较

3.3 XEDB产品概述及其与传统数据库的关系

4 XML数据库的若干问题

4.1 聚合问题

4.2 数据查询与更新能力有待提高

4.3 并发机制

4.4 标准化问题

5 结论

（7）XML数据编码与存储管理关键技术研究（论文提纲范文）

摘要

Abstract

第一章绪论

第一节研究背景

第二节研究内容及意义

1.2.1 本文的研究内容和创新点

1.2.2 研究的理论和实际意义

第三节论文结构

第二章 XML数据管理的研究基础

第一节相关的XML知识

2.1.1 XML文档结构

2.1.2 XML模式语言

2.1.3 XML数据模型

2.1.4 XML查询语言

2.1.5 XML应用程序接口

第二节 XML数据库的相关研究

2.2.1 XML与数据库的对比

2.2.2 XML与关系数据库

2.2.3 原生XML数据库

第三节 XML数据挖掘的相关研究

2.3.1 XML数据挖掘的概念与分类

2.3.2 XML数据挖掘的主要方法

2.3.3 XML相似性度量

第四节本章小结

第三章动态XML节点编码方案

第一节节点编码的特点

第二节 XML节点编码的现状

3.2.1 基于区间的编码方案

3.2.2 基于前缀的编码方案

3.2.3 素数编码方案

第三节 BSC编码方案

3.3.1 基本定义

3.3.2 BSC编码的原语

3.3.3 基本索引驱动的XPath表达式求值

第四节 BSC编码的串行化

3.4.1 固定长度的串行化

3.4.2 使用长度域的串行化

3.4.3 使用分隔符的串行化

3.4.4 使用前缀特性的串行化

3.4.5 串行化空间效率比较

3.4.6 BSC编码占用存储空间分析

第五节实验结果

3.5.1 真实数据集下的编码长度比较

3.5.2 节点数对编码时间和空间的影响

3.5.3 散出度对编码时间和空间的影响

3.5.4 深度对编码时间和空间的影响

3.5.5 实验结果分析

第六节本章小结

第四章 XML数据的编码与存储

第一节二进制XML格式

第二节 XML数据编码存储的现状与趋势

4.2.1 XML数据的编码技术

4.2.2 XML数据的存储方案

4.2.3 XML编码存储的对比与趋势

第三节 XML数据逻辑模型

第四节 XML数据编码

4.4.1 符号表与多字节整数

4.4.2 XML数据编码概述

4.4.3 二进制XML的扩展BNF定义

第五节独立的原生XML存储方案

4.5.1 节点记录格式

4.5.2 分页文件组织

4.5.3 索引框架

4.5.4 更新策略

第六节基于关系的原生XML存储方案

4.6.1 XML数据模型与关系模型的差异

4.6.2 基于关系的XML文档存储与发布

4.6.3 更新策略

第七节实验结果

4.7.1 实验环境与数据集

4.7.2 存储和发布效率

4.7.3 索引效率

第八节本章小结

第五章 XML文档相似性度量

第一节 XML文档相似性度量的相关研究

5.1.1 基于树形结构的相似性度量

5.1.2 基于频繁路径的相似性度量

第二节基于约束集合的相似性度量

5.2.1 基本定义

5.2.2 集合度量方法

第三节加权双向路径约束的相似性度量

5.3.1 双向路径约束模型

5.3.2 路径约束相似性度量

5.3.3 XML文档相似性度量

第四节实验结果

5.4.1 实验环境和数据集

5.4.2 算法的聚类效果对比

第五节本章小节

第六章总结与展望

第一节论文研究内容总结

第二节主要成果与创新点

第三节研究内容展望

参考文献

致谢

个人简历

攻读博士学位期间发表论文

攻读博士期间参与的科研项目

攻读博士期间申请专利与研究成果

（8）产品平台中基于XML的工艺资源表示技术（论文提纲范文）

1 产品平台中的工艺资源数据及其关系

2 工艺资源的XML表达

2.1 工艺资源的粒度及XML描述

2.2 工艺资源的规范化显示

2.3 产品平台中XML数据转换到RDB的存储模式

3 产品平台中的工艺资源映射技术

3.1 工艺资源术语规范化映射

3.2 工艺信息的CAD映射

4 工艺信息的权重学习

5 结语

（9）XML文档交互式信息检索技术研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 研究背景

1.2 相关研究

1.2.1 支持全文本检索的XML查询语言

1.2.2 XML数据上的关键词查询

1.2.3 面向内容的XML文档检索

1.2.4 内容+结构的XML文档检索

1.3 研究内容

1.4 本文结构

第二章 XML节点编码模式与索引结构

2.1 XML文档模型

2.2 节点编码模式

2.2.1 基于范围的节点编码方法

2.2.2 基于前辍的节点编码方法

2.2.3 基于路径摘要和杜威编码的节点编码模式

2.3 数据索引结构

2.3.1 文本内容索引

2.3.2 元素标记索引

2.3.3 路径摘要索引

2.4 实验评价

2.4.1 实验设置

2.4.2 结果分析

2.5 小结

第三章相关性打分模型及查询处理算法

3.1 引言

3.2 模糊结构向量空间模型

3.2.1 文档描述

3.2.2 查询表示

3.2.3 返回结果文档片断

3.2.4 结构化特征词出现的模糊度量

3.2.5 结构化特征词的权重计算

3.2.6 文档片断和查询的相似性

3.3 XML信息检索查询处理算法

3.3.1 简单关键词查询处理算法

3.3.2 路径关键词查询处理算法

3.4 实验评价

3.4.1 实验环境设置

3.4.2 实验评价方法

3.4.3 实验结果分析

3.5 小结

第四章结合内容和结构的XML信息检索相关反馈

4.1 引言

4.2 相关工作

4.2.1 向量空间模型中的相关反馈技术

4.2.2 概率模型中的相关反馈技术

4.2.3 XML信息检索中的相关反馈技术

4.3 结合内容:和结构的XML信息检索相关反馈

4.3.1 内容查询词的扩展和重新权重

4.3.2 结构化查询扩展

4.3.3 扩展关键词查询为内容+结构查询

4.4 实验评价

4.4.1 实验环境设置

4.4.2 实验评价方法

4.4.3 实验结果及分析

4.5 小结

第五章基于内容和结构的XML信息检索结果聚类

5.1 引言

5.2 相关工作

5.2.1 查询结果聚类技术

5.2.2 XML文档聚类技术

5.3 基于FVSM模型的XML信息检索结果聚类

5.3.1 问题定义

5.3.2 特征建模

5.3.3 距离度量

5.3.4 解决k-中心聚类问题的贪心算法

5.3.5 改进的k-中心聚类算法R-GreedKcenter

5.4 实验评价

5.4.1 实验设置

5.4.2 结果分析

5.5 小结

第六章结论与展望

6.1 本文工作总结

6.2 未来工作展望

参考文献

致谢

读博期间所参加的科研项目

读博期间发表和录用的论文

（10）本原GML空间数据存储与索引研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 论文综述以及国内外研究现状

1.2 GML 存储问题分析

1.3 主要研究内容、技术路线以及关键技术

1.3.1 主要研究内容

1.3.2 技术路线以及关键技术

1.4 本研究的创新之处

1.5 论文总体结构

第二章 GML 及GML 数据模型

2.1 OGC 互操作规范简介

2.1.1 GML 的简介

2.1.2 GML 的发展

2.1.3 GML 3.0 的体系结构

2.2 GML 数据模型

2.2.1 要素模型(Feature Model)

2.2.2 几何模型(Geometry Model)

2.2.3 拓扑模型(Topology Model)

2.3 GML 应用模式的建模规则

2.3.1 模式的引用

2.3.2 几何类型定义

2.3.3 复杂要素建模

2.3.4 空间信息的组织

2.4 GML 的发展前景

第三章 XML 数据的存储与索引研究

3.1 XML 技术概述

3.1.1 XML 简介

3.1.2 XML 相关技术

3.2 XML 存储管理

3.2.1 文本文件管理方式

3.2.2 关系数据库管理方式

3.2.3 对象数据库管理方式

3.2.4 本原XML 数据库管理方式

3.3 XML 索引技术

3.3.1 XML 数据的查询处理

3.3.2 XML 数据的索引机制

3.3.3 索引数据的存储

第四章本原GML 空间数据索引模式

4.1 空间数据索引技术

4.1.1 四叉树

4.1.2 R 树及其扩展

4.1.3 R*树

4.2 本原GML 空间数据索引设计

4.2.1 基于线性区间扩展编码的GML 数据索引机制

4.2.2 基于线性区间扩展编码的索引数据组织

4.2.3 基于线性区间扩展编码的查询处理

第五章本原GML 空间数据库系统设计

5.1 本原GML 空间数据库概述

5.2 本原GML 空间数据库分类以及性能比较

5.2.1 基于传统空间数据库的GML 数据库（GML Enabled Database,GED）

5.2.2 基于本原XML 数据库的GML 数据库（Native GML Database,NGD）

5.3 本原GML 空间数据库（NGDBMS）设计

5.3.1 本原GML 空间数据库系统扩展的必要条件

5.3.2 本原GML 空间数据库的系统框架

5.3.3 本原GML 空间数据库系统结构功能分析

5.3.4 本原GML 空间数据的存储粒度

5.3.5 本原GML 空间数据存储逻辑模型

第六章本原GML 空间数据库原型系统构架与实现

6.1 本原GML 空间数据库原型系统架构

6.1.1 eXist 数据库介绍

6.1.2 eXist 核心功能模块

6.1.3 GML 空间数据库架构

6.2 本原GML 空间数据库系统的存储与索引实现

6.2.1 NGDBMS 数据存储模块(Storage)

6.2.2 NGDBMS 数据管理模块(Manager)

6.2.3 NGDBMS 数据索引模块(Indexing)

6.3 本原GML 空间数据库原型系统管理工具

6.3.1 NGDBMS 原型系统图形管理界面

6.3.2 数据库创建和连接分析

6.3.3 数据存储、资源操作分析

6.3.4 索引与查询分析

第七章结论与展望

参考文献

致谢

附录:个人简历攻读硕士学位期间参与项目和发表的学术论文

四、以数据为中心的XML文档存储研究及实现（论文参考文献）

[1]基于DDS的空战模拟仿真系统的设计与实现[D]. 郝玲玲. 西安工业大学, 2020(04)
[2]基于S1000D标准的IETM系统的设计与实现[D]. 高芬莉. 西安工业大学, 2019(03)
[3]基于模式的复杂XML文档到关系数据库存储的研究[D]. 曾庆玲. 广西师范大学, 2011(04)
[4]基于语义的XML查询及规范化研究[D]. 蔺旭东. 北京交通大学, 2010(07)
[5]一种基于XML的电子信息装备试验数据采集软件设计[J]. 刘东玉,胡然. 舰船电子工程, 2010(08)
[6]XML数据库技术研究[J]. 王唯贤. 河南科学, 2010(06)
[7]XML数据编码与存储管理关键技术研究[D]. 汪陈应. 南开大学, 2010(07)
[8]产品平台中基于XML的工艺资源表示技术[J]. 杨化林,邓芳,史俊友. 现代制造工程, 2010(03)
[9]XML文档交互式信息检索技术研究[D]. 郭永明. 东华大学, 2010(08)
[10]本原GML空间数据存储与索引研究[D]. 胡川. 江西理工大学, 2009(S2)

标签：xml语言论文; xml数据库论文; 数据库系统论文; xml解析论文; 信息存储论文;

以数据为中心的XML文档存储研究与实现

一、以数据为中心的XML文档存储研究及实现（论文文献综述）

二、以数据为中心的XML文档存储研究及实现（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、以数据为中心的XML文档存储研究及实现（论文提纲范文）

（1）基于DDS的空战模拟仿真系统的设计与实现（论文提纲范文）

（2）基于S1000D标准的IETM系统的设计与实现（论文提纲范文）

（3）基于模式的复杂XML文档到关系数据库存储的研究（论文提纲范文）

（4）基于语义的XML查询及规范化研究（论文提纲范文）

（6）XML数据库技术研究（论文提纲范文）

（7）XML数据编码与存储管理关键技术研究（论文提纲范文）

（8）产品平台中基于XML的工艺资源表示技术（论文提纲范文）

（9）XML文档交互式信息检索技术研究（论文提纲范文）

（10）本原GML空间数据存储与索引研究（论文提纲范文）

四、以数据为中心的XML文档存储研究及实现（论文参考文献）

猜你喜欢