现在的位置:首页 > 毕业论文 > 计算机 正文
解析数据流查询处理数据库
发布时间:2009-04-25 浏览:  收藏到:  字体设置: 作者:
解析数据流查询处理数据库 由MyRain.org编辑收集整理,除MyRain注明原创文章外,其版权归原作者所有。如果您需要论文或者其他文章请联系我们,我们有专门的硕博和部分专家学者,多年的写作经验,文章的质量有保证。请先将您的题目、专业、字数等内容告诉我们,稍后将会有该领域的专家联系您。

摘要:分析了基于结构化覆盖网的分布式查询处理模型,支持大量数据流的分布式存储,连续查询间、查询内的并行处理操作,能够在很大程度上消除资源约束问题(主要是内存),提高了查询性能、服务质量,并且该查询模型具有很好的扩展性.

关键词:分布式数据流,分布式数据流系统

  近年来,数据流查询处理是数据库研究领域的1个热点方向.数据流的特征可概括为无限性、瞬时性、流速不定性、语义不定性(数据模式随时可能改变)等.针对数据流的以上特征,不考虑将数据流存储在传统的关系数据库中,数据流上的查询是近似查询、连续查询(continuous query). 目前,数据流管理系统中所采用的近似查询的方法主要有以下几种:随机抽样(random sampling)、数据写生(sketching)、直方图(histograms)、小波变换(wavelets)、窗口(windows)等.如何保证查询的服务质量成为上述各种近似查询方法考虑的问题.数据流上的查询处理给人们提出了1个很大的难题——对处理器、内存等系统资源非常苛刻的需求.到目前已经出现了许多数据流的原型系统:单节点(单CPU)上的数据流管理系统,如Stanford 大学的Stream[1] 系统、布朗大学的Aurora[2,3] 系统等;有分布式数据流处理系统,如MIT的Medusa[4,5] 项目,Brandeis、Brown、MIT 的合作项目Borealis[6,7]等.这些项目在数据流处理的查询语言、近似查询算法、保证服务质量的策略,以及系统的负载均衡等方面做了大量的工作,但同时也揭示出在分布式数据流处理系统中更多值得研究的问题.本文将对基于structured overlay network的分布式数据流系统的近似、自适应查询处理进行研究,给出查询处理模型.
  
  1集中式数据流查询处理及分布式散列表、Chord路由协议的相关说明
  
  1.1数据流查询处理相关的概念定义以及假设说明
  集中式数据流查询处理的体系结构由两部分构成,即查询计划生成子系统(FRONT-end)以及查询执行子系统(BACK).其中两部分与关系数据库系统相比均有较大的区别.查询执行子系统如图1所示.
  
  通过这种散列,将系统当前的所有查询映射到节点空间,然后由该节点上的查询处理器完成到达的查询.
  b)查询内并行处理方式.在系统的范围内,由操作符、输入均输出记录队列、维持操作符状态的大纲信息构成网状结构.
  c)命名发现机制.参与查询处理的节点有全局惟1命名participant(如IP地址等).当在1个节点上面定义1个新的流模式、数据流、操作符,这些实体均隶属于其命名空间.该实体可以采用下面的命名方式:(participant,entity-name) .为了了解系统中数据流模式的定义、系统中的数据流、数据流的到达(存放)位置、系统中哪1部分查询执行,就要考虑在?catalog中存放必要的数据.其中catalog信息是通过在DHT下分布式存储的,前面已经分析了catalog信息的存储问题.

 1/3    1 2 3 下一页 尾页
这篇文章对您很有帮助? 请别忘记将这个页面加入收藏夹,以后使用的时候方便您快速查找。MyRain长期招募文字写手,待遇优厚,请发送您的简历到我们的Email。如果您想在本站发表论文等作品,请先注册-登陆,然后选择好相关分类,保存即可。我们会在最短时间内审核。
栏目热门
链接