Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

分布式数据库研究新趋势论文

发布时间:2021-12-28 14:11:33 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):
 
 摘   要:随着各类应用在数据量和业务量上的扩展,传统数据库系统越发难以应对现实需求。因为分布式数据库能够根据业务的需求动态地扩容,所以备受应用者的青睐。本文介绍了 NewSQL 和 NoSQL。同时讨论了用于大数据管理的在线事务处 理(OLTP)的 NewSQL 数据库的体系结构、特点和分类。并以一些度量标准对 RDBMS、NoSQL 和 NewSQL 数据库进行比较评价。

关键词:分布式数据库 ;NewSQL ;NoSQL ;大数据 ;OLTP

New Trends in Dstributed Database Research

SHEN Hongxue, GUO Yanbu
(College of Software Engineering, Zhengzhou University of Light Industry, Zhengzhou Henan 450001)

【Abstract】: With the expansion of data types and traffic volume, the traditional database system becomes more and more difficult to deal with the actual demand. However, the distributed database can be dynamically expanded according to the demand of the business and meets the needs of todays society. This article mainly introduces NewSQL and NoSQL. It also discusses the architecture, features, and classification of the NewSQL database for online transaction processing (OLTP) for big data management. And compared some RDBMS, NoSQL and NewSQL databases with some metrics.

【Key words】: distributed database;NewSQL;NewSQL;big data;OLTP

0 引言       
  
 随着数据量的爆发式增长以及应用负载的快速增加,传统关系型数据库所采用的单一服务器模式越来越难以应对当今应用对数据存储和事务处理的需求。数据量大,种类繁多,人们对时效性的要求也越来越高,各种数据和不同速度大量数据的集合,不能用传统的数据管理工具进行有效或经济的管理 :例如传统的关系数据库管理系统(RDBMS)或传统的搜索引擎 [1]。“大数据”问题的关键进展之一是出现了另一种数据库技术―分布式数据库。这将是与传统 RDBMS 模型显着不同的广泛类DBMS。这些数据存储可能不需要固定的表模式,通常避免连接操作,并且通常水平地缩放。图 1 为分布式数据库模型。

\

近年来,号称能够提供良好扩展性的分布式数据管理技术和产品星罗棋布,并且被广泛运用于各种互联网应用中。按照当今比较流行的分类方式,它们可以分为以HBase、BigTable、Cassandra[2]、MongoDB、CouchDB[3]、 Dynamo、Neo4J 等为代表的 NoSQL 数据库, 以及以 VoltDB[4]、Spanne[5]、MemSQL、Clustrix、NuoDB、 eXtremeDB 等为代表的 NewSQL 数据库。前者被认为 是通过弱化了对数据一致性的保护能力 ( 如抛弃了 ACID 原则,退而求其次地遵循 BASE 原则 ) 而获得更强的系 统扩展能力和系统可用性。后者被认为是针对不同领域 的应用而定制的特殊数据库系统 ;它们通过更贴近应用的设计而获得更好的性能和扩展能力。然而,这样的划 分方式无疑太过于简化。具体系统设计所遇到的问题并 非是 NoSQL 和 NewSQL 的理念所能解决的,还需要 设计者能够对数据库系统的各个重要特点以及它们之间 的对比有清晰的理解。

1 NoSQL

1.1 NoSQL 的介绍


NoSQL 是 Not Only 的缩写,而不是 NOT SQL。从 更广泛的意义上讲,它包括所有非关系 DBMS(可能使 用也可能不使用查询语言)。与 RDBMS 中符合 ACID (Atomicity、Consistency、Isolation、Durability) 的 事务相反, NoSQL DBMS 遵循 CAP(一致性、可用性、 分区容错性)定理,因此它们的事务符合 BASE 原则。 基于 CAP 的 DBMS,而不是使其事务符合 ACID,符 合 BASE(基本可用、软状态、最终一致)属性。

NoSQL 系统是为大规模数据存储而设计的分布式 非关系数据库,也是用于大量商品服务器的大规模并行 数据处理。NoSQL 数据库的应用类型包括 :键值数据 库、列式数据库、文档数据库和图形数据库。

1.2 NoSQL 数据库的特点

介绍 NoSQL 数据库的特点。

(1)大数据量,高性能。因为数据之间无关系性, 数据库结构简单,NoSQL 数据库的读写性十分良好, 特别是在处理大数据量时。

(2)灵活的数据模型。在关系数据库中,假如想要 增删字段是一件非常棘手的问题,但是 NoSQL 无须预 先给储存的数据建立字段,可以随时储存自定义的数据 格式,并且假如是非常庞大的数据量的表,增加字段就 会特别困难了。  

(3)易扩展。NoSQL 数据库的种类有许多,但有 他们去掉了关系型数据库的关系型特性,这是它们共同 的特征,这种数据之间呈现无关系的特性,非常有利于扩展。

(4)高可用。NoSQL 可以在基本保持性能的情况 下,便捷地实现高可用的架构特性。    
    
   2 NewSQL

2.1 NewSQL 的介绍


NewSQL 是用于在线事务处理(OLTP)的下一代 可扩展关系数据库管理系统(RDBMS), 可为读写工 作负载提供可扩展的 NoSQL 系统性能,并保持 ACID (Atomicity、Consistency、Isolation、Durability) 原则 [6]。这些系统通过采用 NoSQL 样式的功能(例如 面向列的数据存储和分布式体系结构), 或通过采用诸如内存中处理,对称多处理(SMP)或大规模并行处理 (MPP)高级功能等技术来突破传统的 RDBMS 性能限 制。整合 NoSQL 或搜索组件,旨在处理大数据量,多 样性,速度和可变性挑战。图 2 表示了 NewSQL 可扩 展的 NoSQL 系统性能,保持 ACID 原则的对比图。

\

NewSQL 数据库的典型代表之一 NuoDB,它是一 个使用 SQL 服务设计的分布式数据库 :ACID 事务的所 有属性,标准 SQL 语言支持和关系逻辑。NuoDB 是一 个网络规模的分布式数据库,提供丰富的 SQL 实现和 真正的 ACID 事务。它的设计从一开始就是一个分布式 系统,可以扩展云服务的规模,提供高可用性和弹性。 与传统的共享磁盘或无共享体系结构不同,NuoDB 提 供了一种新型的点对点,按需独立性,可提供高可用 性,低延迟和易于管理的部署模型。为现代数据中心而 设计,作为一个横向扩展云数据库,NuoDB 是您简化 应用程序部署所需的 NewSQL 解决方案。  ClustrixDB 是一个分布式 SQL 数据库,专为大规模和快速增长的 应用程序而构建。这是一个横向扩展的 NewSQL 数据 库,适用于云计算。ClustrixDB 通过大规模并行处理, 对您的实时操作数据进行独特的实时分析。VoltDB 是一个疯狂的快速内存数据库,具有令人难以置信的高读 写速度。这个 NewSQL 数据库支持 JSON 事件级事务。 Xeround 提供可扩展的弹性云计算基础架构,用于云 内和云间的弹性数据管理和数据联合。这个解决方案从 CrunchBase 提供。MemSQ 是一个实时分析平台, 帮 助企业快速查询大数据并适应不断变化的业务条件。

2.2 NewSQL 体系结构

传统的数据库无法按需提供容量,因为应用程序开 发可能会受到数据库规模所需的所有工作的阻碍。为了 克服可扩展性挑战,开发人员添加了分区技术,如分 区,分片和集群。另一个常见的方法是以更大的成本添 加更大的机器 [7]。一个理想的数据库管理系统应该进行 弹性扩展,使新机器能够被引入正在运行的数据库,并 立即生效。因此,为了采用向外扩展的性能,DBMS 重 新定义了关系数据库技术,实现了网络规模的分布式数 据库技术,以应对云计算和全球应用部署的多重挑战。

这些数据库通常分布在架构中,遵循三层模型,分 为三层 :管理层,事务层和存储层。传统上,关系数据 库是为扩展架构设计的。在存储在维护 ACID 语义体 系结构的分布式数据中心的 NewSQL 模型按需扩展数 据库中。这些数据库的关键特性与易用性和管理,安全 性,高负载或故障的敏捷性以及对广泛分布式应用程序 的支持云规模相关联 ;反过来又要求分布式服务具有高 可用性并且可以提供低延迟。

2.3 NewSQL 数据库的分类

NewSQL 解决方案有很多种类。基于供应商采用 的不同方法来保留 SQL 接口,并解决传统 OLTP 解决 方案的可扩展性和性能问题。NewSQL 系统可以分为 三类 :

新的体系结构数据库 :这些新的 SQL 体系是为了实 现在无共享节点的分布式集群中运行的可伸缩性和性能 而设计的。这些数据库通常是从头开始编写的,其中包 含分布式并发控制,流量控制和分布式查询处理等组件。 解决方案可以是纯软件(VoltDB、NuoDB 和 Drizzle) 或作为设备(Clustrix、Translattice) 支持。产品的例子 是 Clustrix、NuoDB 和 Translattice(商业); 和VoltDB、 Drizzle 等(开源)。

新的 MySQL 存储引擎(第二类是高度优化的 SQL 存储引擎) :MySQL 是 LAMP 堆栈的一部分,并广泛 用于 OLTP。为了克服 MySQL 的可伸缩性问题,开发 了一套存储引擎。这些系统提供与 SQL 相同的编程接 口,但比内置引擎(如 InnoDB) 的规模更好。这些新 的存储引擎的例子包括 TokuDB 和 InfiniDB。

透明集群 / 分片 :这些解决方案保留 OLTP 数据库 的原始格式,但提供可插入的功能以透明地集群,以确 保可扩展性。另一种方法是提供透明分片来提高可伸 缩 性。Schooner MySQL、Continuent Tungsten 和 ScalArc 遵循前一种方法, 而 ScaleBase 和 dbShards 遵循后一种方法。这两种方法都允许重用现有的技能组和生态系统,避免重写代码或执行任何数据迁移。产品 的例子是 ScalArc、Schooner MySQL、dbShards 和 ScaleBase(商业);和 Continuent Tungsten(开源)。

\

3 NoSQL 和 NewSQL 比较

对比发现传统数据库只依赖于单机操作,满足不了 大规模(或者说是海量)数据存储和处理的要求,而新 兴的 NoSQL 和 NewSQL 能满足多机操纵,越来越得到 人们的关注。能实现分布式管理和存储满足当今应用系 统的需求 ;同时 NoSQL 和 NewSQL 相比于传统数据库 还满足横向扩展,支持 OLTP 和云服务 ;但是由于性能 是首要任务,NoSQL 和 NewSQL 数据库往往比传统的 SQL 数据库有更多的安全漏洞。基于 SQL 的 RDBMS, NoSQL 和 NewSQL 数据库与一组度量标准 [8] 进行比较。 

\

4 结语

当然,每个解决方案都有其优点和缺点。由于性能 是首要任务,NoSQL 和 NewSQL 数据库往往 比传统 的 SQL 数据库有更多的安全漏洞,随着我们进一步的 深入研究,才会解决安全漏洞问题得以解决,更好的让 NoSQL 和 NewSQL 数据库为我们所用。另外我们下一 步要做的是对 NoSQL 和 NewSQL 数据库需要进行基 准测试,评估一些流行的 NoSQL 和 NewSQL 数据库 的“负载测试”和“可伸缩性测试”。并在大数据分析 方面比较这些数据库,模拟处理小而频繁的请求的确切 条件和工作量,提供快速的响应时间。    

参考文献

[1] 郑智方.MySQL的重要性以及步入云的应用实例[J].计算机 产品与流通,2020(1):138.
[2] 袁晓东.异构型高可用数据库云管理平台的设计[J].信息技 术与信息化,2019(11):65-66.
[3] 李绍俊,杨海军,黄耀欢,等.基于NoSQL数据库的空间大数 据分布式存储策略[J].武汉大学学报(信息科学版),2017,42(2): 157-158.
[4] Stonebraker M,Weisberg A.The VoltDB Main Memory DBMS.IEEE Data Eng.Bull.,2013,36(2):21-27.     
[5] 张振超,吴杰,陈序蓬.浅谈Java中Mysql数据库的连接与操 作[J].信息记录材料,2020,21(02):132-135.
[6] 韦超英.MySQL数据库备份及恢复方法解析[J].网络安全技 术与应用,2019(10):70-74.
[7] 张伟伟,郑峰弓,张秋闻.基于数据库安全保障的审计系统 的设计与实现[J].郑州轻工业学院学报(自然科学版),2015,30 (z1):69-74.
[8] 徐俊刚,邵佩英.分布式数据库系统及其应用[M].北京:科学出版社,2015:80-92.

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/34831.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml