NoSQL数据库总结.docx

资源描述

NoSQL数据库总结.docx

《NoSQL数据库总结.docx》由会员分享，可在线阅读，更多相关《NoSQL数据库总结.docx（12页珍藏版）》请在冰点文库上搜索。

NoSQL数据库总结.docx

NoSQL数据库总结

数据库

一、NoSQL数据

简介

NoSQL（NoSQL=NotOnlySQL），意即反SQL运动，指的是非关系型的数据库，是一项全新的数据库革命性运动

随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。

优点

可以处理超大量的数据

可以运行在便宜的PC服务器集群上

打破了性能的瓶颈

NoSQL的支持者称，通过NoSQL架构可以省去将Web或Java应用和数据转换成SQL友好格式的时间，执行速度变得更快。

　　“SQL并非适用于所有的程序代码，”对于那些繁重的重复操作的数据，SQL值得花钱。

但是当数据库结构非常简单时，SQL可能没有太大用处。

没有过多的操作

Bootstrap支持

因为NoSQL项目都是开源的，因此它们缺乏供应商提供的正式支持。

这一点它们与大多数开源项目一样，不得不从社区中寻求支持。

缺点

没有正式的官方支持，万一出了差错会是可怕的

nosql并未形成一定标准，各种产品层出不穷，内部混乱，各种项目还需时间来检验

二、NoSQL数据库开源软件

1.MongoDB：

简介

MongoDB是一个基于分布式文件存储的数据库。

由C++语言编写。

旨在为WEB应用提供可扩展的高性能数据存储解决方案。

MongoDB是一个介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。

他支持的数据结构非常松散，是类似json的bjson格式，因此可以存储比较复杂的数据类型。

Mongo最大的特点是他支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。

特点

它的特点是高性能、易部署、易使用，存储数据非常方便。

主要功能特性有：

面向集合存储，易存储对象类型的数据

“面向集合”（Collenction-Orented），意思是数据被分组存储在数据集中，被称为一个集合（Collenction）。

每个集合在数据库中都有一个唯一的标识名，并且可以包含无限数目的文档。

集合的概念类似关系型数据库（RDBMS）里的表（table），不同的是它不需要定义任何模式（schema）。

模式自由

模式自由（schema-free），意味着对于存储在mongodb数据库中的文件，我们不需要知道它的任何结构定义。

如果需要的话，你完全可以把不同结构的文件存储在同一个数据库里。

支持动态查询

支持完全索引，包含内部对象

支持查询

支持复制和故障恢复

使用高效的二进制数据存储，包括大型对象（如视频等）

自动处理碎片，以支持云计算层次的扩展性

支持RUBY，PYTHON，JAVA，C++，PHP,C#等多种语言

文件存储格式为BSON（一种JSON的扩展）

BSON（BinarySerializeddOcumentFormat）存储形式是指：

存储在集合中的文档，被存储为键-值对的形式。

键用于唯一标识一个文档，为字符串类型，而值则可以是各中复杂的文件类型。

可通过网络访问

MongoDB服务端可运行在Linux、Windows或OSX平台，支持32位和64位应用，默认端口为27017。

推荐运行在64位平台，因为MongoDB在32位模式运行时支持的最大文件尺寸为2GB

2.GoogleBigTable

简介

BigTable是非关系的数据库,是一个稀疏的、分布式的、持久化存储的多维度排序Map。

Bigtable的设计目的是可靠的处理PB级别的数据，并且能够部署到上千台机器上。

Bigtable已经实现了下面的几个目标：

适用性广泛、可扩展、高性能和高可用性。

Bigtable已经在超过60个Google的产品和项目上得到了应用，包括GoogleAnalytics、GoogleFinance、Orkut、PersonalizedSearch、Writely和GoogleEarth。

这些产品对Bigtable提出了迥异的需求，有的需要高吞吐量的批处理，有的则需要及时响应，快速返回数据给最终用户。

它们使用的Bigtable集群的配置也有很大的差异，有的集群只有几台服务器，而有的则需要上千台服务器、存储几百TB的数据。

功能

在很多方面，Bigtable和数据库很类似：

它使用了很多数据库的实现策略。

并行数据库和内存数据库已经具备可扩展性和高性能，但是Bigtable提供了一个和这些系统完全不同的接口。

Bigtable不支持完整的关系数据模型；与之相反，Bigtable为客户提供了简单的数据模型，利用这个模型，客户可以动态控制数据的分布和格式（alex注：

也就是对BigTable而言，数据是没有格式的，用数据库领域的术语说，就是数据没有Schema，用户自己去定义Schema），用户也可以自己推测（alex注：

reasonabout）底层存储数据的位置相关性（alex注：

位置相关性可以这样理解，比如树状结构，具有相同前缀的数据的存放位置接近。

在读取的时候，可以把这些数据一次读取出来）。

数据的下标是行和列的名字，名字可以是任意的字符串。

Bigtable将存储的数据都视为字符串，但是Bigtable本身不去解析这些字符串，客户程序通常会在把各种结构化或者半结构化的数据串行化到这些字符串里。

通过仔细选择数据的模式，客户可以控制数据的位置相关性。

最后，可以通过BigTable的模式参数来控制数据是存放在内存中、还是硬盘上。

特点

适合大规模海量数据，PB级数据

分布式、并发数据处理，效率极高

易于扩展，支持动态伸缩

适用于廉价设备

适合于读操作，不适合写操作

不适用于传统关系数据库

应用

BigTable为谷歌旗下的搜索、地图、财经、打印、以及社交网站Orkut、视频共享网站YouTube和博客网站Blogger等业务提供技术支持。

　　2010年9月，Google宣布将放弃MapReduce新索引系统将迁移至BigTable平台。

新平台基于Colossus，也被称为GFS2。

3.HyperTable

简介

Hypertable是一个开源、高性能、可伸缩的数据库，它采用与Google的Bigtable相似的模型。

在过去数年中，Google为在PC集群上运行的可伸缩计算基础设施设计建造了三个关键部分。

第一个关键的基础设施是GoogleFileSystem（GFS），这是一个高可用的文件系统，提供了一个全局的命名空间。

它通过跨机器（和跨机架）的文件数据复制来达到高可用性，并因此免受传统文件存储系统无法避免的许多失败的影响，比如电源、内存和网络端口等失败。

第二个基础设施是名为Map-Reduce的计算框架，它与GFS紧密协作，帮助处理收集到的海量数据。

第三个基础设施是Bigtable，它是传统数据库的替代。

Bigtable让你可以通过一些主键来组织海量数据，并实现高效的查询。

Hypertable是Bigtable的一个开源实现，并且根据我们的想法进行了一些改进。

4.AmazonDynamo

简介

Dynamo是亚马逊的key-value模式的存储平台，可用性和扩展性都很好，性能也不错：

读写访问中99.9%的响应时间都在300ms内

基本原理

CAP原则

Consistency（一致性）：

即数据一致性，简单的说，就是数据复制到了N台机器，如果有更新，要N机器的数据是一起更新的。

　　Availability（可用性）：

好的响应性能，此项意思主要就是速度。

Partitiontolerance（分区容错性）：

这里是说好的分区方法，体现具体一点，简单地可理解为是节点的可扩展性。

任何分布式系统只可同时满足二点，没法三者兼顾。

所以架构师不要将精力浪费在如何设计能满足三者的完美分布式系统，而是应该进行取舍。

DHT—分布式哈希表

DHT（DistributedHashTable，分布式哈希表），它是一种分布式存储寻址方法的统称。

就像普通的哈希表，里面保存了key与value的对应关系，一般都能根据一个key去对应到相应的节点，从而得到相对应的value。

　　在DHT算法中，一致性哈希作为第一个实用的算法，在大多数系统中都使用了它。

一致性哈希基本解决了在P2P环境中最为关键的问题—如何在动态的网络拓扑中分布存储和路由。

每个节点仅需维护少量相邻节点的信息，并且在节点加入/退出系统时，仅有相关的少量节点参与到拓扑的维护中。

至于一致性哈希的细节就不在这里详细说了，要指明的一点是，在Dynamo的数据分区方式之后，其实内部已然是一个对一致性哈希的改造了。

数据划分

按分布式系统常用的哈希算法切分数据，分放在不同的节点上。

读操作时，也是根据key的哈希值寻找对应的节点。

Dynamo使用了ConsistentHashing算法，节点对应的不再是一个确定的hash值，而是一个hash值范围，key的hash值落在这个范围内，则顺时针沿环形查找，碰到的第一个node即为所需。

　　Dynamo对ConsistentHashing算法的改进在于：

它放在环上作为一个节点的是一组机器（而不是把一台机器作为节点），这一组机器是通过同步机制保证数据一致的。

如果一个环形内的访问量大了，则可以在两个节点间加入一个新节点以缓解压力，这时会影响到其后继节点的hash范围，需要调整数据。

假设一个环形中原本只有node2、node3、node4，在加入新的node1之后，原先从node2查询的部分key将改为从node1查询，node1和node2中的数据就需要调整，主要是node1从node2中提取出属于它的数据，这样做需要选取性能压力不高的时候

假设我们的数据的key的范围是0到2的64次方，然后设置一个常数，比如说1000，将我们的key的范围分成1000份。

然后再将这1000份key的范围均匀分配到所有的节点（s个节点），这样每个节点负责的分区数就是1000/s份分区

数据同步

Dynamo的一个节点中的同步是由client端来“解决”的，使用所谓的（N,R,W）模型，其中，N表示节点中机器的总数，R表示一个读请求需要的机器参与总数，W代表一个写请求需要的机器参与总数，这些值由client端配置。

　　例如，一个节点有5台机器（N=5），client发出写请求——广播到5台机，如果收到3个“写完成”的返回消息，即认为写成功（W=3）；client发出读请求——还是广播到5台机，如果收到2个“读完成”的返回消息，即认为读成功（R=2）。

对于数据十分重要的应用（如金融），配置可以为（5,5,5），即要求node中所有机器的写都成功；而对于数据读写访问量极高的应用，配置可以为（5,1,1）。

　　通常W不等于N，于是，在某些情况下一个节点内的机器上的数据可能会有不一致，这时Dynamo是通过将多个Read的返回结果“合并”来得出最终结果的，使用了所谓ObjectVersion和Vectorclock的技术，即跟踪一个Object在不同机器上的版本变化，以确保当多个Read请求结果返回不一致时，能够更具其版本信息得出正确的结果。

Dynamo的这种做法是一种折中，即为了同时保证读和写的效率，写操作不要求绝对同步，而把不同步可能产生的后果推给了读操作。

数据恢复

Dynamo的一个节点中一台机器建有一个MerkleTree，当两台机器不一致时（如一台机器宕机一段时间），通过这个tree结构，可以快速定位不一致的Object来恢复数据。

MerkleTree又叫HashTree，它把key分成几个范围，每个范围算出一个hash值，作为叶子，再一层层合并计算上去，这样，从根节点开始比较hash值，就可以快速找到哪几段范围中的hash值变化了。

可用性的补救（常见问题的解决方法）

第一个是hintedhandoff数据的加入：

在一个节点出现临时性故障时，数据会自动进入列表中的下一个节点进行写操作，并标记为handoff数据，在收到通知需要原节点恢复时重新把数据推回去。

这能使系统的写入成功大大提升。

　　第二个是向量时钟来做版本控制：

用一个向量（比如说[a,1]表示这个数据在a节点第一次写入）来标记数据的版本，这样在有版本冲突的时候，可以追溯到出现问题的地方。

这可以使数据的最终一致成为可能。

（Cassandra未用vectorclock，而只用clienttimestamps也达到了同样效果。

）

　　第三个是Merkletree来提速数据变动时的查找：

使用Merkletree为数据建立索引，只要任意数据有变动，都将快速反馈出来。

　　第四个是Gossip协议：

一种通讯协议，目标是让节点与节点之间通信，省略中心节点的存在，使网络达到去中心化。

提高系统的可用性。

5.ApacheCassandra

简介

ApacheCassandra是一套开源分布式Key-Value存储系统。

它最初由Facebook开发，用于储存特别大的数据。

Facebook目前在使用此系统。

主要特征

Cassandra的主要特点就是它不是一个数据库，而是由一堆数据库节点共同构成的一个分布式网络服务，对Cassandra的一个写操作，会被复制到其他节点上去，对Cassandra的读操作，也会被路由到某个节点上面去读取。

对于一个Cassandra群集来说，扩展性能是比较简单的事情，只管在群集里面添加节点就可以了。

Cassandra是一个混合型的非关系的数据库，类似于Google的BigTable。

其主要功能比Dynomite（分布式的Key-Value存储系统）更丰富，但支持度却不如文档存储MongoDB。

Cassandra最初由Facebook开发，后转变成了开源项目。

它是一个网络社交云计算方面理想的数据库。

以Amazon专有的完全分布式的Dynamo为基础，结合了GoogleBigTable基于列族（ColumnFamily）的数据模型。

P2P去中心化的存储。

很多方面都可以称之为Dynamo2.0。

分布式

基于column的结构化

高伸展性

和其它数据库相比，其突出的特点

模式灵活

使用Cassandra，像文档存储，你不必提前解决记录中的字段。

你可以在系统运行时随意的添加或移除字段。

这是一个惊人的效率提升，特别是在大型部署上。

真正的可扩展性

Cassandra是纯粹意义上的水平扩展。

为给集群添加更多容量，可以指向另一台电脑。

你不必重启任何进程，改变应用查询，或手动迁移任何数据。

多数据中心识别

你可以调整你的节点布局来避免某一个数据中心起火，一个备用的数据中心将至少有每条记录的完全复制

范围查询

如果你不喜欢全部的键值查询，则可以设置键的范围来查询。

列表数据结构

在混合模式可以将超级列添加到5维。

对于每个用户的索引，这是非常方便的。

分布式写操作

有可以在任何地方任何时间集中读或写任何数据。

并且不会有任何单点失败。

6.HBase

简介

HBase–HadoopDatabase，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。

HBase是GoogleBigtable的开源实现，类似GoogleBigtable利用GFS作为其文件存储系统，HBase利用HadoopHDFS作为其文件存储系统；Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用HadoopMapReduce来处理HBase中的海量数据；GoogleBigtable利用Chubby作为协同服务，HBase利用Zookeeper作为对应。

7.MemBase

简介

Membase是开源项目，源代码采用了Apache2.0的使用许可。

Membase容易安装、操作，可以从单节点方便的扩展到集群，而且为memcached（有线协议的兼容性）实现了即插即用功能，在应用方面为开发者和经营者提供了一个比较低的门槛。

做为缓存解决方案，Memcached已经在不同类型的领域（特别是大容量的Web应用）有了广泛的使用，其中Memcached的部分基础代码被直接应用到了Membase服务器的前端。

　　通过兼容多种编程语言和框架，Membase具备了很好的复用性。

在安装和配置方面，Membase提供了有效的图形化界面和编程接口，包括可配置的告警信息。

　　Membase的目标是提供对外的线性扩展能力，包括为了增加集群容量，可以针对统一的节点进行复制。

另外，对存储的数据进行再分配仍然是必要的。

这方面的一个有趣的特性是NoSQL解决方案所承诺的可预测的性能，类准确性的延迟和吞吐量。

通过如下方式可以获得上面提到的特性：

自动将在线数据迁移到低延迟的存储介质的技术（内存，固态硬盘，磁盘）

可选的写操作一一异步，同步（基于复制，持久化）

反向通道再平衡[未来考虑支持]

多线程低锁争用

尽可能使用异步处理

自动实现重复数据删除

动态再平衡现有集群

通过把数据复制到多个集群单元和支持快速失败转移来提供系统的高可用性。

展开阅读全文