数据库系统概论(新技术篇)--中国人民大学【第13讲】

 人大:第13讲

市面上主流的分布式文件系统(FS):
(Hadoop的)HDFS,(Google的)GFS

数据服务与键值对数据库:

数据服务:data serving
  数据服务:数据的简单读写
  数据库事务:也算一种数据服务,但属于mission-critical,较为复杂的数据服务

数据服务起源:
优化布局
日志分析,用户画像,写用户属性
高并发的数据读写
数据规模大
属性动态增减

键值对数据库:

数据库v.s.键值对数据库
吞吐量大;可扩展性好,复杂性简单;最终一致性;接口:API;成本低

为什么不直接使用HashTable?
动态列增减,实现不便

为什么不直接使用关系数据库表?
大量空值,高并发
动态列增减

数据模型:


3.键值数据库原理:
分布式系统的3个属性:只能满足2个,舍弃1个

分布式:必须满足P,一般CP
传统:保证CA,舍弃P

牺牲:
链接操作,group by,order  by,sql
换取高性能,高吞吐的。。

(键值对数据库的代表)
HBase系统架构

Region
HMaster

存储格式:
HFile

实现:
写操作:memtable
读操作:sstable

典型键值对数据库:
BigTable,Redis,

大HashT:


NeqSql保持了ACID
NoSql没有

猜你喜欢

转载自www.cnblogs.com/musecho/p/10992244.html