NoSQL——非关系型数据库——Redis

前言
一、关系数据库与非关系型数据库
二、Redis 简介
- 1. Redis 优点
三、编译部署
总结

前言

一、关系数据库与非关系型数据库

1. 关系型数据库

关系型数据库是一个结构化的数据库，创建在关系模型 (二维表格模型) 基础上，一般面向于记录。
SQL语句 (标准数据查询语言) 就是一种基于关系型数据库的语言，用于执行对关系型数据库中数据的检索和操作。
主流的关系型数据库包括Oracle、MySQL(mariadb)、SQL Server、Microsoft Access、DB2等。

2. 非关系型数据库

NoSQL (NoSQL=NotOnlySQL)，意思是“不仅仅是SQL”，是非关系型数据库的总称。
除了主流的关系型数据库外的数据库，都认为是非关系型。
主流的 NoSQL 数据库有Redis、 MongoDB、 Hbase、 Memcached、Postgresql等。

3. 关系型数据库和非关系型数据库区别

3.1 数据存储方式不同

关系型和非关系型数据库的主要差异是数据存储的方式。关系型数据天然就是表格式的，因此存储在数据表的行和列中。数据表可以彼此关联协作存储，也很容易提取数据。

与其相反，非关系型数据不适合存储在数据表的行和列中，而是大块组合在一起。非关系型数据通常存储在数据集中，就像文档、键值对或者图结构。你的数据及其特性是选择数据存储和提取方式的首要影响因素。

① 关系型：依赖于关系模型E-R图，同时以二维表格式的方式存储数据
② 非关系型：除了以表格形式存储之外，通常会以大块的形式组合在一起进行存储数据

3.2 扩展方式不同

SQL和NoSQL数据库最大的差别可能是在扩展方式上，要支持日益增长的需求当然要扩展。

要支持更多并发量，SQL数据库是纵向扩展，也就是说提高处理能力，使用速度更快速的计算机，这样处理相同的数据集就更快了。因为数据存储在关系表中，操作的性能瓶颈可能涉及很多个表，这都需要通过提高计算机性能来克服。虽然SQL数据库有很大扩展空间，但最终肯定会达到纵向扩展的上限。

而NoSQL数据库是横向扩展的。因为非关系型数据存储天然就是分布式的，NoSQL数据库的扩展可以通过给资源池添加更多普通的数据库服务器 (节点) 来分担负载。

① 关系：纵向（天然表格式）
② 非关：横向（天然分布式）

3.3 对事务性的支持不同

如果数据操作需要高事务性或者复杂数据查询需要控制执行计划，那么传统的SQL数据库从性能和稳定性方面考虑是最佳选择。SQL数据库支持对事务(ACID)原子性细粒度控制，并且易于回滚事务。

虽然NoSQL数据库也可以使用事务操作，但稳定性方面没法和关系型数据库比较，所以它们真正闪亮的价值是在操作的扩展性和大数据量处理方面。

① 关系型：特别适合高事务性要求和需要控制执行计划的任务
② 非关系：此处会稍显弱势，其价值点在于高扩展性和大数据量处理方面

4. 非关系型数据库产生背景

可用于应对Web2.0纯动态网站类型的三高问题。

① High performance-------对数据库高并发读写需求
② HugeStorage--------------对海量数据高效存储与访问需求
③ High Scalability && High Availability------- 对数据库高可扩展性与高可用性需求

关系型数据库和非关系型数据库都有各自的特点与应用场景，两者的紧密结合将会给Web2.0的数据库发展带来新的思路。让关系数据库关注在关系上，非关系型数据库关注在存储上。例如，在读写分离的MySQL数据库环境中，可以把经常访问的数据存储在非关系型数据库中，提升访问速度。

Mysql 高热数据——》redis
web ——》redis ——》mysql
CPU——》内存/缓存 ——》磁盘

二、Redis 简介

Redis是一个开源的、使用C语言编写的NoSQL 数据库。
Redis基于内存运行并支持持久化(支持存储在磁盘)，采用key-value (键值对)的存储形式，是目前分布式架构中不可或缺的一环。

Redis服务器程序是单进程模型

Redis服务在一台服务器上可以同时启动多个Redis进程，Redis的实际处理速度则是完全依靠于主进程的执行效率。若在服务器上只运行一个Redis进程，当多个客户端同时访问时，服务器的处理能力是会有一定程度的下降；若在同一台服务器上开启多个Redis进程，Redis在提高并发处理能力的同时会给服务器的CPU造成很大压力。即：在实际生产环境中，需要根据实际的需求来决定开启多少个Redis进程。

建议可以开2个进程
原因：
1、备份
2、抗高并发的同时尽量不给CPU造成太大的压力

若对高并发要求更高一些，可能会考虑在同一台服务器上开启多个进程。若CPU资源比较紧张，采用单进程即可。

单进程快速的原因：
PS ：补充加深一点
使用 epoll（默认） + I/O多路复用机制
首先，Redis 是跑在单进程中的，所有的操作都是按照顺序线性执行的，但是由于读写操作等待用户输入或输出都是阻塞的，所以 I/O 操作在一般情况下往往不能直接返回，这会导致某一文件的 I/O 阻塞导致整个进程无法对其它客户提供服务，而 I/O 多路复用就是为了解决这个问题而出现的。
epoll 机制优势：

epoll 没有最大并发连接的限制，上限是最大可以打开文件的数目，这个数字一般远大于 2048, 一般来说这个数目和系统内存关系很大，具体数目可以 cat /proc/sys/fs/file-max 察看。

效率提升， Epoll 最大的优点就在于它只管你“活跃”的连接，而跟连接总数无关，因此在实际的网络环境中， Epoll 的效率就会远远高于 select 和 poll 。

内存拷贝， Epoll 在这点上使用了“共享内存 ”，这个内存拷贝也省略了
I/O多路复用就通过一种机制，可以监视多个描述符，一旦某个描述符就绪，能够通知程序进行相应的操作。

epoll模型所实现的I/O多路复用可以定义为如下：

socket 1 —>
socket 2 —> I/O多路复用程序 --》文件事件分派器（从队列中获取，再分发给对应处理器）–》命令处理、请求、连接应答等处理器
socket 3 —>

多个socket 会定义为一个fd文件描述符（每有一个新建、打开、修改等“事件”内核就会返回一个fd（可理解为索引）），在每个fd激活时，会进行内核中的回调函数

I/O多路复用程序会监听socket 活跃的链接，然后调用该socket （而此socket 文件句柄主要实现的是网络上的“ip+port+协议所标识的网络中的‘进程’”）可以简单理解为虚拟接口（抽象层）
本质而言就是使用一个线程来追踪多个socket（I/O流）的状态，来管理多个I/O

I/O复用：一个线程同时追踪、管理多个连接（原本默认情况下是一个线程对应一个连接）
回调：预先定义具体的执行过程（定义一个方法），等待调用，在一个线程给执行时，可以根据“触发器”“钩子” 完成回调，回调的目的
是提高处理性能和节省资源

1. Redis 优点

redis 特性（与其他nosql对比）

具有极高的数据读写速度：数据读取的速度最高可达到 110000 次/s，数据写入速度最高可达到 81000 次/s。
支持丰富的数据类型：支持key-value、 Strings、Lists、 Hashes（散列值）、 Sets 及Ordered Sets 等数据类型操作。

ps:
string 字符串（可以为整形、浮点和字符型，统称为元素）
list 列表：（实现队列，元素不唯一，先入先出原则）
set 集合：（各不相同的元素）
hash hash散列值：（hash的key必须是唯一的）
set /ordered sets 集合/有序集合

支持数据的持久化：可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。
原子性：Redis所有操作都是原子性的。
支持数据备份：即master-salve 模式的数据备份。

丰富的特性 – Redis还支持 publish（消息发布）/subscribe（订阅）, 通知, 设置key有效期等等特性。

Redis作为基于内存运行的数据库，缓存是其最常应用的场景之一。除此之外，Redis常见应用场景还包括获取最新N个数据的操作、排行榜类应用、计数器应用、存储关系、实时分析系统、日志记录。

支持key-value、 Strings、Lists、 Hashes（散列值）、 Sets 及Ordered Sets 等数据类型操作。

三、编译部署

1. Redis安装部署

systemctl stop firewalld
setenforce 0

yum install -y gcc gcc-c++ make

yum repolist
重新yum
yum install -y gcc*

#将redis-5.0.7.tar.gz 压缩包上传到/opt 目录中
tar zxvf redis-5.0.7.tar.gz -C /opt/

cd /opt/redis-5.0.7/
make
make PREFIX=/usr/local/redis install
#由于Redis源码包中直接提供了Makefile 文件，所以在解压完软件包后，不用先执行./configure 进行配置，可直接执行make与make install命令进行安装

#执行软件包提供的 install_server.sh 脚本文件设置Redis服务所需要的相关配置文件
cd /opt/redis-5.0.7/utils 
./install_server.sh       
.......          #一直回车.
Please select the redis executable path [/usr/local/bin/redis-server] /usr/local/redis/bin/redis-server
#需要手动修改为 /usr/local/redis/bin/redis-server    注意要一次性正确输入
-------------------------------------------------------------------------------------
Selected config:
Port               : 6379                               #默认侦听端口为6379
Config file        : /etc/redis/6379.conf               #配置文件路径
Log file           : /var/log/redis_6379.log            #日志文件路径
Data dir           : /var/lib/ redis/6379               #数据文件路径
Executable         : /usr/local/redis/bin/redis-server  #可执行文件路径
Cli Executable     : /usr/local/redis/bin/redis-cli     #客户端命令工具
-------------------------------------------------------------------------------------


#把redis的可执行程序文件放入路径环境变量的目录中便于系统识别
ln -s /usr/local/redis/bin/* /usr/local/bin/

#当install_server.sh 脚本运行完毕，Redis 服务就已经启动，默认侦听端口为6379
netstat -natp | grep redis

#Redis服务控制
/etc/init.d/redis_6379 stop       #停止
/etc/init.d/redis_6379 start      #启动
/etc/init.d/redis_6379 restart    #重启
/etc/init.d/redis_6379 status     #状态

#修改配置 /etc/redis/6379.conf 参数
vim /etc/redis/6379.conf
bind 127.0.0.1 192.168.226.129      #70行，添加监听的主机地址
port 6379                          #93行，Redis默认的监听端口
daemonize yes                      #137行，启用守护进程
pidfile /var/run/redis_6379.pid    #159行，指定PID文件
loglevel notice                    #167行，日志级别
logfile /var/log/redis_6379.log    #172行，指定日志文件


/etc/init.d/redis_6379 restart

代码如下（示例）：

data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())

2. Redis命令工具

redis-server: 用于启动Redis 的工具
redis-benchmark: 用于检测Redis在本机的运行效率
redis-check-aof: 修复AOF持久化文件
redis-check-rdb: 修复RDB持久化文件
redis-cli: Redis 命令行工具

rdb 和aof 是redis服务中持久化功能的两种形式RDB AOF
redis-cli 常用于登陆至redis 数据库

3. redis-cli 命令行工具（远程登陆）

语法：

redis-cli -h host -p port -a password

-h :指定远程主机
-p :指定Redis 服务的端口号
-a :指定密码，未设置数据库密码可以省略-a选项
若不添加任何选项表示，则使用127.0.0.1:6379 连接本机上的 Redis 数据库

redis-cli -h 192.168.237.123 -p 6379

4. redis-benchmark 测试工具

redis-benchmark 是官方自带的 Redis 性能测试工具，可以有效的测试 Redis 服务的性能。

基本的测试语法：

redis-benchmark [选项] [选项值]

-h :指定服务器主机名。
-p :指定服务器端口。
-s :指定服务器socket（套接字）
-c :指定并发连接数。
-n :指定请求数。
-d :以字节的形式指定 SET/GET 值的数据大小。
-k : 1=keep alive  0=reconnect
-r : SET/GET/INCR 使用随机key, SADD使用随机值。
-P :通过管道传输<numreq>请求。
-q :强制退出redis。 仅显示query/sec 值。
--csv :以CSV格式输出。
-l :生成循环，永久执行测试。
-t :仅运行以逗号分隔的测试命令列表。
-I : Idle模式。仅打开 N 个idle连接并等待。

#向IP地址为192.168.237.123、端口为6379 的Redis 服务器发送100个并发连接与100000 个请求测试性能
redis-benchmark -h 192.168.237.123 -p 6379 -c 100 -n 100000

#测试存取大小为100字节的数据包的性能
redis-benchmark -h 192.168.237.123 -p 6379 -q -d 100

#测试本机上Redis 服务在进行set与lpush操作时的性能
redis-benchmark -t set,lpush -n 100000 -q

#测试本机上Redis 服务在进行set与lpush操作时的性能

NoSQL——非关系型数据库——Redis

NoSQL——非关系型数据库——Redis

前言

一、关系数据库与非关系型数据库

1. 关系型数据库

2. 非关系型数据库

3. 关系型数据库和非关系型数据库区别

3.1 数据存储方式不同

3.2 扩展方式不同

3.3 对事务性的支持不同

4. 非关系型数据库产生背景

二、Redis 简介

1. Redis 优点

三、编译部署

1. Redis安装部署

2. Redis命令工具

3. redis-cli 命令行工具（远程登陆）

4. redis-benchmark 测试工具

总结

猜你喜欢