秒杀:用CDN把请求处理在服务器之外

一. 前言

后端程序员碰到这个概念的场景其实不多,我首次碰到还是在搭建自己博客网站的时候。

用最直观的场景来描述就是 : 买的服务器带宽太低,导致前端下载静态文件卡顿。

解决的方式是 : 将域名配置 CDN , 让静态文件获取不走后端服务器。

在高并发的系统中, CDN 可以帮助用户对静态文件分流,减少服务器负载.

二. 先看流程

2.1 原本的问题

  1. 请求直接打到业务源服务器上面,占用资源(带宽,CPU,端口,内存等等)
  2. 请求很难就近选择服务端,数据传输过程长,稳定性差,延时高
  3. 恶意请求会直接打到服务器上,增加风险
  4. 稳定性差,业务稳定性依赖于源服务器的可用性

2.2 CDN 的处理流程

image.png

  1. 当用户向源域名 (image.a.com) 发起请求的时候,会发起 DNS 查询
  2. DNS 基于源域名通过 CNAME 获取到 CDN 域名 (dns.a.com
  3. 请求在 CDN 服务节点中,通过智能路由选择最近的 CDN 节点 (PS :这一步也可以通过负载均衡 DNS 实现)
  4. 用户获取解析IP 地址 , 向 IP 地址发起访问
  5. 访问 CDN 节点如果没有缓存,则透传到源节点访问,同时回写 CDN

关于智能路由

智能路由是指根据用户的地理位置、网络状况和其他条件,动态地选择最优的 CDN 节点来提供内容。

这个机制可以在 CDN 服务节点中实现,也可以在 DNS 服务集群中实现。从阿里藏经阁中找到的文档就能看到 :

image.png

扫描二维码关注公众号,回复: 16517788 查看本文章

通过 DNS 调度服务找到了对应最近的 IP ,再直接访问对应的 IP 地址。

三. 再看使用

以某云为例,当初几块钱搞了一个域名 :

image.png

先看专业术语

  • CDN : 内容分发网络 (Content Delivery Network)
  • 边缘节点 : 即 CDN 节点 ,本质上是部署在全球的服务器,用于缓存和分发内容
  • Cache 缓存 : 即 CDN 上缓存的请求内容
  • 源站 : 存储网站或应用程序内容的实际服务器
  • 回源 : 当用户请求的内容在 CDN 节点上没有缓存时,CDN 节点向源站服务器请求获取内容,并将其缓存到节点上
  • 缓存命中和缓存未命中 : 存在缓存时则为缓存命中
  • 清除缓存 : 当数据不正确时,需要把 CDN 节点上的内容清除
  • DDoS 防护 : 帮助抵御恶意的 DDoS 攻击

四. 深入原理

4.1 怎么把 CDN 配置到 DNS 里面

第一步就是让请求打到 CDN 服务器 ,而不是源服务器。要实现这一步最终还是需要 DNS 的配合

 
 

java

复制代码

// 方式一 : CNAME 记录 - 1. CDN 服务提供商提供一个用于 CDN 的域名 - 2. 在 DNS 解析服务提供商 中配置 CNAME , 将源域名指向 CDN 域名 - 3. DNS 辅助访问源域名时自动指向 CDN 域名 // 方式二 : A 记录 - 1. 从 CDN 服务商处获取 CDN 节点的 IP 列表 - 2. 将 IP 列表配置到 DNS 的 A 记录中,走常规的 DNS 解析 IP 的流程

CNAME 是什么 ?

  • CNAME 是 DNS 记录类型之一,全称为“Canonical Name”(规范名字)
  • CNAME 是创建了一个域名的别名,将一个域名指向另外一个域名
  • 通过 CNAME 可以把加速域名指向 CDN 域名,这样 DNS 就能将请求解析到 CDN 域名

A 记录是什么 ?

  • DNS 的基础概念,用于将域名映射到 IPv4 地址
  • 一个域名可以配置多个 IP 地址

4.2 CDN 命中失败的原因

  • 客户端请求是动态请求
  • 源站返回强制不缓存的HTTP 头
  • 未返回响应头Etag 和Last-modified
  • 全站加速未配置静态加速

4.3 CDN 缓存慢的原因

  • 刷新缓存,可能导致短时间内命中率下降。
  • 带宽突增,会导致CDN 节点回源较多,命中率会表现有下降趋势。
  • CDN 节点访问新内容,导致CDN 节点回源较多,命中率会表现有下降趋势。
  • 缓存规则调整,可能会影响命中率。

五. 成本估算及场景

5.1 成本估算

  • 参考国内的阿里云和腾讯云 ,10TB的 CDN 总量大概在 1200 左右
  • 掘金里面第一次访问一个页面的流量大概在3M左右 (后续访问会走本地缓存,这一块实际上不会走到 CDN)
  • 那么 10TB CDN 平均可以支持 300万 次单页面的访问 (假设忽略浏览器缓存和大图片)

这个价格相比扩充带宽肯定是更划算的,带宽闲时供应商可不会给你减钱哦,同时处理网络请求带来的负载消耗也不小。

看了一下掘金的 img 确实走的 CDN 。

image.png

5.2 适用场景

  • 静态文件缓存 : 如图片、样式表、脚本等
  • 流媒体和视频分发 : 分发流媒体和视频内容,减少视频加载时间和缓冲
    • (不过我感觉流媒体走 DNS 效果可能不好)
  • 动态内容加速 :应该是基于关键字进行缓存,功能肯定没有服务端的强大
  • 全球负载均衡 :根据用户的地理位置和网络状况,将请求路由到最优的服务器节点
  • 高峰期缓存预热 :支持缓存内容的刷新和预热,确保内容更新后能及时生效

5.3 一般服务商会提供的功能

  • 访问控制 :白名单 、 盗链 、鉴权 、QPS 、限速 、端口限制 等等
  • 缓存规则 :基于缓存键 ,基于状态码 ,基于 HTTP 头部 ,缓存过期时间等等
  • 回源方式 : 分片 ,回源请求头配置 , 超时时间等等
  • HTTPS 配置 : 版本,配置等
  • 定制化 : 错误页面,指定状态码,压缩等等

总结

这篇是系列文章的第一篇,后续会陆陆续续把并发场景的知识点详细的过一遍。

想做一个秒杀的全流程系列文章,只能做后端层面的压测,所以前端限制这一块只能通过概念的形式展现了~~

CDN 原理了解就行,应用使用供应商的服务即可,基本上云开发商都提供了这些服务接口。

猜你喜欢

转载自blog.csdn.net/Trouvailless/article/details/132024296