百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

什么是 CDN 什么是CDN网络

nanshan 2024-12-18 16:00 19 浏览 0 评论

CDN 是一种用来分发内容的网络拓扑结构,在彻底搞明白它之前,我们需要先来理解另外两个名词。

1、节点

用户使用CDN网络前,CDN提供商会在全国/全球部署多个节点。这里的节点可以看做机房,或者服务器集群,专业的称呼是PoP(Point-of-Presence,入网点)或者边缘服务器(Origin Server)。每个节点用来服务它周围的用户,因为距离近,所以响应时间短。另外,节点是由很多服务器构成的集群,所以能够抗住巨大流量。

2、源服务器

源服务器就是你部署网站的服务器,它为整个CDN网络提供初始内容。不使用 CDN 的话,用户的每次请求都会到达你的源服务器。用户和源服务器之间的距离越远,数据包转发的次数就越多,等待页面加载的时间就越长。另外,数据包的每次转发都有可能受到网络拥堵的影响,进一步延迟网页加载时间。

尤其访问境外网站时,距离远,网络拥堵,用户往往需要等待3秒以上,这是所有用户都无法忍受的。如果你的网站使用了CDN加速,当用户请求你的网站时,CDN会找到离用户最近的节点,看看这个节点中是否缓存了用户想要的内容:如果节点缓存了用户想要的内容,就直接发送给用户,不用再去请求源服务器;如果节点没有缓存用户想要的内容,那么节点会自动请求源服务器获取想要的内容,然后再发送给用户;同时,节点也会把从源服务器获取的内容缓存起来,下次有用户再请求相同内容时,节点会直接发送给用户,而不用再去请求源服务器。只有在用户第一次请求内容时,节点才会访问源服务器,以后用户(包括新用户和老用户)再去请求相同内容,因为节点已经缓存了,所以会直接发送给用户,不会再去访问源服务器,此时源服务器就被“屏蔽”了,它不会知道有用户请求内容。

页面从源服务器拉取内容的过程,专业术语叫做反向代理(Reverse Proxy),向离你最近的服务器集群请求内容,这个速度是极快的,通常是秒级响应。现在全球有超过70%的流量由 CDN 提供,而且这个比例还在迅速上升。

现在我们再来看看“内容分发网络”这个术语,它实际上包含了 3 方面的内容:

  • 内容

CDN是用来处理内容的。什么内容?这包括动态/静态网页、CSS、JavaScript、图像、视频、音频、可下载的文件等。

  • 分发

CDN 会将内容分发到节点。如何分发?节点需要内容时自动从源服务器拉取,也即反向代理。

  • 网络

从CDN内部看,CDN是一种网络拓扑结构,或者说是一种私有网络/局域网。用户只和节点交换数据,并不知道 CDN 的内部网络结构,只有搭建 CDN 的机构才知道。总起来说,CDN是机构搭建的一种私有网络,它能将用户部署在源服务器上的内容分发到各个节点,从而提高网站的响应速度。用户和站长都不需要知道 CDN 的内部拓扑结构,却能享受 CDN 带来的好处。

CDN的原理虽然非常简单,但是它的内部架构其实非常复杂,涉及多级缓存、负载均衡、大数据处理、分布式存储、健康监控、热插拔等众多科研难题。

使用 CDN 的好处

  • 提高网站访问速度

这是CDN 的初衷,也是CDN的主要作用,CDN 能够极大或者成倍地提高网站访问速度,由于是距离源服务器较远的用户,感受更加明显。

  • 降低服务器压力

几乎90%以上的访问量都被边缘节点承接了,只有内容更新或者缓存到期时才需要访问源服务器,这样源服务器的压力就会小很多,廉价的配置就能撑起巨大的流量。

  • 让全国/全球用户访问网站

CDN节点遍布全国/全球,境外用户或者偏远地区用户也能访问你的网站。不使用CDN的话,有些地区可能因为网络原因无法访问你的网站。

  • 提高服务器安全性

用户请求先达到CDN网络最外层,用户不知道源服务器在哪里,源服务器的位置被 CDN 网络屏蔽了。不知道源服务器的位置,就无法攻击。

另外,CDN 网络一般自带防火墙或者安全措施,即使黑客尝试粗暴的 DDoS 攻击也压垮不了网站,CDN 会检测出这种攻击,屏蔽可疑 IP。即使不屏蔽 IP,凭借 CDN 网络的大集群和均衡负载能力,DDoS 流量也压垮不了 CDN。

  • 负载均衡

CDN自带负载均衡功能,不用担心突如其来的峰值流量,而你的源服务器不会感受到压力。

  • 7*24 小时服务

CDN已经缓存了网站内容,即使源服务器挂掉,用户也能够访问网站。

  • 减少开支

为了应对流量峰值,你必须租用配置强大的服务器,购买足够的带宽,这是一笔不小的开支。而大部分情况下,服务器的配置都是过剩的,你需要为应对极限场景多支出数倍的成本。使用了 CDN 的话,你可以将服务器的配置降到很低。CDN 一般都可以按量付费,你消耗多少流量就支付多少费用。

  • 降低运维成本

不稳定的网站,经常遭受攻击的网站,不但让用户烦躁,也不受搜索引擎的待见。很多小公司或者个人站长都没有能力保证网站安全,裸奔的服务器分分钟被拿下。CDN隐藏了你的服务器源站,让黑客不容易找到源头。CDN 还能帮你抵御粗暴的 DDoS 攻击,不使用 CDN 的话,DDoS 攻击基本是无解的。

如何架构网站

合理的架构让网站更适应于 CDN,降低成本的同时,也提高了安全性。如果你的网站在开发之初没有考虑使用 CDN,那你可能需要一些调整。

一般来说,架构适用于 CDN 的网站主要有两大原则:

1、动静分离

将网站的静态内容和动态内容分离。

静态内容指的是不随用户行为而改变的内容,比如文章、商品介绍等,不管用户是否登录,这些内容都是一样的。动态内容则反之,它随着用户的行为而改变,比如用户信息、留言列表、收藏按钮等。

一个页面往往会混合静态内容和动态内容,我们可以页面中使用 JavaScript 来加载动态内容。

为了降低请求次数,同时提高SEO效果,可以将用户评论、点击量、点赞量等看做静态内容,只要定期或者按照规则刷新 CDN 缓存即可。

CDN缓存可以设置失效时间,也可以主动刷新,一般的 CDN 都支持手动刷新或者 API 刷新(编程刷新)。

另外为了安全,最好准备两台服务器,一台放置静态内容并启用 CDN,一台放置动态内容不启用 CDN。放置动态内容的服务器更容易遭受攻击,即使动态内容服务器挂掉,也不影响静态内容的访问。

既然使用了不同的服务器,也应该为静态内容和动态内容设置不同的域名。

2、资源文件分离

资源文件是指那些内容几乎不会变动的文件,比如图片、视频、压缩包等。

由于网站模板更改、内容变动、用户评论、放置广告等诸多原因,静态内容需要经常更新,这个时候就需要刷新 CDN 缓存。我们通常可以针对一个 URL、一个目录、一个域名刷新 CDN 缓存。

尤其是针对一个域名刷新 CDN 缓存的时候,如果资源文件和静态内容位于同一个域名下,那么所有资源文件的缓存也会被刷新。资源文件的体积往往是静态内容的数倍,刷新资源文件不但会消耗很多流量,还会给源服务器带来不小的压力。

如果你为了提高 SEO 效果,将用户评论、点击量、收藏量等看做静态内容,那你就需要经常刷新域名下的所有静态内容,此时资源文件也会一并刷新。

为了避免资源文件被连带刷新,我非常建议为资源文件设置一个新的域名,该域名下只存储资源文件。但是,为资源文件启用新域名会增加开发成本,请读者自己权衡。

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: