百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Day1 网络世界入门:从打开浏览器到数据抵达的全过程

nanshan 2025-03-30 19:23 19 浏览 0 评论

在当今数字化时代,网络已成为我们生活中不可或缺的一部分。每天,我们无数次打开浏览器,输入网址,瞬间就能获取到来自世界各地的信息。但你是否想过,从我们在浏览器中敲下网址的那一刻,到数据最终呈现在屏幕上,这背后究竟经历了怎样的过程?今天,就让我们一起揭开网络世界神秘的面纱,深入了解从打开浏览器到数据抵达的全过程。

输入网址:一切的开始

当我们在浏览器的地址栏中输入网址,比如 “www.baidu.com”,这一简单的操作其实开启了一段复杂的旅程。网址,专业术语称为 URL(统一资源定位符),它就像是网络世界的门牌号。以 “https://www.baidu.com/s?wd=网络知识” 为例,“https” 是协议,告诉浏览器使用何种方式与服务器通信;“www.baidu.com” 是域名,对应着服务器的地址;“s” 是路径,指示服务器上的具体资源位置;“wd = 网络知识” 则是参数,用于向服务器传递我们的搜索需求等信息。

在输入网址后,浏览器首先要做的是将域名转换为对应的 IP 地址。因为在网络中,计算机之间是通过 IP 地址来相互识别和通信的。这就需要借助 DNS(域名系统),它如同网络世界的电话簿。当浏览器发现本地缓存中没有该域名对应的 IP 地址时,就会向本地 DNS 服务器发送查询请求。本地 DNS 服务器若在自己的缓存中也未找到匹配项,便会向上级 DNS 服务器,如根域名服务器、顶级域名服务器等发起查询,直至找到该域名对应的 IP 地址,然后将其返回给浏览器。[此处插入一张 DNS 查询流程的示意图,例如从本地 DNS 到根域名服务器、顶级域名服务器再到权威域名服务器的查询路径图]

建立连接:数据传输的桥梁

获取到 IP 地址后,浏览器需要与目标服务器建立连接。最常用的连接方式是基于 TCP(传输控制协议)的三次握手。第一次握手,浏览器(客户端)向服务器发送一个带有 SYN(同步序列号)标志的数据包,告诉服务器自己想要建立连接,并随机生成一个初始序列号 seq=x。此时,客户端进入 SYN_SENT 状态。第二次握手,服务器收到客户端的请求后,会返回一个带有 SYN 和 ACK(确认)标志的数据包。其中,SYN 标志用于同步服务器的序列号,假设为 seq=y,ACK 标志则用于确认收到客户端的请求,确认号 ack=x+1。此时,服务器进入 SYN_RCVD 状态。第三次握手,客户端收到服务器的响应后,再发送一个带有 ACK 标志的数据包,确认号 ack=y+1,告诉服务器自己已收到服务器的确认信息。至此,双方成功建立起可靠的 TCP 连接,进入 ESTABLISHED 状态,为数据传输做好了准备。[插入一张 TCP 三次握手的动态示意图,清晰展示三次握手过程中数据包的交互]

发送请求:传递用户的需求

连接建立后,浏览器会根据我们输入的网址和操作,构建 HTTP(超文本传输协议)请求报文。如果是普通的网页访问,可能是一个 GET 请求,请求报文中会包含我们请求的资源路径等信息。例如,我们访问百度首页,请求报文大致如下:

GET / HTTP/1.1

Host: www.baidu.com

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9

Accept-Encoding: gzip, deflate, br

Accept-Language: zh-CN,zh;q=0.9

在这个请求报文中,“GET” 表示请求方法,“/” 是请求的资源路径,“HTTP/1.1” 是协议版本。“Host” 字段指定了目标服务器的域名,“User-Agent” 字段描述了客户端的信息,如浏览器类型、操作系统等,这些信息有助于服务器返回适合客户端显示的内容。“Accept” 系列字段则告诉服务器客户端支持的响应内容类型、编码方式和语言等。

浏览器将构建好的 HTTP 请求报文交给传输层,传输层会在其基础上添加 TCP 头部,然后再交给网络层添加 IP 头部,最终形成一个完整的数据包,准备在网络中传输。

数据传输:穿越复杂的网络

数据包从我们的计算机出发,首先会经过本地网络,如家庭或办公室的路由器。路由器就像是网络中的交通枢纽,它会根据数据包的目标 IP 地址,在自己的路由表中查找最佳的转发路径。例如,如果目标 IP 地址属于外网,路由器会将数据包转发到与外网连接的接口。在这个过程中,还会涉及到 ARP(地址解析协议),它负责将目标 IP 地址解析为对应的 MAC(媒体访问控制)地址,因为在局域网内,数据是通过 MAC 地址来进行传输的。[插入一张局域网内数据传输,从计算机到路由器,涉及 ARP 解析的示意图]

数据包离开本地网络后,会在互联网的骨干网络中穿梭。这期间,它可能会经过多个路由器、交换机等网络设备。每个设备都会根据自己的规则和配置,对数据包进行转发、路由等处理,就像接力赛一样,将数据包一步步传向目标服务器所在的网络。在传输过程中,为了确保数据的完整性和可靠性,TCP 协议会对数据包进行编号和确认。如果某个数据包在传输过程中丢失或损坏,接收方会要求发送方重新发送。

服务器响应:提供所需的数据

当数据包最终抵达目标服务器时,服务器会首先检查 IP 头部和 TCP 头部,确认数据包的来源和完整性。然后,将 TCP 头部和 IP 头部剥离,提取出 HTTP 请求报文,交给服务器上运行的 Web 服务程序进行处理。例如,对于百度服务器来说,它会根据请求报文中的路径和参数,如 “/s?wd = 网络知识”,在自己的数据库中查找相关的网页内容和搜索结果。

服务器根据请求生成 HTTP 响应报文,响应报文的格式与请求报文类似,同样包含状态行、头部和正文。例如,一个成功的响应报文可能如下:

HTTP/1.1 200 OK

Content-Type: text/html; charset=utf-8

Content-Length: 12345

Server: Apache/2.4.41 (Ubuntu)

Date: Sun, 16 Aug 2020 10:20:30 GMT

Last-Modified: Sat, 15 Aug 2020 15:30:00 GMT

Cache-Control: max-age=3600

Expires: Sun, 16 Aug 2020 11:20:30 GMT

百度搜索结果

...

...

在这个响应报文中,“HTTP/1.1 200 OK” 是状态行,表示请求成功,“200” 是状态码。“Content-Type” 字段指定了响应内容的类型为 HTML,字符编码为 UTF-8。“Content-Length” 字段告诉客户端响应正文的长度。服务器还会在头部添加一些其他信息,如服务器软件类型、日期、缓存控制等。然后,服务器将响应报文通过网络原路返回给客户端。

接收数据:呈现精彩的内容

客户端(浏览器)接收到服务器返回的响应数据包后,同样会先经过网络层和传输层的处理,剥离 IP 头部和 TCP 头部,提取出 HTTP 响应报文。浏览器会根据响应报文中的内容类型,如 HTML、CSS、JavaScript、图片等,进行相应的解析和渲染。

对于 HTML 页面,浏览器会按照 HTML 的语法规则,将其解析为文档对象模型(DOM)树。然后,根据 CSS 样式表对 DOM 树中的元素进行样式渲染,确定每个元素在页面中的位置、颜色、字体等外观属性。如果页面中包含 JavaScript 脚本,浏览器会逐行解析和执行脚本,实现页面的交互功能,如动态更新页面内容、响应用户的点击事件等。最后,浏览器将渲染好的页面呈现给我们,我们便看到了期待已久的网页内容。

从打开浏览器到数据抵达,这看似简单的操作背后,蕴含着计算机网络领域众多复杂而精妙的技术和原理。了解这一过程,不仅能让我们更好地理解网络世界的运行机制,也有助于我们在日常使用网络时,更好地排查问题、优化网络体验。在后续的文章中,我们还将深入探讨网络世界的更多奥秘,敬请期待。

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)

文档编写目的在前面的文档中,介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0,本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0,与之前安装C5进行对比。环境介绍:...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes

为什么要在arm64平台上部署Kubernetes,而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息;o架构:鲲鹏920(Kunpeng920)oOS:ope...

生产环境starrocks 3.1存算一体集群部署

集群规划FE:节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级

现如今很多云服务器都会自己配置好虚拟内存,当然也有很多没有配置虚拟内存的,虚拟内存可以让我们的低配服务器使用更多的内存,可以减少很多硬件成本,比如我们运行很多服务的时候,内存常常会满,当配置了虚拟内存...

国产深度(deepin)操作系统优化指南

1.升级内核随着deepin版本的更新,会自动升级系统内核,但是我们依旧可以通过命令行手动升级内核,以获取更好的性能和更多的硬件支持。具体操作:-添加PPAs使用以下命令添加PPAs:```...

postgresql-15.4 多节点主从(读写分离)

1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案

一、设置Docker容器内存限制(生产环境建议)1.查看宿主机可用内存bashfree-h#示例输出(假设宿主机剩余16GB可用内存)#Mem:64G...

虚拟内存设置、解决linux内存不够问题

虚拟内存设置(解决linux内存不够情况)背景介绍  Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存...

Elasticsearch性能调优(5):服务器配置选择

在选择elasticsearch服务器时,要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低,则意味着需要更多的节点来满足需求,一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高,...

Es如何落地

一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结

现在的服务器大部分都是运行在Linux上面的,所以,作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道:地址映射内存管理的方式缺页异常先来看一些基本的知识,在进程看来,内存分为内...

MySQL进阶之性能优化

概述MySQL的性能优化,包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前,需要先掌握性能分析的思路和方法,找出问题,...

Linux Cgroups(Control Groups)原理

LinuxCgroups(ControlGroups)是内核提供的资源分配、限制和监控机制,通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析:一、核心原理与...

linux 常用性能优化参数及理解

1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?

sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互,允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为,包括网络设置、文件...

取消回复欢迎 发表评论: