拓展

(1). 说一下你对 HTTPS 的理解?

HTTPS 就是在 HTTP 和 TCP 协议中间加入了 SSL/TLS 安全套接层。

结合非对称加密和对称加密的各自优点，配合证书。既保证了安全性，也保证了传输效率。

目前应用最广泛的是 TLS1.2，实现原理如下：

Client 发送 random1+对称加密套件列表+非对称加密套件列表
Server 收到信息，选择对称加密套件+非对称加密套件并和 random2+证书(公钥在证书中) 一起返回
Client 验证证书有效性，并用 random1+random2 生成 pre-master 通过服务器公钥加密+浏览器确认发送给 Server
Server 收到 pre-master，根据约定的加密算法对 random1+random2+pre-master（解密）生成 master-secret，然后发送服务器确认
Client 收到生成同样的 master-secert，对称加密秘钥传输完毕

TLS1.3 则简化了握手过程，完全握手只需要一个消息往返，提升了性能。不仅如此，还对部分不安全的加密算法进行了删减。

(2). 说一说你对 WebSocket 的理解？

WebSocket 是一种基于 TCP 的轻量级网络通信协议。和 HTTP/2 一样，都是为了解决 HTTP 某些方面的缺陷而诞生的。不过解决方式略有不同，HTTP/2 针对的是“队头阻塞 ”，WebSocket 针对的是“请求-应答”的通信模式。

我们知道“请求-应答”是半双工的通信模式，不具备服务器推送能力。这就限制了 HTTP 在实时通信领域的发展。虽然可以使用轮询来不停的向服务器发送 HTTP 请求，但是缺点也很大，反复的无效请求占用了大量的带宽和 CPU 资源。所以，WebSocket 应运而生。

WebSocket 是一个全双工通信协议，具备服务端主动推送的能力。本质上是对 TCP 做了一层包装，让它可以运行在浏览器环境里。

看过我这篇专栏「吐血整理」再来一打 Webpack 面试题的同学们一定知道，Webpack 的热更新中就利用了这种协议。当然，在即时通讯、游戏以及可视化大屏展示等领域中也都有着 WebSocket 的身影。

(3). 说一说你对 DNS 的理解？

DNS (Domain Name System)是互联网中的重要基础设施，负责对域名的解析工作，为了保证高可用、高并发和分布式，它设计成了树状的层次结构。

由根 DNS 服务器、顶级域 DNS 服务器和权威 DNS 服务器组成。

解析顺序是首先从浏览器缓存、操作系统缓存以及本地 DNS 缓存 (/etc/hosts) 逐级查找，然后从本地 DNS 服务器、根 DNS、顶级 DNS 以及权威 DNS 层层递归查询。

还可以基于域名在内网、外网进行负载均衡。

不过传统的 DNS 有很多问题(解析慢、更新不及时)，HTTPDNS 通过客户端 SDK 和服务端配合，直接通过 HTTP 调用解析 DNS 的方式，可以绕过传统 DNS 这些缺点，实现智能调度。

(4). 说一说你对 CDN 的理解？

CDN（Content Delivery Network）就是内容分发网络。

为了突破现实生活中的光速、传输距离等物理限制，CDN 投入了大量资金，在全球范围内各大枢纽城市建立机房，部署大量高存储高带宽的节点，构建跨运营商、跨地域的专用高速传输网络。

其中分为中心节点、区域节点、边缘节点等，在用户接入网络后，首先通过全局负载均衡 (Global Sever Load Balance)，简称 GSLB 算法负责调度，找到离用户最合适的节点。然后通过 HTTP 缓存代理技术进行缓存，缓存命中就返回给用户，否则就回源站去取。CDN 擅长缓存静态资源(图片、音频等)，当然也支持动态内容的缓存。

(5). 简单说一下 TCP 的三次握手和四次挥手

三次握手

1.客户端主动发起 SYN

2.服务端收到并返回 SYN 以及 ACK 客户端的 SYN

3.客户端收到服务端的 SYN 和 ACK 后，发送 ACK 的 ACK 给服务端，服务端收到后连接建立

Client -> SYN -> Server

Server -> SYN/ACK -> Client

Client -> ACK -> Server

四次挥手

1.客户端发送 FIN 给服务端

2.服务端收到后发送 ACK 给客户端

3.服务端发送 FIN 给客户端

4.客户端收到后，发送 ACK 的 ACK 给服务端，服务端关闭，客户端等待 2MSL 后关闭

Client -> FIN -> Server

Server -> ACK -> Client

Server -> FIN -> Client

Client -> ACK -> Server -> CLOSED

Client -> 2MSL 的时间 -> CLOSED

(6). HTTP 的缓存策略知道吗？

强缓存

服务器使用 Cache-Control 来设置缓存策略，常用 max-age 来表示资源的有效期。

(这里的 max-age 的时间计算起点是响应报文的创建时刻，而不是客户端收到报文的时刻。)

(浏览器也可以发送 Cache-Control 字段，使用 max-age=0 或 no-cache 来刷新数据)

如果想更精确的控制缓存策略，还可以使用 Cache-Control 的其他属性：

no-store：不允许缓存 (用于秒杀页面等变化频率非常高的场景)
no-cache：可以缓存，使用前必须要去服务端验证是否过期，是否是最新版本
must-revalidate：如果缓存不过期就可以继续使用，过期了就必须去服务端验证

协商缓存

验证资源是否失效就需要使用条件请求。常用的是 If-Modified-Since 和 If-None-Match，收到 304 状态码就可以复用缓存里的资源。

(If-None-Match 比 If-Modified-Since 优先级更高)

验证资源是否被修改的条件有两个 Last-modified 和 ETag (ETag 比 Last-modified 的精确度更高)，需要预先在服务端的响应报文里设置，配合条件请求使用

(7). HTTP 如何进行内容协商？

内容协商就是每个 URI 指向的资源可以是任何事物，可以有很多不同的表述。对于文档来说，可以有不同的语言、不同的媒体格式，并针对不同的浏览器提供不同的压缩编码。

主动式内容协商

客户端在请求头部中提出需要的表述形式，服务器根据其来进行特定表述

响应式内容协商

服务端返回 300 或者 406，由客户端选择一种表述

协商要素

质量因子 q：内容的质量、可接受类型的优先级
媒体资源的 MIME 类型
字符编码 (UTF-8)
内容编码 (Accept-Encoding:gzip,deflate,br)
表述语言 (Accept-Language:zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7)
国际化与本地化 (i18n,l10n)

(8). 说一说 HTTP 的重定向

重定向是服务器发起的跳转，要求客户端使用新的 URI 重新发送请求。在响应头字段 Location 中指示了要跳转的 URI。使用 Refresh 字段，还可以实现延时重定向。

301 / 302 是常用的重定向状态码。分别代表永久性重定向和临时性重定向。

除此之外还有：

303：类似于 302，重定向后的请求方法改为 GET 方法
307：类似于 302，含义比 302 更明确，重定向后请求的方法和实体不允许变动
308：类似于 301，代表永久重定向，重定向后请求的方法和实体不允许变动
300：是一个特殊的重定向状态码，会返回一个有多个链接选项的页面，由用户自行选择
304：是一个特殊的重定向状态码，服务端验证过期缓存有效后，要求客户端使用该缓存

参考文章:(1). https://zhuanlan.zhihu.com/p/57712655 (2). https://juejin.im/post/5e91d85ce51d4546c82d9d99#heading-32

(9). 你所谓的约定的加密算法应该是 ECDHE 椭圆算法吧？HTTP 传输消息都是明文的，黑客完全可以作为中间人劫持消息，再利用 ECDHE 算法，这样不就能破解密钥了吗？

ECDHE 算法利用了椭圆曲线和离散对数等思想，按照当下的计算机算力，很难在短时间进行破解。且每次握手时生成的都是一对临时的公钥和私钥，这样就保证每次的密钥对也不同。

即使大费力气破解了一次的密钥，之前的历史消息也不会受到影响，保证了前向安全。

当然，TLS 协议的安全性受限于当下最快的计算机运行速度，理论上绝对安全的是量子通讯传递密钥。

(10). TCP 和 UDP 区别？

TCP 和 UDP 都是传输层的协议，但二者有着截然不同的基因。

TCP	UDP
面向连接	无连接
面向字节流	面向数据报
有状态	无状态
保证可靠交付	不保证可靠交付
具备拥塞控制	不具备拥塞控制
点对点传播	广播、多播
有序	无序

(11). TCP/IP 网络分层模型是怎样分层的？

应用层、传输层、网际层、链接层

application layer、transport layer、internet layer、link layer

(12). TCP/IP 网络分层模型是怎样分层的？

那你说一下OSI 网络分层模型是怎样分层的？应用层、表示层、会话层、传输层、网络层、数据链路层、物理层

application layer、presentation layer、session layer、transport layer、network layer、data link layer、physical layer

(13). HTTP 持久化连接

  Connection: keep-alive

以上就是持久连接节省通信量的字段。

HTTP 协议的初始版本中，每进行一次 HTTP 通信就要断开一次 TCP 连接。

以当年的通信情况来说，因为都是些容量很小的文本传输，所以即使这样也没有多大问题。可随着 HTTP 的普及，文档中包含大量图片的情况多了起来。比如，使用浏览器浏览一个包含多张图片的 HTML页面时，在发送请求访问 HTML页面资源的同时，也会请求该 HTML页面里包含的其他资源。因此，每次的请求都会造成无谓的 TCP 连接建立和断开，增加通信量的开销。

持久连接

为解决上述 TCP 连接的问题，HTTP/1.1 和一部分的 HTTP/1.0 想出了持久连接（HTTP Persistent Connections，也称为 HTTP keep-alive 或 HTTP connection reuse）的方法。持久连接的特点是，只要任意一端没有明确提出断开连接，则保持 TCP 连接状态。

持久连接的好处在于减少了 TCP 连接的重复建立和断开所造成的额外开销，减轻了服务器端的负载。另外，减少开销的那部分时间，使 HTTP 请求和响应能够更早地结束，这样 Web 页面的显示速度也就相应提高了。

在 HTTP/1.1 中，所有的连接默认都是持久连接，但在 HTTP/1.0 内并未标准化。虽然有一部分服务器通过非标准的手段实现了持久连接，但服务器端不一定能够支持持久连接。毫无疑问，除了服务器端，客户端也需要支持持久连接。

管线化

持久连接使得多数请求以管线化（pipelining）方式发送成为可能。从前发送请求后需等待并收到响应，才能发送下一个请求。管线化技术出现后，不用等待响应亦可直接发送下一个请求。这样就能做到同时并行发送多个请求，而不需要一个接一个地等待响应了。

HTTP 是无状态协议，它不对之前发生过的请求和响应的状态进行管理。也就是说，无法根据之前的状态进行本次的请求处理。

不可否认，无状态协议当然也有它的优点。由于不必保存状态，自然可减少服务器的 CPU 及内存资源的消耗。从另一侧面来说，也正是因为 HTTP 协议本身是非常简单的，所以才会被应用在各种场景里。

保留无状态协议这个特征的同时又要解决类似的矛盾问题，于是引入了 Cookie 技术。Cookie 技术通过在请求和响应报文中写入 Cookie 信息来控制客户端的状态。

Cookie 会根据从服务器端发送的响应报文内的一个叫做 Set-Cookie 的首部字段信息，通知客户端保存 Cookie。当下次客户端再往该服务器发送请求时，客户端会自动在请求报文中加入 Cookie 值后发送出去。

服务器端发现客户端发送过来的 Cookie 后，会去检查究竟是从哪一个客户端发来的连接请求，然后对比服务器上的记录，最后得到之前的状态信息。

(15). HTTP 缓存控制

浏览器在请求已经访问过的URL的时候，会判断是否使用缓存,。

判断是否使用缓存，主要通过判断缓存是否在有效期内, 通过两个字段来判断：

Expires，有效期，返回的是一个GMT时间，但是使用的是客户端时间，与服务器时间存在一定时间差。 Cache-Control => max-age，最大有效时间，单位是s，优先级比 expires 高，为了解决 expires 时间差的问题而出现的。缓存过期后，浏览器不会直接去服务器上拿缓存，而是判断缓存是否有更新，能否继续使用，判断的方法有两种：

**Last-Modified / If-Modified-Since：**服务器会响应一个Last-Modified 字段，表示最近一次修改缓存的时间，当缓存过期后，浏览器就会把这个时间放在 If-Modified-Since 去请求服务器，判断缓存是否有更新。 **Etag / If-None-Match：**服务器会响应一个 Etag 字段，一个表示文件唯一的字符串, 一旦文件更新，Etag也会跟着更改；缓存过期后，浏览器会把这个字符串放在 If-None-Match 去请求服务器，判断是否有更新，Etag的优先级比Last-Modified 的更高, Etag 的出现, 是为了解决一个缓存文件在短时间内被多次修改的问题, 因为 Last-Modified 只能精确到秒。

(16). HTTP 请求/响应的步骤

客户端连接到Web服务器一个 HTTP 客户端（通常是浏览器）与 Web 服务器的HTTP端口（默认 80）建立一个TCP套接字连接。
发送HTTP请求通过 TCP 套接字，客户端向 Web 服务器发送一个文本的请求报文。
服务器接受请求并返回 HTTP 响应 Web 服务器解析请求，定位请求资源。服务器将资源复本写到 TCP 套接字，由客户端读取。
释放连接 TCP 连接若 connection 模式为 close，则服务器主动关闭 TCP 连接，客户端被动关闭连接，释放 TCP 连接；若 connection 模式为 keepalive，则该连接会保持一段时间，在该时间内可以继续接收请求；
客户端浏览器解析HTML内容客户端浏览器首先解析状态行，查看表明请求是否成功的状态代码。然后解析每一个响应头，响应头告知以下为若干字节的 HTML 文档和文档的字符集。客户端浏览器读取响应数据 HTML，根据 HTML 的语法对其进行格式化，并在浏览器窗口中显示。

生活中常见例子

在浏览器中输入 URL 地址，回车后：

浏览器向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址
解析出 IP 地址后，根据该 IP 地址和默认端口 80，和服务器建立 TCP 连接
浏览器发出读取文件（URL 中域名后面部分对应的文件）的HTTP 请求，该请求报文作为 TCP 三次握手的第三个报文数据发送给服务器;
服务器对浏览器请求作出响应，并把对应的 html 文本发送给浏览器;
释放 TCP 连接
浏览器将该 html 文本并显示内容;

文章来源: https://juejin.im/post/6844904121510854664#heading-32

# 拓展

# (1). 说一下你对 HTTPS 的理解?

# (2). 说一说你对 WebSocket 的理解？

# (3). 说一说你对 DNS 的理解？

# (4). 说一说你对 CDN 的理解？

# (5). 简单说一下 TCP 的三次握手和四次挥手

# (6). HTTP 的缓存策略知道吗？

# (7). HTTP 如何进行内容协商？

# (8). 说一说 HTTP 的重定向

# (9). 你所谓的约定的加密算法应该是 ECDHE 椭圆算法吧？HTTP 传输消息都是明文的，黑客完全可以作为中间人劫持消息，再利用 ECDHE 算法，这样不就能破解密钥了吗？

# (10). TCP 和 UDP 区别？

# (11). TCP/IP 网络分层模型是怎样分层的？

# (12). TCP/IP 网络分层模型是怎样分层的？

# (13). HTTP 持久化连接

# 持久连接

# 管线化

# (14). Cookie 状态管理

# (15). HTTP 缓存控制

# (16). HTTP 请求/响应的步骤

拓展