[TOC]
OSI七层模型:
TCP/IP 四层模型:
参考资料:
相同点:三个都是用于修改请求
不同点:
**put 与 post 区别 **
-
put:等幂性,连续调用一次/多次效果相同,无副作用; 使用场景:修改用户名接口, 提交多次,结果也是一样的;
-
post:是非幂等性的,创建博客接口,多次提交创建多个
put 与 patch区别
-
put:直接资源覆盖型的使用put, 比如分销模块化接口;
-
patch: 对已知文件进行局部更新,比如修改用户名;
- HTTP协议: 超文本传输协议,规定了浏览器和万维网服务器互相通信的规则。使用:浏览网页,网页下载
- FTP协议:文件传输协议。使用:FTP服务端上传软件
- SMTP协议:简单邮件传输协议,在其之上指定了一条消息的一个或多个接收者,然后消息文本会被传输。使用:foxmail
- NFS协议:网络文件系统,文件共享的协议。用户和程序可以像访问本地文件一样访问远端系统文件。使用:Linux搭建网盘
- UDP协议:用户数据报协议,支持多方数据传输 使用:DNS ,QQ
- TCP/IP协议:传输控制协议,每一条TCP只能点对点传输 使用:http底层技术,QQ((UDP协议为主,TCP协议为辅助),websocket
- Telnet协议:远程登陆,使用明文传输数据,有一些安全问题,慢慢被淘汰。连接客户端推荐使用SSH协议
参考资料:几种常见的网络协议
UDP协议:无连接,尽最大可能交传,没有拥塞控制、面向报文,支持一对一,一对多,多对多交互通信。
TCP协议:面向连接,提供可靠交付,有流量控制,拥塞控制,提供全工控制,面向节节流,每一条TCP连接只能点对点的(一对一)
定义:通过域名解析找到服务器主机IP地址,方便通讯
查找该域名对应的IP地址、重定向(301)、发出第二个GET请求
- 查找流程:
- 浏览器查找DNS缓存
- 本机(系统级别)查找DNS缓存
- dns服务器
- -自动获取DNS服务器地址(局域网id)
- 路由器(做dns转发,也会有缓存)
- 运营商ISP分配的 (直接连接),部分运营商会通过dns劫持做广告植入
- 指定DNS服务器地址(首选,备选)--优点:解析快/无污染/防劫持
-
- google dns
- ali/baidu/open/114 DNS
- -自动获取DNS服务器地址(局域网id)
- host定义的配置文件
- 本地域名DNS服务器()-->根域名服务器--> COM顶级域名服务器-->x.com域名器
参考资料:在Windows中,选择TCP/IPv4协议设置中的“自动获取DNS服务器地址”,计算机究竟做了什么?
下面以HTTP协议为例:
-
在浏览器输入 URL
-
浏览器查看缓存
- 未缓存:发起新请求
- 已缓存:
- 新鲜:直接提供给客户端
- 不新鲜(过期):否则与服务器进行验证
- 判断新鲜(是否过期)的http字段 Expires 和
-
- Expires (HTTP1.0) : 值为一个绝对时间表示缓存新鲜日期
- Cache-Control (HTTP1.1):max-age=, 值为以秒为单位的最大新鲜时间
-
浏览器解析URL(获取 协议/主机/端口/path)
-
浏览器组装一个HTTP(GET)请求报文
-
浏览器获取主机IP地址
- 浏览器缓存
- 本机缓存(操作系统级别)
- hosts文件
- 路由器缓存
- ISP DNS缓存
- DNS递归查询(可能存在负载均衡导致每次IP不一样)
-
打开一个socket与目标IP地址,端口建立TCP链接
-
过程
1.客户端发送一个TCP的 SYN=1,Seq=X 的包到服务器端口 (你能听到我说话吗)
2.服务器发回:SYN=1,ACK=X+1, Seq=Y 的响应包 (听到了,你能听到我说话吗)
3.客户端发送: ACK=Y+1,Seq=Z (听的到)
-
参数解析
- Seq(sequencer):序列号,不传递实现内容
- SYN(synchronous):建立联机
- ACK(acknowledgement): 确认
-
-
TCP链接建立后发送HTTP请示
-
服务器接受请求并解析,将请求转发到服务程序,如虚拟主机使用HTTP Host头部判断请求的服务程序
- 服务器(nginx,apache...)接受请求并解析
- 服务程序(真正的服务器,自建/阿里云服务器)
-
服务器检查HTTP请求头是否包含缓存验证信息,如缓存新鲜,返回304状态码
-
处理程序(后端代码)读取完整请示并准备HTTP响应(可能需要查询数据库操作)
-
服务器将响应报文通过TCP连接发送回浏览器
-
浏览器接收HTTP响应,然后根据情况选择关闭TCP连接或者保留重用,关闭TCP连接的四次挥手
-
浏览器检查响应状态码:是否为1/3/4/5XX,这些情况与2XX不同
-
判断资源能否缓存,进行缓存
-
对响应进行解码(eg: gzip)
-
根据资源类型决定如何处理(假设资源为html)
-
html文档解析(dom,cssom,js解析)过程
-
显示页面
浏览器这边做的工作大致分为以下几步:
-
加载:根据请求的URL进行域名解析,向服务器发起请求,接收文件(HTML、JS、CSS、图象等)。
-
解析:对加载到的资源(HTML、JS、CSS等)进行语法解析,建议相应的内部数据结构(比如HTML的DOM树,JS的(对象)属性表,CSS的样式规则等等)
参考资料:
从浏览器地址栏输入 url 到显示页面的步骤(以 HTTP 为例)
从输入URL到页面加载的过程?如何由一道题完善自己的前端知识体系!
区别:
- 【数据传输方式不同】
- get参数是在url
- 优点:
- 浏览器可缓存数据(适合一些静态资源:js/css/img/font/html等,还有一些枚举项的查询)
- url方便保存/分享
- 缺点:
- 容易被拦截、篡改
- 优点:
- post 是放在request body里面
- 优点:
- post相对来说安全一些,参数不暴露在url上 (比如:用户账号密码,敏感的查询信息)
- 优点:
- get参数是在url
- 【请求长度】
- get参数长度有限制,这个限制不是http协议规定的,而是浏览器对url进行的限制,所以不同浏览器的限制不同
- Post 无限制
- 【数据类型不同】
- get只允许ASCII字符
- POST无限制
- 【特性不同】
- GET是安全(指只读特性,使用这个方法不会引起服务器状态变化)且幂等(指同一个请求方法执行多次和仅执行一次效果完全相同)
- POST是非安全非幂等
相同点:
- 底层都是TCP/IP,Get产生一个TCP包,post产生两个
【自上而下】进行加载,并在加载过程中进行解析渲染; 解析过程
- html解析成一个dom树,dom树的构建过程是一个深度遍历过程 ;当前节点所有子节点渲染后才会去构建当前节点的下一个子节点 ;
- css解析成css rule tree;
- 根据dom树和CSSOM(css对象模型)来构造 rendering tree;
- 从浏览器缓存中查询(一般是2-30分钟)
- 从操作系统缓存中查询
- 从路由器中查询DNS缓存
- ISP中查询DNS缓存;
- 域名服务器迭代查询,根据返回的地址逐级向上查询。www.google.com->本地dns服务器查询的结果 101.1.1.1->101.2.2.2->查询的结果返回到本地dns服务器->发送给客户端
说明 :客户端到本地服务器属于递归查询,DNS服务器属于迭代查询
运行web应用,提供网上信息浏览服务
- Apache:世界上用的最多的web服务器,开源,支持跨平台应用(unix,windows,Linux),属于重量级产品,内存消耗大,速度、性能上不通讯其他轻量级web服务器
- Nginx: 高性能HTTP 和 反向代理服务器
- Apache:开源、支行servlet和JSP web应用软件,基于Java的web应用软件容器
- Microsoft IIS: 只能运行在windows平台上
Ajax(Asynchronous JavaScript and XML)指的是通过JavaScript使用XMLHttpRequest对象来异步获取数据并更新页面的技术。其实现原理可以简单描述为以下几个步骤:
-
【实例化xhr对象】创建XMLHttpRequest对象,也就是创建一个异步调用对象.
-
【设置请求方法和URL】
-
【发送HTTP请求】
-
【监听请求变化】监听响应变化,并操作界面
// 1. 创建一个XMLHTTPRequest对象
const xhr = new XMLHttpRequest();
// 2. 设置请求方法和URL, 最后一个参数表示是否异步,true表示异步,false表示同步
xhr.open('GET', 'https://testapi.xxx.com/api/test-category/all', true);
// 3. 发送请求
xhr.send();
// 4. 监听响应状态改变事件,除了onreadystatechange,还有onload、onerror、ontimeout等事件.
// 详见:https://developer.mozilla.org/zh-CN/docs/Web/API/XMLHttpRequest
xhr.onreadystatechange = function() {
// 4表示响应已经完成,200表示响应成功
// 详见:https://developer.mozilla.org/zh-CN/docs/Web/API/XMLHttpRequest/readyState
// readyState的值:
// 0: 请求未初始化
// 1: 服务器连接已建立
// 2: 请求已接收
// 3: 请求处理中
// 4: 请求已完成,且响应已就绪
// status的值:
// 200: "OK"
// 403: "Forbidden"
// 404: "Not Found"
if (xhr.readyState === 4 && xhr.status === 200) {
console.log(xhr.responseText);
}
};
相同点:都是异步请求的api
fetch优点:
- 【原生支持】浏览器原生支持的api,写起来比ajax简单
- 【基于promise】不要写回调地狱了,(jquery 1.5版本后也支持了)
- 【默认不带cookies】需要手动添加
fetch缺点:
- 【兼容性较差】目前兼容性还不是很好,但它是未来 (可以引入polyill,让不支持的浏览支持fetch api)
- 【请求无法取消】这是因为fetch基于promise,promise 无法做到这一点,超时无法取消,造成了对流量的浪费
- 【更加的底层】只对网络请求报错,对400,500都当做成功请求,需要二次封闭
- 【请求进度状态无法监听】而XHR可以
服务端要支持cors 才能得到数据
CORS cors是"Cross-Origin Resource Sharing"的简称,是实现跨域的一种方式,相对于其他跨域方式,比较灵活,而且不限制发请求使用的method,以下从几种情况分析cors使用。
//get方法
//前端代码
fetch('http://localhost:6888/test_get',{
method: 'GET',
mode: 'cors',
}).then(res => {
return res.json();
}).then(json => {
console.log('获取的结果', json.data);
return json;
}).catch(err => {
console.log('请求错误', err);
})
后端代码
c.Header("Access-Control-Allow-Origin", "*")
c.Header("Access-Control-Allow-Methods", "GET, POST")
参考资料:
相同点:
- 都是用来发送请求的工具
不同点:
axios功能更强大
- 【适用面更广】axios支持在浏览器和Node层中使用,而fetch只能在浏览器中使用。
- 【兼容性】axios兼容性更好,fetch api在某些浏览器不支持
- 【功能更丰富】
- axios支持拦截器功能:可以拦截请求和响应,在发送和接收数据时做统一处理。
- axios支持取消请求:在复杂请求时有用
- axios支持更多的配置选项
- axios返回更丰富的错误信息:在处理错误时,提供了更丰富的错误信息:HTTP错误状态码、错误信息等。
这个和跨域有关系
- 第一次:预请求,不携带数据,判断服务器能否跨域;在预检请求的返回中,服务器端也通知客户端,是否需带身份凭证(cookies,http认证相关数据); 状态码204
- 第二次:携带真实的数据,发送请求;状态码200
产生的原因:
- 使用了非简单请求(not-so-simple request)
- 使用了非head, get ,post 请求,比如:PUT,DELETE
- 或者 content-type 使用了 application/json; 而不是application/x-www-form-urlencoded、multipart/form-data、text/plain
参考资料:
https://cloud.tencent.com/developer/article/1542037
- 从浏览器缓存中查询(一般是2-30分钟)
- 从操作系统缓存中查询
- 从路由器中查询DNS缓存
- ISP中查询DNS缓存;
- 域名服务器迭代查询,根据返回的地址逐级向上查询。www.google.com->本地dns服务器查询的结果 101.1.1.1->101.2.2.2->查询的结果返回到本地dns服务器->发送给客户端
- application/x-www-form-urlencoded:最常见的方式,传输数据:title=test&sub%5B%5D=1&sub%5B%5D=2&sub%5B%5D=3
- jquery axios默认使用的就是这种方式
- 浏览器原生form如不设置enctype属性
- multipart/form-data: form表单中使用,需要设置
- application/json:告诉服务器端,消息主体是序列化后的json字符串
- text/xml:使用http作为传输协议,xml作为编码规方式的远程调用规范
// application/x-www-form-urlencoded 发送的请求
POST http://www.example.com HTTP/1.1
Content-Type: application/x-www-form-urlencoded;charset=utf-8
title=test&sub%5B%5D=1&sub%5B%5D=2&sub%5B%5D=3
// multipart/form-data: 发送的请求
POST http://www.example.com HTTP/1.1
Content-Type:multipart/form-data; boundary=----WebKitFormBoundaryrGKCBY7qhFd3TrwA
------WebKitFormBoundaryrGKCBY7qhFd3TrwA
Content-Disposition: form-data; name="text"
title
------WebKitFormBoundaryrGKCBY7qhFd3TrwA
Content-Disposition: form-data; name="file"; filename="chrome.png"
Content-Type: image/png
PNG ... content of chrome.png ...
------WebKitFormBoundaryrGKCBY7qhFd3TrwA--
// application/json 最终发送的请求
POST http://www.example.com HTTP/1.1
Content-Type: application/json;charset=utf-8
{"title":"test","sub":[1,2,3]}
// text/xml 最终发送的请求
POST http://www.example.com HTTP/1.1
Content-Type: text/xml
<?xml version="1.0"?>
<methodCall>
<methodName>examples.getStateName</methodName>
<params>
<param>
<value><i4>41</i4></value>
</param>
</params>
</methodCall>
一、HTTP1.0请求方法:
- get: 请求服务器发送某些资源
- post:发送数据给服务器
- head:请求资源的头部信息,并且这些头部收不到http get方法请求时返回的一致
二、HTTP1.1 新增请求方法:
- options:用于获取目的资源所支持的通信选项
- put:新增资源,是幂等性的 ( )
- delete:删除指定的资源
- trace:回显服务器收到的请求,主要用于测试或诊断
- connect:预留给能够将连接改为管道方式的代理服务器
- patch: 对资源应用部分修改
1)二进制分帧
HTTP/2中,同域名下所有通信都在单个连接上完成,该连接可以承载任意数据的双向数据流。
2)多路复用
- 同域名下所有通信都在单个连接上完成
- 单个连接可以承载任意数量的双向数据流
3)Header压缩
对TCP协议进行改造
google基于UDP协议开发了QUIC协议,并且使用在HTTP/3上
优点:
- 0-RTT:缓存当前会话的上下文,重连时只要传递给服务器端验证通过就可以了
- 多路复用:虽然HTTP/2已经支持,但是TCP协议终究没有这个功能,但是QUIC原生支持,并且传输的单个数据流可以保证有序交付且不会影响其他数据流,解决了TCP之前的问题
- 向前纠错机制:多发数据,避免重传,只能使用在丢失一个包的情况下,多个包丢失还得依靠重传的方式
参考资料:https://blog.fundebug.com/2019/03/07/understand-http2-and-http3/
- https增加了数据加密,比http更安全
- https 默认使用443端口,http是80端口
- https相对比http慢一些,因为为加/解密这个过程
- https需要向CA机构申请证书;
https=http+SSL/TSL(加密层)
加密的分类:
对称加密:通信双方都使用同一个秘钥进行解密,
优点:简单
缺点:无法解决首次把秘钥发给对方的问题,容易被黑客拦截秘钥
eg: 特务暗号
非对称加密:
优点:安全性高
缺点:过程繁琐,慢
https采用的解决办法:结合两种加密方式(两端都可以开锁的保险柜,任一方有钥匙都可以)
- 将对称加密的密钥使用非对称加密的公钥进行加密,然后发送出去
- 接收方使用私钥进行解密得到对称加密的密钥
- 然后双方可以使用对称加密来进行沟通
https主要分为三个阶段
- 验证证书,生成秘钥阶段
- 使用公钥,加密数据阶段
- 使用私钥,解密数据阶段
参考:
https://cloud.tencent.com/developer/article/1643914
三次握手:是指在建立一个TCP连接时,需客户端和服务器总共发送3个数据包;
参考:https://cloud.tencent.com/developer/article/1643914
http请求报文主要由三部分组成,
- 报文行/请求行:
- -【协议】定义请求协议post/get
- 【地址】 请求url
- 【版本】http协议及版本
- 报文头:缓存控制,cookies设置,accept告诉服务端接收什么类型参数,referer发送请求的地址来源;
- 报文体:
- -【参数】请求的参数
http/2协议中, connection和 keep-alive是被忽略的,在其中采用其他机制来进行管理
可以使用postman抓包工具进行原始数据抓取
特别说明:加*说明是必选字段
一、请求头:
-
user-agent (*) : 客户端程序信息 //可判断什么浏览器,什么webview容器
-
referer(*): 请求信息的来源 //可以用来拦截非法cdn资源引用,和跨站请求伪造攻击
-
accept: 客户端能处理的文件类型
- */* 代表所有
- text/html //html
- image/webp,image/apng //图片
-
accept-encoding : 客户端能够接受的内容编码方式(某种压缩算法)
-
- gzip
- br
- compress
- deflate
-
-
accept-language: 客户端能够解析的语言
-
- de
- de-CH
- en-US,en;q=0.5
-
dnt : 不要追踪 //do not track 隐私保护,不要给我推个性化广告,君子协议不一定生效
-
connection: 连接管理、逐条首部, 不与http2一起使用
- keep-alive 可重新连接,减少资源消耗,缩短响应时间,一般会设置服务端超时时间,同时会设置最大请求数,越过也会自动关闭,要服务端支持才行; 允许请求和应答的http管线化,降低拥塞控制(TCP连接减少了),报告错误无需关闭TCP连接
- close //默认值
-
sec-fetch-* //网络请求的元数据描述,服务端精确判断请求的合法性,2019年发布的草案,目前浏览器兼容性不高
- Sec-Fetch-Dest: image
Sec-Fetch-Mode: no-cors Sec-Fetch-Site: same-origin - If-Modified-Since 服务器发过来的最后修改时间 ,缓存时间判断使用,如果时间一致,http状态码304(不返回文件),客户端直接显示本地缓存文件;如不一致,就返回http状态码200和新的文件内容,客户端接到之后,丢弃旧文件,缓存新文件
- Sec-Fetch-Dest: image
-
cache-control: 控制缓存
-
- no-cache //无缓存,浏览器开启 disable cache会同现
二、响应头:
-
server(*) : 响应的服务器 //nginx,apache
-
accept-ranges(*) //标识服务器自身支持的请求单位 //bytes, none
-
Access-Control-Allow-Origin : cors跨域请求头 // *允许所有域名跨域请求
-
content-length(*): 资源大小
-
content-type(*): 资源类型
-
status:响应状态 //304强缓存
-
cache-control:: 缓存控制
- max-age=691200 //缓存时间,后面的数据是秒
-
date(*): 资源最新获取时间 // 不使用缓存的情况下,每次刷新会变
-
expires: 到期时间
-
last-modified: 资源上次修改的时间
-
age : 表示对象在缓存代理服务器中存贮的时长,单位秒
-
eTag: Etags类似于指纹,比较etags可快速确认资源是否改变,可能被某些服务器跟踪
-
x-request-id: 由客户端随机生成,帮助排查问题使用
参考资料:
- 响应行:协议版本、状态码或状态码的原因短语组件: eg : HTTP/1.1 200 OK
- 响应头:响应部首组成
- 响应体:服务器响应的数据
- 请求头部信息(request header)
- 接收的格式,来源,语言编码,浏览器信息,是不使用缓存,超时时长和最大请求数, cookies(keep-alive:timeout=5,max=1000)
- http/2协议中, connection和 keep-alive是被忽略的,在其中采用其他机制来进行管理
2.响应头部信息(response headers)
- 内容压缩格式/长度/类型:gzip/1000/text、html/日期/服务器/
- 1** 信息类:表示接收到请求并且继续处理;
- 2** 响应成功:动作被成功接收、理解、接受
- 3** 重定向:为了完成指定的动作,必须接收进一步处理
- 4** 请求包含错误语法或不能正确执行;
- 5** 服务器错误:服务器不能正确执行一个正确的请求
1) 强缓存 (状态码304)
直接从本地读取,不会发起请求到服务器;
2)协商缓存 ( 状态码200)
从服务器端缓存中读取,会发起请求到服务器
相同点:都是协商缓存(不访问服务器),状态码都是200;
不同点:
- Memory cache: 从内存中读取缓存,当浏览器关闭后,进程被kill了,缓存将清除
- Dist cache: 从硬盘中读取缓存,当kill浏览器进程,缓存还在
判断标准:
根据内存闲置情况判断是否放入内存,还是放入硬盘;
- 先读缓存内存 from memory cache
- 读硬盘缓存: from dist cache
- 请求服务器资源
- 把从服务器的资源缓存在内存和硬盘中
eg:
访问一张图片的缓存过程 :
- 首次加载,状态码200
- 退出浏览器,再次加载(需要服务器之前设置过缓存),from dist cache ,从硬盘中获取
- 再次刷新页面,200 from memory cache 从内存中读取
参考资料:https://www.zhihu.com/question/64201378
在服务器端(nginx,Apache...,大部分web服务器默认开启会协商缓存)设置Expire字段,浏览器会读取,再进行缓存控制
//普通服务器的配置 Expires: Thu, 15 Apr 2020 20:00:00 GMT //Apache服务器的配置 ExpiresDefault "access plus 10 years"
通过返回的header
- Cache-Control: 是否缓存,及缓存时间, 优先级高于expires,表示相对时间
- Cache-Control:no-cache //先缓存本地,但是在命中缓存之后必须与服务器验证缓存的新鲜度才能使用
- Cache-Control: max-age=315360000 //缓存时间设置,单位s
- Cache-Control: no-store 不会产生任何缓存
- Cache-Control: public 可以被所有用户缓存,包括终端/cdn等中间代理服务器
- Cache-Control: private 只能被终端浏览器缓存,不允许中继缓存服务器进行缓存
- Expires: 过期时间,绝对时间,由服务器返回,expires受限于本地时间,如果修改了本地时间,可能造成缓存失效
- Etag(判断返回字段:If-none-match): 给定URL资源更改,会生成新的ETag,类似指纹,通过比较etag能快速确认此资源是否变化
- Last-modified (判断返回字段 : If-modified-since): 最后更新时间,协商缓存会使用
//对页面使用协商缓存,对于静态资源 图片/css/js/字体 使用强缓存的配置
//使用Cache-Control 中的 max-age 字段配置
server {
listen 8081;
server_name xxx.abc.com;
location / {
proxy_pass http://localhost:7878;
add_header Cache-Control max-age=no-cache;
}
location ~* \.(css|js|png|jpg|jpeg|gif|gz|svg|mp4|ogg|ogv|webm|htc|xml|woff)$ {
access_log off;
add_header Cache-Control "public,max-age=30*24*3600";
proxy_pass http://localhost:7878;
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
//使用expires 字段设置强缓存
server {
listen 80;
server_name tirion.me www.tirion.me;
# note that these lines are originally from the "location /" block
root /home/www/wordpress;
index index.php index.html index.htm;
location / {
try_files $uri $uri/ =404;
}
error_page 404 /404.html;
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root /usr/share/nginx/html;
}
location ~ \.php$ {
try_files $uri =404;
fastcgi_pass unix:/var/run/php-fpm/php-fpm.sock;
fastcgi_index index.php;
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
include fastcgi_params;
}
# 配置 HTTP 强缓存静态文件,通过 Response Header 头返回
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|js|css)$ {
expires 3d;
}
}
参考资料:
-
【是否存在缓存?】Cache-Control 字段判断
-
【缓存是否过期?】Cache-Control、Expires 字段
-
【文件指纹是否相同?】判断ETag 指纹是否一致,向服务器请求 If-none-match, 服务器返回200 or 304
-
【更新时间是否相同?】判断Last-modified,向服务器请求 if-modified-since ,服务器返回200 or 304
服务器返回304读取本地,200请求响应协商缓存
参考资料: