草庐IT

Http协议报文格式

丞恤猿 2024-04-19 原文

一、整体介绍

    Http协议在传输层基于TCP协议,在Http1.1之前每次请求在TCP层都需进行一轮连接和释放(三次握手、四次握手),从Http1.1开始默认使用长连接。
    Http报文分为两种,请求报文和响应报文,大致格式如下:

1.请求报文结构:

      请求行     {     请求方法(get/post等)+     URL     +     协议版本号     }     
+    头部        {     按照规范,根据自己需要来选择性添加     }
+    包体        {     即数据内容,post请求时,这部分才有数据;get请求时,数据附在URL参数里,格式为【URL?参数名=参数值】     }

2.响应报文格式

      状态行     {     协议版本号     +     状态码     +     状态码说明     }     
+    头部        {     按照规范,根据自己需要来选择性添加     }
+    包体        {     一般为服务端返回给客户端的数据     }

#一、请求报文

结构构成:请求行 + 请求头部 + 请求数据

1.请求行 = 请求方法字段 + URL字段 + HTTP协议版本字段

##.请求方法

HTTP协议的请求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT。GET和POST是最常用的请求方法。
&&. GET请求
        使用GET方法时,请求参数和对应的值附加在URL后面,利用一个问号(“?”)代表URL的结尾与请求参数的开始,传递参数长度受限制。这种方式不适合传送私密数据。
GET方式的请求一般不包含”请求数据”部分。
        由于不同的浏览器对地址的字符限制也有所不同,长度一般不能超过4KB,所以如果需要传送大量数据的时候,也不适合使用GET方式。
&&. POST请求
POST方式对传送的数据大小没有限制, 可以允许客户端给服务器提供信息较多。
POST方法将请求参数封装在HTTP请求数据中,不会显示在URL中。

##.URL

URL:统一资源定位符,是一种资源位置的抽象唯一识别方法。
组成:<协议>://<主机>:<端口>/<路径>
端口和路径有事可以省略(HTTP默认端口号是80,Https默认端口443)

##.HTTP协议版本字段

指定使用的Http协议版本
HTTP/1.1的优化
        长连接 : 在HTTP/1.0中,默认使用的是短连接,也就是说每次请求都要重新建立一次连接。HTTP是基于TCP/IP协议的,每一次建立或者断开连接都需要三次握手四次挥手的开销,如果每次请求都要这样的话,开销会比较大。因此最好能维持一个长连接,可以用个长连接来发多个请求。HTTP1.1起,默认使用长连接 ,默认开启Connection: keep-alive。 HTTP/1.1的持续连接有非流水线方式和流水线方式 。流水线方式是客户在收到HTTP的响应报文之前就能接着发送新的请求报文。与之相对应的非流水线方式是客户在收到前一个响应后才能发送下一个请求。
HTTP2.0的优化
    使用二进制格式传递数据:HTTP1.x的解析是基于文本, 传输的是一堆ASCII码串 。基于文本协议的格式解析存在天然缺陷,文本的表现形式有多样性,要做到健壮性考虑的场景必然很多,二进制则不同,只认0和1的组合。基于这种考虑HTTP2.0的协议解析决定采用二进制格式,实现方便且健壮。
    多路复用:在同一个TCP连接中,同一时刻可以发送多个请求和响应,下一次的请求不需要等待上一个响应来之后再发送。但响应的顺序是不变的,FIFO(先进先出)。2.0之前是同一个连接只能用一次, 如果开启了keep-alive,虽然可以用多次,但是同一时刻只能有一个HTTP请求。
    HTTP2.0的多路复用主要是指:因为http2.0的传输是基于二进制帧的。每一个TCP连接中承载了多个双向流通的流,每一个流都有一个独一无二的标识和优先级,而流就是由二进制帧组成的。二进制帧的头部信息会标识自己属于哪一个流,所以这些帧是可以交错传输,然后在接收端通过帧头的信息组装成完整的数据。这样就解决了线头阻塞的问题,同时也提高了网络速度的利用率。
    header压缩,HTTP1.x的header带有大量信息,而且每次都要重复发送,HTTP2.0使用HPACK算法对header的数据进行压缩,避免了重复header的传输,又减小了需要传输数据的大小,基本原理是客户端和服务端分别缓存一份索引表,如果头部存在于索引表,则用对应的索引值;否则进行霍夫曼编码,并加入索引表。

##2.请求头部

请求头部为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。请求头部通知服务器有关于客户端请求的信息。常见头部字段:

Cache-Control    控制缓存的行为,一般包括一个“max-age=3400”的值,代表缓存的有效时间为资源返回后的3400秒之内
Connection    逐跳首部、连接的管理。如果值为其他字段的名字,代表代理服务器转发时将
Accept    用户代理可处理的媒体类型
Accept-Charset    优先的字符集
Accept-Encoding    优先的内容编码
Authorization    Web认证信息
Expect    期待服务器的特定行为
From    用户的电子邮箱地址
Host    请求资源所在的服务器主机名/域名
If-Match    比较实体标记(Etag)
If-Modified-Since    比较资源的更新时间,出现在条件get请求中
If-None-Match    比较实体标记(与If-Match相反)
If-Range    资源未更新时发送实体Byte的范围请求
If-Unmodified-Since    比较资源的更新时间(与If-Modified-Since相反)
Max-Forwards    最大传输逐跳数
Proxy-Authorization    代理服务器要求客户端的认证信息
Range    实体的字节范围请求
Referer    请求中URI的原始获取方
TE    传输编码的优先级
User-Agent    HTTP客户端程序的信息。如果是浏览器则是对应浏览器的用户代理字符串
Content-Encoding    实体主体适用的编码方式
Content-length    实体主体的大小(单位:字节)
Content-Type    实体主体的媒体类型

空行

请求头部的最后会有一个空行,表示请求头部结束,接下来为请求数据。

##3.请求数据

请求数据不在GET方法中使用,而在POST方法中使用。POST方法适用于需要客户填写表单的场合。与请求数据相关的最高频使用的请求头部是Cntent-Type和Content-Length,分别代表数据类型和数据长度。

部分常用的Content-Type:

text/plain :纯文本格式 .txt

text/xml : XML格式 .xml

image/gif :gif图片格式 .gif

image/jpeg :jpg图片格式 .jpg

image/png:png图片格式 .png

audio/mp3 : 音频mp3格式 .mp3

audio/rn-mpeg :音频mpga格式 .mpga

video/mpeg4 : 视频mp4格式 .mp4

video/x-mpg : 视频mpa格式 .mpg

video/x-mpeg :视频mpeg格式 .mpeg

video/mpg : 视频mpg格式 .mpg

以application开头的媒体格式类型:

application/xhtml+xml :XHTML格式

application/xml : XML数据格式

application/atom+xml :Atom XML聚合格式

application/json : JSON数据格式

application/pdf :pdf格式

application/msword : Word文档格式

application/octet-stream : 二进制流数据(如文件下载)

#二.响应报文

HTTP响应报文 = 状态行(status line) + 响应头部(headers) + 响应数据(也叫响应体或响应正文)(response body)

##1.状态行

状态行 = 协议版本 + 状态码 + 状态码描述。
其中协议版本与请求报文一致,状态码描述是对状态码的简单描述。
HTTP状态码
状态码由三位数字组成,第一位数字表示响应的类型,常用的状态码有五大类如下所示:
  1xx:表示服务器已接收了客户端请求,客户端可继续发送请求;
  2xx:表示服务器已成功接收到请求并进行处理;
  3xx:表示服务器要求客户端重定向;
  4xx:表示客户端的请求有非法内容;
  5xx:表示服务器未能正常处理客户端的请求而出现意外错误;

##2.响应头部

常见响应头部及描述如下:
Cache-Control    控制缓存的行为,一般包括一个“max-age=3400”的值,代表缓存的有效时间为资源返回后的3400秒之内
Connection    逐跳首部、连接的管理。如果值为其他字段的名字,代表代理服务器转发时将不再携带该字段。如果值为close或Keep-Alive则分别表示连接为短/长连接
Accept-Ranges    是否接受字节范围请求
Age    推算资源创建经过时间
ETag    资源的匹配信息
Location    令客户端重定向至指定URI
Proxy-Authenticate    代理服务器对客户端的认证信息
Server    HTTP服务器的安装信息
Vary    代理服务器缓存的管理信息
WWW-Authenticate    服务器对客户端的认证信息
Content-Encoding    实体主体适用的编码方式
Content-length    实体主体的大小(单位:字节)
Content-Type    实体主体的媒体类型

空行

响应头部的最后会有一个空行,表示响应头部结束,接下来为响应数据。与请求报文一致。

##3.响应体

用于存放需要返回给客户端的数据信息。

#头部字段补充说明

HTTP首部字段类型分为四种:

1、通用首部字段(General Header Feilds)
即请求报文和响应报文双方都会使用的首部
2、请求首部字段(Request Header Fields)
从客户端向服务器发送请求时使用的首部。补充了请求的附加内容、客户端信息、响应内容想关优先级等信息。
3、响应首部字段(Response Header Fields)
从服务器向客户端返回响应时使用的首部。补充了相应的附加内容
4、实体首部字段(Entity Header Fields)
针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。
注意:仍然是报文的头部字段,只是针对报文数据体作相关说明,并不会存储在报文数据体里。

以下为HTTP/1.1所有头部字段

1.通用头部字段
Cache-Control    控制缓存的行为,一般包括一个“max-age=3400”的值,代表缓存的有效时间为资源返回后的3400秒之内
Connection    逐跳首部、连接的管理。如果值为其他字段的名字,代表代理服务器转发时将不再携带该字段。如果值为close或Keep-Alive则分别表示连接为短/长连接
Date    创建报文的日期时间
Pragma    报文指令。是HTTP/1.1之前版本的遗留字段,仅作为与HTTP/1.0的向后兼容而定义
Trailer    报文末端的首部一览
Transfer-Encoding    指定报文主体的传输编码方式
Upgrade    升级为其他协议
Via    代理服务器的相关信息。报文经过代理或网关时,会先在首部字段Via中附加该服务器的信息,然后再进行转发,目的是追踪请求和响应报文的传输路径
Warning    错误通知
2.请求头部字段
Accept    用户代理可处理的媒体类型
Accept-Charset    优先的字符集
Accept-Encoding    优先的内容编码
Authorization    Web认证信息
Expect    期待服务器的特定行为
From    用户的电子邮箱地址
Host    请求资源所在的服务器主机名/域名
If-Match    比较实体标记(Etag)
If-Modified-Since    比较资源的更新时间,出现在条件get请求中
If-None-Match    比较实体标记(与If-Match相反)
If-Range    资源未更新时发送实体Byte的范围请求
If-Unmodified-Since    比较资源的更新时间(与If-Modified-Since相反)
Max-Forwards    最大传输逐跳数
Proxy-Authorization    代理服务器要求客户端的认证信息
Range    实体的字节范围请求
Referer    请求中URI的原始获取方
TE    传输编码的优先级
User-Agent    HTTP客户端程序的信息。如果是浏览器则是对应浏览器的用户代理字符串
3.响应头部字段
Accept-Ranges    是否接受字节范围请求
Age    推算资源创建经过时间
ETag    资源的匹配信息
Location    令客户端重定向至指定URI
Proxy-Authenticate    代理服务器对客户端的认证信息
Server    HTTP服务器的安装信息
Vary    代理服务器缓存的管理信息
WWW-Authenticate    服务器对客户端的认证信息
4.实体头部字段
Allow    资源可支持的HTTP方法
Content-Encoding    实体主体适用的编码方式
Content-language    实体主体的自然语言
Content-length    实体主体的大小(单位:字节)
Content-MD5    实体主体的报文摘要
Content-Range    实体主体的位置范围
Content-Type    实体主体的媒体类型
Expires    实体主体过期的日期时间
Last-Modified    资源的最后修改日期时间
(声明:部分图片引用自网络,侵删!)

有关Http协议报文格式的更多相关文章

  1. ruby - 使用 ruby​​ 将 HTML 转换为纯文本并维护结构/格式 - 2

    我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h

  2. ruby - 如何模拟 Net::HTTP::Post? - 2

    是的,我知道最好使用webmock,但我想知道如何在RSpec中模拟此方法:defmethod_to_testurl=URI.parseurireq=Net::HTTP::Post.newurl.pathres=Net::HTTP.start(url.host,url.port)do|http|http.requestreq,foo:1endresend这是RSpec:let(:uri){'http://example.com'}specify'HTTPcall'dohttp=mock:httpNet::HTTP.stub!(:start).and_yieldhttphttp.shou

  3. ruby-on-rails - 将 Ruby 中的日期/时间格式化为 YYYY-MM-DD HH :MM:SS - 2

    这个问题在这里已经有了答案:Railsformattingdate(4个答案)关闭4年前。我想格式化Time.Now函数以显示YYYY-MM-DDHH:MM:SS而不是:“2018-03-0909:47:19+0000”该函数需要放在时间中.现在功能。require‘roo’require‘roo-xls’require‘byebug’file_name=ARGV.first||“Template.xlsx”excel_file=Roo::Spreadsheet.open(“./#{file_name}“,extension::xlsx)xml=Nokogiri::XML::Build

  4. ruby - 我可以将我的 README.textile 以正确的格式放入我的 RDoc 中吗? - 2

    我喜欢使用Textile或Markdown为我的项目编写自述文件,但是当我生成RDoc时,自述文件被解释为RDoc并且看起来非常糟糕。有没有办法让RDoc通过RedCloth或BlueCloth而不是它自己的格式化程序运行文件?它可以配置为自动检测文件后缀的格式吗?(例如README.textile通过RedCloth运行,但README.mdown通过BlueCloth运行) 最佳答案 使用YARD直接代替RDoc将允许您包含Textile或Markdown文件,只要它们的文件后缀是合理的。我经常使用类似于以下Rake任务的东西:

  5. ruby - Net::HTTP 获取源代码和状态 - 2

    我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur

  6. ruby - 是否有用于序列化和反序列化各种格式的对象层次结构的模式? - 2

    给定一个复杂的对象层次结构,幸运的是它不包含循环引用,我如何实现支持各种格式的序列化?我不是来讨论实际实现的。相反,我正在寻找可能会派上用场的设计模式提示。更准确地说:我正在使用Ruby,我想解析XML和JSON数据以构建复杂的对象层次结构。此外,应该可以将该层次结构序列化为JSON、XML和可能的HTML。我可以为此使用Builder模式吗?在任何提到的情况下,我都有某种结构化数据-无论是在内存中还是文本中-我想用它来构建其他东西。我认为将序列化逻辑与实际业务逻辑分开会很好,这样我以后就可以轻松支持多种XML格式。 最佳答案 我最

  7. ruby-on-rails - 事件管理员日期过滤器日期格式自定义 - 2

    是否有简单的方法来更改默认ISO格式(yyyy-mm-dd)的ActiveAdmin日期过滤器显示格式? 最佳答案 您可以像这样为日期选择器提供额外的选项,而不是覆盖js:=f.input:my_date,as::datepicker,datepicker_options:{dateFormat:"mm/dd/yy"} 关于ruby-on-rails-事件管理员日期过滤器日期格式自定义,我们在StackOverflow上找到一个类似的问题: https://s

  8. Get https://registry-1.docker.io/v2/: net/http: request canceled while waiting - 2

    1.错误信息:Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/:net/http:requestcanceledwhilewaitingforconnection(Client.Timeoutexceededwhileawaitingheaders)或者:Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/:net/http:TLShandshaketimeout2.报错原因:docker使用的镜像网址默认为国外,下载容易超时,需要修改成国内镜像地址(首先阿里

  9. CAN协议的学习与理解 - 2

    最近在学习CAN,记录一下,也供大家参考交流。推荐几个我觉得很好的CAN学习,本文也是在看了他们的好文之后做的笔记首先是瑞萨的CAN入门,真的通透;秀!靠这篇我竟然2天理解了CAN协议!实战STM32F4CAN!原文链接:https://blog.csdn.net/XiaoXiaoPengBo/article/details/116206252CAN详解(小白教程)原文链接:https://blog.csdn.net/xwwwj/article/details/105372234一篇易懂的CAN通讯协议指南1一篇易懂的CAN通讯协议指南1-知乎(zhihu.com)视频推荐CAN总线个人知识总

  10. ruby-on-rails - Rails - 从命名路由中提取 HTTP 动词 - 2

    Rails中有没有一种方法可以提取与路由关联的HTTP动词?例如,给定这样的路线:将“users”匹配到:“users#show”,通过:[:get,:post]我能实现这样的目标吗?users_path.respond_to?(:get)(显然#respond_to不是正确的方法)我最接近的是通过执行以下操作,但它似乎并不令人满意。Rails.application.routes.routes.named_routes["users"].constraints[:request_method]#=>/^GET$/对于上下文,我有一个设置cookie然后执行redirect_to:ba

随机推荐