• 微信公众号:美女很有趣。 工作之余,放松一下,关注即送10G+美女照片!

Linux网络编程(协议解析)

互联网 diligentman 3小时前 3次浏览

协议解析

  • 协议基础

自定制协议:程序员自己定制的协议

应用层协议:如何将多个数据对象组织成为一个二进制数据串进行传输

需要考虑传输性能和解析性能,解析性能高的不一定传输性能高

比如:struct {int num1,int num2,char op}  解析方便  但由于占用内存大导致传输性能较低

  • 序列化

序列化:将多个数据对象按照指定协议进行组织实现持久化存储或者网络通信传输的二进制数据串的过程

序列化:按照指定协议将二进制数据串解析得到各个数据对象的过程

典型序列化方式:结构体序列化,json序列化,protobuf序列化

  • HTTP协议

http协议:超文本传输协议,明文字符串传输协议

https协议:加密之后的http协议,安全性更高

http协议在传输层基于tcp协议实现,是一个简单的请求-响应协议

http协议格式(也称为:http协议数据结构)

  • 首行:请求行  响应行(对于请求和响应的简单关键描述)

请求行:请求方法   URL   协议版本rn

(1)请求方法:

  1. GET:向服务器获取实体资源(包含正文),也可以提交数据但由于提交过程中没有正文所以提交数据没有在正文而在URL中   注意:(1)get提交数据在url中,不安全    (2)url长度有限制导致提交数据有限制
  2. HEAD:向服务器仅获取响应头部,不要正文实体
  3. POST:向服务器提交数据,提交有正文,提交数据放在正文中
  4. 1 PUT 从客户端向服务器传送的数据取代指定的文档的内容。
    2 DELETE 请求服务器删除指定的页面。
    3 CONNECT HTTP/1.1 协议中预留给能够将连接改为管道方式的代理服务器。
    4 OPTIONS 允许客户端查看服务器的性能。
    5 TRACE 回显服务器收到的请求,主要用于测试或诊断。
    6 PATCH 是对 PUT 方法的补充,用来对已知资源进行局部更新 。

(2)URL:(网址)统一资源定位符,用于定位网络中某个主机上的资源 

组成:协议名称://用户名:密码@域名:端口/资源路径?查询字符串数据#片段标识符

  • http服务默认使用80端口    https服务默认使用443端口
  • 查询字符串:提交给服务器的数据,由一个个key=value键值对组成,键值对之间以&符号间隔
  • urlencode:编码   目的:用户请求的资源路径或查询字符串中存在特殊字符,可能与url特殊字符冲突

编码方法:将特殊字符每个字节(8bit)转换为16进制数字字符,并前缀%     eg: '+'  %2B

  • urldecode:解码

解码方法:遇到%,则认为紧随其后的两个字符进行解码,将两个字符转换为数字(16进制转10进制)

片段标识符:定位网页位置

(3)协议版本

0.9:最早期版本,只支持GET方法,支持超文本数据传输,没有规范http协议格式

1.0:规范了http协议格式,新增支持GET,HEAD,POST请求方法。支持各种多媒体资源传输,简单缓冲控制

1.1:支持更多请求方法,对1.0进行性能提升,支持长连接(connection:keep-alive)

2.0:重新定义http协议       1,二进制数据传输   2,支持主动推送资源   3,服务器长连接响应,不需要按序进行,解决队头阻塞问题

 

响应行:协议版本   响应状态码   状态码描述

响应状态码:直观向客户端反映处理结果

HTTP状态码分类
分类 分类描述
1** 一些描述信息,服务器收到请求,需要请求者继续执行操作
2** 成功,操作被成功接收并正确处理
3** 重定向,需要进一步的操作以完成请求,表示本次请求的资源移到新的链接处,原链接依然可用
4** 客户端错误,请求包含语法错误或无法完成请求
5** 服务器错误,服务器在处理请求的过程中发生了错误
状态码 状态码描述 中文描述
100 Continue 继续。客户端应继续其请求
101 Switching Protocols 切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议
 
200 OK 请求成功。一般用于GET与POST请求
201 Created 已创建。成功请求并创建了新的资源
202 Accepted 已接受。已经接受请求,但未处理完成
203 Non-Authoritative Information 非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本
204 No Content 无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档
205 Reset Content 重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域
206 Partial Content 部分内容。服务器成功处理了部分GET请求,eg:断点续传
 
300 Multiple Choices 多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择
301 Moved Permanently 永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替
302 Found 临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI
303 See Other 查看其它地址。与301类似。使用GET和POST请求查看
304 Not Modified 未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源
305 Use Proxy 使用代理。所请求的资源必须通过代理访问
306 Unused 已经被废弃的HTTP状态码
307 Temporary Redirect 临时重定向。与302类似。使用GET请求重定向
 
400 Bad Request 客户端请求的语法错误,服务器无法理解
401 Unauthorized 请求要求用户的身份认证
402 Payment Required 保留,将来使用
403 Forbidden 服务器理解请求客户端的请求,但是拒绝执行此请求
404 Not Found 服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面
405 Method Not Allowed 客户端请求中的方法被禁止
406 Not Acceptable 服务器无法根据客户端请求的内容特性完成请求
407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权
408 Request Time-out 服务器等待客户端发送的请求时间过长,超时
409 Conflict 服务器完成客户端的 PUT 请求时可能返回此代码,服务器处理请求时发生了冲突
410 Gone 客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置
411 Length Required 服务器无法处理客户端发送的不带Content-Length的请求信息
412 Precondition Failed 客户端请求信息的先决条件错误
413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息
414 Request-URI Too Large 请求的URI过长(URI通常为网址),服务器无法处理
415 Unsupported Media Type 服务器无法处理请求附带的媒体格式
416 Requested range not satisfiable 客户端请求的范围无效
417 Expectation Failed 服务器无法满足Expect的请求头信息
 
500 Internal Server Error 服务器内部错误,无法完成请求
501 Not Implemented 服务器不支持请求的功能,无法完成请求
502 Bad Gateway 作为网关或者代理工作的服务器尝试执行请求时,从远程服务器接收到了一个无效的响应,连接建立失败
503 Service Unavailable 由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中
504 Gateway Time-out 充当网关或代理的服务器,未及时从远端服务器获取请求,响应延迟
505 HTTP Version not supported 服务器不支持请求的HTTP协议的版本,无法完成处理
  • 头部:对于请求或响应或正文的一些关键描述(由一个个key:value键值对组成,每个键值对以rn结尾)

典型头部字段:

Connection 长短连接控制 keep-alive/close
Referer 记录本次请求的来源连接  
Content-Type 表示正文数据格式  
Content-Length 表示正文数据长度 解决粘包问题
cookie /session 请求头cookie  响应头session  

 cookie:

一个客户端登录之后,服务端验证登录,成功后,通过set-cookie设置cookie信息返回给客户端  

 客户端接收到响应后,将set-cookie字段的cookie信息保存起来,下次请求服务器直接从cookie文件中读取出cookie信息,通过cookie字段发送给服务器

cookie是一个维护http通信状态的技术,但存在安全隐患

解决方法:session

服务端针对每个客户端建立会话当客户端登录成功后,创建会话,在会话中记录客户端用户信息及状态等信息  通过set-cookie字段将session-id返回给客户端 session-id每次请求都会发生变化,并且用户的隐私信息一直保存在服务器中,防止泄露

cookie和session区别:

cookie是维护http通信状态的技术,将关键信息保存在客户端,每次请求服务器时,读取出来发送给服务端,此过程中将关键信息保存在cookie字段中进行传输

session是解决cookie安全隐患,将关键信息保存在服务端,通过创建会话后,而只将session-id返回给客户端,客户端作为cookie字段保存,再次请求过程中只是将session-id信息保存在cookie字段中进行传输,而非直接传输用户信息,安全性相比较于cookie提高

  • 空行:rn  间隔头部与正文

  • 正文:客户端提交给服务端,或者服务端响应给客户端的数据

 

简单的http服务器的搭建:

1.搭建tcp服务端
⒉获取新建连接
3.使用新建连接,等待接收数据(http协议的请求数据)
4.接收过程:先接收http头部,解析头部-Content-Length确定正文长度5.接收指定长度的正文
6.根据请求方法以及资源路径确定客户端的请求目的7.进行具体对应的业务处理
8.组织http协议格式的响应数据,对客户端进行回复
9.如果是短连接,则直接关闭套接字,如果是长连接,则继续等待接收数据

代码如下:

Linux网络编程(协议解析)

Linux网络编程(协议解析)

运行结果如下:

Linux网络编程(协议解析)

Linux网络编程(协议解析)

抓包结果如下:

Linux网络编程(协议解析)


程序员灯塔
转载请注明原文链接:Linux网络编程(协议解析)
喜欢 (0)