• 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

URL的编码

互联网 diligentman 1周前 (10-14) 12次浏览

书写URL时使用的是ASCII字符集,它是一种单字节字符的编码方案,一共收录了128个字符,用一个字节就可以存储,比如字符a用二进制就可以表示为01100001。128个并不多,所以如果URL中含有非ASCII字符集中的字符,就要对其编码。

除此之外,还需要对URL中的保留(reserved)字符和不安全(unsafe)字符进行编码。

所谓保留字符就是那些在URL中具有特定意义的字符,不安全字符是指那些在URL中没有特殊含义,但在URL所在的上下文中可能具有特殊意义的字符,比如双引号(“”)。

下图是一些保留字符和不安全字符示例:

URL的编码

编码时,使用的是%编码规范。具体说明如下:

  • URL中的非保留字符和非不安全字符不进行编码。
  • URL中的保留字符和不安全字符,需要取其ASCII内码,然后加上%前缀,将该字符进行编码。
  • URL中的非ASCII字符,需要取其Unicode内码,然后加上%前缀,将该字符进行编码。

程序员灯塔
转载请注明原文链接:https://www.wangt.cc/2020/10/url%e7%9a%84%e7%bc%96%e7%a0%81/
喜欢 (0)