HTML 网络请求

前言

  • 超文本传输协议(HTTP)的设计目的是保证客户端与服务器之间的通信。

  • HTTP 的工作方式是客户端与服务器之间的请求-应答协议。

  • Web 浏览器可能是客户端,而计算机上的网络应用程序也可能作为服务器端。

    • 举例:客户端(浏览器)向服务器提交 HTTP 请求;服务器向客户端返回响应。响应包含关于请求的状态信息以及可能被请求的内容。
方法 描述
GET 查看,从指定的资源请求数据
POST 创建,向指定的资源提交要被处理的数据
PUT 更新,上传指定的 URI 表示
DELETE 删除,删除指定资源
HEAD 与 GET 相同,但只返回 HTTP 报头,不返回文档主体
OPTIONS 返回服务器支持的 HTTP 方法
CONNECT 把请求连接转换到透明的 TCP/IP 通道

1、GET 和 POST 请求方法

  • 在客户端和服务器之间进行请求-响应时,两种最常被用到的方法是:GET 和 POST。

1.1 GET 方法

  • 请注意,查询字符串(名称/值对)是在 GET 请求的 URL 中发送的:

    1
    /test/demo_form.php?name1=value1&name2=value2
  • 有关 GET 请求的其他一些注释:

    • GET 请求可被缓存
    • GET 请求保留在浏览器历史记录中
    • GET 请求可被收藏为书签
    • GET 请求不应在处理敏感数据时使用
    • GET 请求有长度限制
    • GET 请求只应当用于取回数据

1.3 POST 方法

  • 请注意,查询字符串(名称/值对)是在 POST 请求的 HTTP 消息主体中发送的:

    1
    2
    3
    POST /test/demo_form.php HTTP/1.1
    Host: qianchia.com
    name1=value1&name2=value2
  • 有关 POST 请求的其他一些注释:

    • POST 请求不会被缓存
    • POST 请求不会保留在浏览器历史记录中
    • POST 不能被收藏为书签
    • POST 请求对数据长度没有要求

1.4 GET 与 POST 比较

比较 GET POST
后退按钮/刷新 无害 数据会被重新提交(浏览器应该告知用户数据会被重新提交)
书签 可收藏为书签 不可收藏为书签
缓存 能被缓存 不能缓存
编码类型 application/x-www-form-urlencoded application/x-www-form-urlencoded or multipart/form-data。为二进制数据使用多重编码
历史 参数保留在浏览器历史中 参数不会保存在浏览器历史中
对数据长度的限制 当发送数据时,GET 方法向 URL 添加数据;
URL 的长度是受限制的(URL 的最大长度是 2048 个字符)
无限制
对数据类型的限制 只允许 ASCII 字符 没有限制。也允许二进制数据
安全性 与 POST 相比,GET 的安全性较差,因为所发送的数据是 URL 的一部分。
在发送密码或其他敏感信息时绝不要使用 GET
POST 比 GET 更安全,因为参数不会被保存在浏览器历史或 web 服务器日志中
可见性 数据在 URL 中对所有人都是可见的 数据不会显示在 URL 中

2、状态消息

  • 当浏览器从 Web 服务器请求服务时,可能会发生错误。以下列举了有可能会返回的一系列 HTTP 状态消息。

2.1 1xx: 信息

状态码 状态码英文名称 描述
100 Continue 服务器仅接收到部分请求,如果服务器没有拒绝该请求,客户端应该继续发送其余的请求
101 Switching Protocols 服务器转换协议:服务器将遵从客户的请求转换到另外一种协议
103 Checkpoint 用于 PUT 或者 POST 请求恢复失败时的恢复请求建议

2.2 2xx: 成功

状态码 状态码英文名称 描述
200 OK 请求成功(这是对 HTTP 请求成功的标准应答)
201 Created 请求被创建完成,同时新的资源被创建
202 Accepted 供处理的请求已被接受,但是处理未完成
203 Non-Authoritative Information 请求已经被成功处理,但是一些应答头可能不正确,因为使用的是其他文档的拷贝
204 No Content 请求已经被成功处理,但是没有返回新文档。浏览器应该继续显示原来的文档。如果用户定期地刷新页面,
而 Servlet 可以确定用户文档足够新,这个状态代码是很有用的
205 Reset Content 请求已经被成功处理,但是没有返回新文档。但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容
206 Partial Content 客户发送了一个带有 Range 头的 GET 请求,服务器完成了它

2.3 3xx: 重定向

状态码 状态码英文名称 描述
300 Multiple Choices 多重选择。链接列表。用户可以选择某链接到达目的地。最多允许五个地址
301 Moved Permanently 所请求的页面已经转移至新的 URL
302 Found 所请求的页面已经临时转移至新的 URL
303 See Other 所请求的页面可在别的 URL 下被找到
304 Not Modified 未按预期修改文档。客户端有缓冲的文档并发出了一个条件性的请求(一般是提供 If-Modified-Since 头表示客户只想比指定日期更新的文档)。
服务器告诉客户,原来缓冲的文档还可以继续使用
305 Use Proxy 客户请求的文档应该通过 Location 头所指明的代理服务器提取
306 Switch Proxy 目前已不再使用,但是代码依然被保留
307 Temporary Redirect 被请求的页面已经临时移至新的 URL
308 Resume Incomplete 用于 PUT 或者 POST 请求恢复失败时的恢复请求建议

2.4 4xx: 客户端错误

状态码 状态码英文名称 描述
400 Bad Request 因为语法错误,服务器未能理解请求
401 Unauthorized 合法请求,但对被请求页面的访问被禁止。因为被请求的页面需要身份验证,客户端没有提供或者身份验证失败
402 Payment Required 此代码尚无法使用
403 Forbidden 合法请求,但对被请求页面的访问被禁止
404 Not Found 服务器无法找到被请求的页面
405 Method Not Allowed 请求中指定的方法不被允许
406 Not Acceptable 服务器生成的响应无法被客户端所接受
407 Proxy Authentication Required 用户必须首先使用代理服务器进行验证,这样请求才会被处理
408 Request Timeout 请求超出了服务器的等待时间
409 Conflict 由于冲突,请求无法被完成
410 Gone 被请求的页面不可用
411 Length Required “Content-Length” 未被定义。如果无此内容,服务器不会接受请求
412 Precondition Failed 请求中的前提条件被服务器评估为失败
413 Request Entity Too Large 由于所请求的实体太大,服务器不会接受请求
414 Request-URI Too Long 由于 URL 太长,服务器不会接受请求。当 POST 请求被转换为带有很长的查询信息的 GET 请求时,就会发生这种情况
415 Unsupported Media Type 由于媒介类型不被支持,服务器不会接受请求
416 Requested Range Not Satisfiable 客户端请求部分文档,但是服务器不能提供被请求的部分
417 Expectation Failed 服务器不能满足客户在请求中指定的请求头

2.5 5xx: 服务器错误

状态码 状态码英文名称 描述
500 Internal Server Error 请求未完成。服务器遇到不可预知的情况
501 Not Implemented 请求未完成。服务器不支持所请求的功能,或者服务器无法完成请求
502 Bad Gateway 请求未完成。服务器充当网关或者代理的角色时,从上游服务器收到一个无效的响应
503 Service Unavailable 服务器当前不可用(过载或者当机)
504 Gateway Timeout 网关超时。服务器充当网关或者代理的角色时,未能从上游服务器收到一个及时的响应
505 HTTP Version Not Supported 服务器不支持请求中指明的HTTP协议版本
511 Network Authentication Required 用户需要提供身份验证来获取网络访问入口

3、统一资源定位器

  • Web 浏览器通过 URL 从 Web 服务器请求页面。

  • 当点击 HTML 页面中的某个链接时,对应的 <a> 标签指向万维网上的一个地址。

  • 一个统一资源定位器(URL)用于定位万维网上的文档。

  • URL 可以由字母组成,如 “qianchia.com”,或互联网协议(IP)地址: 39.105.152.219。大多数人进入网站使用网站域名来访问,因为名字比数字更容易记住。

  • 一个网页地址语法规则如下

    1
    scheme://host.domain:port/path/filename
URL 说明
scheme 定义因特网服务的类型。最常见的类型是 http
host 定义域主机(http 的默认主机是 www)
domain 定义因特网域名,比如 qianchia.com
:port 定义主机上的端口号(http 的默认端口号是 80)
path 定义服务器上的路径(如果省略,则文档必须位于网站的根目录中)
filename 定义文档/资源的名称

3.1 Scheme

  • Scheme 定义因特网服务的类型。
Scheme 访问 用于…
http 超文本传输协议 以 http:// 开头的普通网页。不加密。
https 安全超文本传输协议 安全网页,加密所有信息交换。
ftp 文件传输协议 用于将文件下载或上传至网站。
file 您计算机上的文件。

4、URL 编码

  • URL 只能使用 ASCII 字符集,来通过因特网进行发送。由于 URL 常常会包含 ASCII 集合之外的字符,URL 必须转换为有效的 ASCII 格式。

  • URL 编码使用 “%” 其后跟随两位的十六进制数来替换非 ASCII 字符。

  • URL 不能包含空格,URL 编码通常使用 + 来替换空格。

4.1 URL 编码函数

  • JavaScript、PHP、ASP 都提供了对字符串进行 URL 编码的函数。
语言 函数
JavaScript encodeURI()
PHP rawurlencode()
ASP Server.URLEncode()
  • 点击 “URL 编码” 按钮,看看 JavaScript 函数是怎么对文本进行编码的。JavaScript 函数将空格编码成 %20 。




4.2 URL 编码参考手册

ASCII 字符 URL 编码 ASCII 字符 URL 编码 ASCII 字符 URL 编码 ASCII 字符 URL 编码
空格 %20
Y %59
%92
Ë %CB
! %21
Z %5A
%93
Ì %CC
%22
[ %5B
%94
Í %CD
# %23
\ %5C
%95
Î %CE
$ %24
] %5D
%96
Ï %CF
% %25
^ %5E
%97
Ð %D0
& %26
_ %5F
˜ %98
Ñ %D1
%27
` %60
%99
Ò %D2
( %28
a %61
š %9A
Ó %D3
) %29
b %62
%9B
Ô %D4
* %2A
c %63
œ %9C
Õ %D5
+ %2B
d %64
 %9D
Ö %D6
, %2C
e %65
ž %9E
× %D7
- %2D
f %66
Ÿ %9F
Ø %D8
. %2E
g %67
%A0
Ù %D9
/ %2F
h %68
¡ %A1
Ú %DA
0 %30
i %69
¢ %A2
Û %DB
1 %31
j %6A
£ %A3
Ü %DC
2 %32
k %6B
¤ %A4
Ý %DD
3 %33
l %6C
¥ %A5
Þ %DE
4 %34
m %6D
¦ %A6
ß %DF
5 %35
n %6E
§ %A7
à %E0
6 %36
o %6F
¨ %A8
á %E1
7 %37
p %70
© %A9
â %E2
8 %38
q %71
ª %AA
ã %E3
9 %39
r %72
« %AB
ä %E4
: %3A
s %73
¬ %AC
å %E5
; %3B
t %74
­ %AD
æ %E6
< %3C
u %75
® %AE
ç %E7
= %3D
v %76
¯ %AF
è %E8
> %3E
w %77
° %B0
é %E9
? %3F
x %78
± %B1
ê %EA
@ %40
y %79
² %B2
ë %EB
A %41
z %7A
³ %B3
ì %EC
B %42
{ %7B
´ %B4
í %ED
C %43
| %7C
µ %B5
î %EE
D %44
} %7D
%B6
ï %EF
E %45
~ %7E
· %B7
ð %F0
F %46
%7F
¸ %B8
ñ %F1
G %47
` %80
¹ %B9
ò %F2
H %48
 %81
º %BA
ó %F3
I %49
%82
» %BB
ô %F4
J %4A
ƒ %83
¼ %BC
õ %F5
K %4B
%84
½ %BD
ö %F6
L %4C
%85
¾ %BE
÷ %F7
M %4D
%86
¿ %BF
ø %F8
N %4E
%87
À %C0
ù %F9
O %4F
ˆ %88
Á %C1
ú %FA
P %50
%89
 %C2
û %FB
Q %51
Š %8A
à %C3
ü %FC
R %52
%8B
Ä %C4
ý %FD
S %53
Π%8C
Å %C5
þ %FE
T %54
 %8D
Æ %C6
ÿ %FF
U %55
Ž %8E
Ç %C7
V %56
 %8F
È %C8
W %57
 %90
É %C9
X %58
%91
Ê %CA

4.3 URL 设备控制字符编码参考手册

  • ASCII 设备控制字符最初被设计为用来控制诸如打印机和磁带驱动器之类的硬件设备。在 URL 中这些字符不会起任何作用。
ASCII 字符 描述 URL-编码 ASCII 字符 描述 URL-编码
NUL null character %00
DLE data link escape %10
SOH start of header %01
DC1 device control 1 %11
STX start of text %02
DC2 device control 2 %12
ETX end of text %03
DC3 device control 3 %13
EOT end of transmission %04
DC4 device control 4 %14
ENQ enquiry %05
NAK negative acknowledge %15
ACK acknowledge %06
SYN synchronize %16
BEL bell (ring) %07
ETB end transmission block %17
BS backspace %08
CAN cancel %18
HT horizontal tab %09
EM end of medium %19
LF line feed %0A
SUB substitute %1A
VT vertical tab %0B
ESC escape %1B
FF form feed %0C
FS file separator %1C
CR carriage return %0D
GS group separator %1D
SO shift out %0E
RS record separator %1E
SI shift in %0F
US unit separator %1F
文章目录
  1. 1. 前言
  2. 2. 1、GET 和 POST 请求方法
    1. 2.1. 1.1 GET 方法
    2. 2.2. 1.3 POST 方法
    3. 2.3. 1.4 GET 与 POST 比较
  3. 3. 2、状态消息
    1. 3.1. 2.1 1xx: 信息
    2. 3.2. 2.2 2xx: 成功
    3. 3.3. 2.3 3xx: 重定向
    4. 3.4. 2.4 4xx: 客户端错误
    5. 3.5. 2.5 5xx: 服务器错误
  4. 4. 3、统一资源定位器
    1. 4.1. 3.1 Scheme
  5. 5. 4、URL 编码
    1. 5.1. 4.1 URL 编码函数
    2. 5.2. 4.2 URL 编码参考手册
    3. 5.3. 4.3 URL 设备控制字符编码参考手册
隐藏目录