requests基础:
requests是http请求常用第三方库,好用简洁。 requests文档
安装
支持pip安装:
$ pip install requests
使用
安装之后即可导入requests模块:
import requests
get、post 无参请求
现在就可以发送get请求了:
r = requests.get('https://www.baidu.com')
打印响应结果:
print(r.text)
post请求:
r = requests.post('http://httpbin.org/post', data = {'key':'value'})
打印响应结果:
print(r.text)
url参数
传递url参数:
payload = {'key1': 'value1', 'key2': 'value2'} r = requests.get("http://httpbin.org/get", params=payload)
通过打印url可以看出url被正确解码:
print(r.url)
http://httpbin.org/get?key1=value1&key2=value2 print(r.text)
json()解码器
requests 中也有一个内置的 JSON 解码器,用于处理 JSON 数据:
print(r.json())
添加headers
添加请求头headers:
url = 'https://api.github.com/some/endpoint' headers = {'user-agent': 'my-app/0.0.1'} r = requests.get(url, headers=headers)
data传参
payload = {'key1': 'value1', 'key2': 'value2'} r = requests.post("http://httpbin.org/post", data=payload)
响应状态码
检测响应状态码用于判断请求是否成功(一般200是成功):
r = requests.get('http://httpbin.org/get') r.status_code # 200 成功
为方便引用,Requests还附带了一个内置的状态码查询对象:
r.status_code == requests.codes.ok # True 成功
可以用raiseforstatus() 抛出异常
r = requests.get('http://httpbin.org/get1') r.status_code # 404 r.raise_for_status() Traceback (most recent call last): File "<pyshell#82>", line 1, in <module> r.raise_for_status() File "D:\software\Python\Python39\lib\site-packages\requests\models.py", line 943, in raise_for_status raise HTTPError(http_error_msg, response=self) requests.exceptions.HTTPError: 404 Client Error: NOT FOUND for url: http://httpbin.org/get1
超时时间 timeout
r = requests.get('https://www.baidu.com', timeout=0.001)
进阶
Session对象
会话(Session)对象让你能够跨请求保持某些参数。 它也会在同一个 Session 实例发出的所有请求之间保持 cookie, 期间使用 urllib3 的 connection pooling 功能。 所以如果你向同一主机发送多个请求,底层的 TCP 连接将会被重用,从而带来显著的性能提升。 会话对象具有主要的 Requests API 的所有方法。 测试跨请求保持一些 cookie:
>>> s = requests.Session() >>> s.get('http://httpbin.org/cookies/set/sessioncookie/123456789') <Response [200]> >>> r = s.get('http://httpbin.org/cookies') >>> r.text '{\n "cookies": {\n "sessioncookie": "123456789"\n }\n}\n