python进阶1-requests

requests基础:

requests是http请求常用第三方库,好用简洁。 requests文档

安装

支持pip安装:

$ pip install requests

使用

安装之后即可导入requests模块: 

import requests

get、post 无参请求

现在就可以发送get请求了: 

r = requests.get('https://www.baidu.com')

打印响应结果: 

print(r.text)

post请求: 

r = requests.post('http://httpbin.org/post', data = {'key':'value'})

打印响应结果: 

print(r.text)

url参数

传递url参数:

payload = {'key1': 'value1', 'key2': 'value2'} r = requests.get("http://httpbin.org/get", params=payload)

通过打印url可以看出url被正确解码: 

print(r.url)
http://httpbin.org/get?key1=value1&key2=value2 print(r.text)

json()解码器

requests 中也有一个内置的 JSON 解码器,用于处理 JSON 数据: 

print(r.json())

添加headers

添加请求头headers: 

url = 'https://api.github.com/some/endpoint' headers = {'user-agent': 'my-app/0.0.1'} r = requests.get(url, headers=headers)

data传参

payload = {'key1': 'value1', 'key2': 'value2'} r = requests.post("http://httpbin.org/post", data=payload)

响应状态码

检测响应状态码用于判断请求是否成功(一般200是成功): 

r = requests.get('http://httpbin.org/get') r.status_code # 200 成功

为方便引用,Requests还附带了一个内置的状态码查询对象: 

r.status_code == requests.codes.ok # True 成功

可以用raiseforstatus() 抛出异常 

r = requests.get('http://httpbin.org/get1')
r.status_code # 404 
r.raise_for_status()
Traceback (most recent call last):
  File "<pyshell#82>", line 1, in <module>
    r.raise_for_status()
  File "D:\software\Python\Python39\lib\site-packages\requests\models.py", line 943, in raise_for_status
    raise HTTPError(http_error_msg, response=self)
requests.exceptions.HTTPError: 404 Client Error: NOT FOUND for url: http://httpbin.org/get1

超时时间 timeout

r = requests.get('https://www.baidu.com', timeout=0.001)

进阶

Session对象

会话(Session)对象让你能够跨请求保持某些参数。 它也会在同一个 Session 实例发出的所有请求之间保持 cookie, 期间使用 urllib3 的 connection pooling 功能。 所以如果你向同一主机发送多个请求,底层的 TCP 连接将会被重用,从而带来显著的性能提升。 会话对象具有主要的 Requests API 的所有方法。 测试跨请求保持一些 cookie: 

>>> s = requests.Session()
>>> s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
<Response [200]>
>>> r = s.get('http://httpbin.org/cookies')
>>> r.text
'{\n  "cookies": {\n    "sessioncookie": "123456789"\n  }\n}\n

 

下一篇: