Requests库入门指南
想象一下,在网络世界中,如果你想与各种网站和服务进行通信,就像是用传统的信件往来。你需要手动打包数据、编写地址、处理回复编码,这些繁琐的细节会让简单的任务变得复杂。 Requests是Python中最流行的HTTP客户端库,它的设计哲学是"为人类设计"。它将复杂的HTTP协议细节封装在简洁的API之下,让开发者能够用最少的代码完成网络请求。与Python标准库中的 Requests在Python生态系统中占据着不可或缺的地位。据PyPI官方统计,它的下载量每月超过10亿次,超过50万个开源项目依赖它。无论是调用REST API、构建网络爬虫、自动化测试,还是开发微服务客户端,Requests都是首选工具。它支持HTTP/1.1的所有特性,包括连接池管理、Cookie持久化、SSL验证、自动内容解码等,让HTTP请求变得前所未有的简单。 Requests不是Python标准库的一部分,需要通过包管理器安装: Requests官方支持Python 3.9+版本,同时也兼容PyPy解释器。如果在安装过程中遇到权限问题,可以尝试使用 以下是一个简单的"Hello, World"示例,展示如何发送GET请求并获取响应: 程序运行后会输出类似以下内容: 这个简单的例子展示了Requests的核心优势:用三行代码就完成了一次完整的HTTP请求,自动处理了连接建立、数据传输、响应解码等所有细节。 Requests库围绕几个核心概念构建,理解这些概念有助于你更灵活地使用它。 HTTP协议定义了多种请求方法,Requests为每种方法都提供了对应的函数: 每次请求后,Requests都会返回一个 这个图表展示了Requests库的核心概念及其关系:请求方法用于发送请求,响应对象用于接收和处理服务器的回应,而会话对象则在多个请求之间提供状态保持和连接复用。 假设我们需要开发一个天气查询应用,能够获取指定城市的当前天气信息。我们将使用免费的天气API,通过发送HTTP请求来获取数据,并解析返回的JSON响应。 这个项目将展示Requests库的几个核心功能: 程序会依次查询三个城市的天气信息,并格式化输出结果。虽然示例使用了httpbin.org模拟数据,但代码结构可以直接适配真实的天气API(如OpenWeatherMap、和风天气等),只需修改 Requests提供了许多高级功能,可以应对复杂的HTTP交互场景: Requests的生态丰富,有许多扩展库可以增强其功能: 如果你想深入学习Requests,建议按以下路径进行: Requests库的设计理念是"简单即美",但它的背后是HTTP协议的复杂性和网络编程的挑战。掌握了Requests,你就掌握了与网络世界沟通的基本技能。继续探索,你会发现HTTP请求的世界远比你想象的更加丰富和有趣。1. 库的概览与核心价值
requests库正是为解决这些问题而生的工具。urllib相比,Requests的使用体验提升了90%以上——你不再需要手动处理URL编码、表单数据序列化、连接池管理等底层细节。2. 环境搭建与"Hello, World"
安装说明
# 使用pip安装(推荐)
pip install requests
# 使用conda安装
conda install requests
# 使用Python模块方式安装
python -m pip install requests--user参数或创建虚拟环境。最简示例
import requests
# 发送GET请求到GitHub API
response = requests.get('https://api.github.com/events')
# 打印响应状态码
print(f"状态码: {response.status_code}")
# 打印响应内容的前100个字符
print(f"响应内容: {response.text[:100]}")逐行解释
import requests - 导入Requests库,使其功能在当前脚本中可用。response = requests.get('https://api.github.com/events') - 调用get()方法向GitHub API发送GET请求,返回的Response对象包含了服务器的全部响应信息。print(f"状态码: {response.status_code}") - 访问Response对象的status_code属性,获取HTTP状态码(200表示成功)。print(f"响应内容: {response.text[:100]}") - 通过text属性获取响应的文本内容,并切片显示前100个字符。运行结果
状态码: 200
响应内容: [{"id":"25698765432","type":"PushEvent","actor":{"id":12345678,"login":"userna3. 核心概念解析
3.1 请求方法(Request Methods)
requests.get() - 获取资源requests.post() - 提交数据requests.put() - 更新资源(完整替换)requests.patch() - 更新资源(部分修改)requests.delete() - 删除资源requests.head() - 获取响应头requests.options() - 获取服务器支持的方法3.2 响应对象(Response Object)
Response对象,它包含了服务器的完整响应信息:response.status_code - HTTP状态码response.text - 响应的文本内容(自动解码)response.content - 响应的字节内容(原始二进制)response.json() - 将JSON响应解析为Python字典response.headers - 响应头信息(字典形式)response.cookies - 服务器设置的Cookie3.3 会话对象(Session Object)
Session对象允许你在多个请求之间保持某些参数(如Cookies、认证信息),并复用TCP连接,显著提高性能:session = requests.Session()
session.headers.update({'User-Agent': 'My App'})
# 第一个请求会保存Cookies
response1 = session.get('https://httpbin.org/cookies/set/sessionid/123')
# 第二个请求会自动携带之前保存的Cookies
response2 = session.get('https://httpbin.org/cookies')概念关系图
4. 实战演练:解决一个典型问题
需求分析
方案设计
requests.get()发送带参数的GET请求params参数传递查询参数(城市名称)response.json()解析JSON响应代码实现
import requests
from requests.exceptions import RequestException
def get_weather(city):
"""
获取指定城市的天气信息
Args:
city (str): 城市名称,例如"Beijing"或"Shanghai"
Returns:
dict: 包含天气信息的字典,失败时返回None
"""
# 使用免费的天气API(示例使用httpbin.org模拟)
base_url = "https://httpbin.org/get"
params = {
'city': city,
'units': 'metric'
}
try:
# 发送GET请求,设置超时时间为5秒
response = requests.get(base_url, params=params, timeout=5)
# 检查响应状态码,如果不是2xx则抛出异常
response.raise_for_status()
# 解析JSON响应
data = response.json()
# 提取天气信息(这里模拟真实API的数据结构)
weather_info = {
'city': data.get('args', {}).get('city', city),
'temperature': 25, # 模拟数据
'condition': '晴朗',
'humidity': 45,
'wind_speed': 3.2
}
return weather_info
except requests.exceptions.Timeout:
print(f"错误: 请求超时,无法获取{city}的天气信息")
except requests.exceptions.HTTPError as err:
print(f"HTTP错误: {err.response.status_code}")
except requests.exceptions.RequestException as err:
print(f"请求出错: {err}")
return None
def main():
"""主函数:获取并显示多个城市的天气"""
cities = ['Beijing', 'Shanghai', 'Guangzhou']
print("=== 天气查询系统 ===\n")
for city in cities:
print(f"正在查询 {city} 的天气...")
weather = get_weather(city)
if weather:
print(f"\n{weather['city']} 天气信息:")
print(f" 温度: {weather['temperature']}°C")
print(f" 天气: {weather['condition']}")
print(f" 湿度: {weather['humidity']}%")
print(f" 风速: {weather['wind_speed']} m/s")
print("-" * 40)
if __name__ == '__main__':
main()运行说明
pip install requestsweather_app.pypython weather_app.pybase_url和数据提取逻辑即可。关键点解析
params字典传递查询参数,Requests会自动进行URL编码timeout=5参数防止请求无限期等待raise_for_status()自动检查状态码,并捕获各类异常response.json()将JSON响应直接转换为Python字典5. 最佳实践与常见陷阱
常见错误及规避方法
错误1:不检查状态码
# ❌ 错误做法
response = requests.get('https://api.example.com/data')
data = response.json() # 如果状态码不是200,这里可能抛出异常
# ✅ 正确做法
response = requests.get('https://api.example.com/data')
response.raise_for_status() # 检查状态码,非2xx时抛出HTTPError
data = response.json()错误2:不设置超时时间
# ❌ 错误做法
response = requests.get('https://api.example.com/data')
# 如果网络故障或服务器无响应,程序会无限期等待
# ✅ 正确做法
response = requests.get('https://api.example.com/data', timeout=10)
# 10秒后超时,抛出Timeout异常错误3:在循环中重复创建会话
# ❌ 错误做法
for url in url_list:
response = requests.get(url) # 每次都建立新连接,效率低下
# ✅ 正确做法
with requests.Session() as session:
for url in url_list:
response = session.get(url) # 复用连接,性能更高最佳实践建议
timeout=(3, 10)。response.json()时应该捕获JSONDecodeError:import json
try:
data = response.json()
except json.JSONDecodeError:
print("响应不是有效的JSON格式")
data = Noneheaders = {
'User-Agent': 'MyWeatherApp/1.0 (https://myapp.com)'
}
response = requests.get(url, headers=headers)# 生产环境:验证证书(默认行为)
response = requests.get('https://example.com')
# 测试环境:禁用证书验证
response = requests.get('https://example.com', verify=False)import os
api_key = os.environ.get('MY_API_KEY')
headers = {'Authorization': f'Bearer {api_key}'}注意事项
stream=True参数逐步读取,避免内存溢出allow_redirects=False禁用自动重定向auth参数或headers参数,而不是在每个请求中重复设置6. 进阶指引
高级功能
proxies参数配置HTTP/SOCKS代理生态扩展
requests-oauthlib: OAuth认证支持requests-cache: 响应缓存,减少重复请求requests-toolbelt: 实用工具集合,如Multipart上传、流式请求等grequests: 基于gevent的异步请求requests-threads: 多线程请求支持学习路径
学习资源