Python Requests 中文内容乱码
今天写home assistant插件,用requests抓取内容时,中文直接乱码输出,肿么办??
搜索了一下相关的说明,发现 requests 只会简单地从服务器返回的响应头的 Content-Type 去获取编码,如果有 Charset 才能正确识别编码,否则就使用默认的 ISO-8859-1,这样一来某些不规范的服务器返回就必然乱码了。
这个问题出在就是解析网页编码出现问题了:
只要用requests进行如下如下处理:
方法1:
import requests
url="https://www.baidu.com/"
req =requests.get(url)
req.encoding='utf-8' **#显式地指定网页编码,一般情况可以不用**
print(req.text)
方法2:
str = 网页内容
str.encode('ISO-8859-1').decode('utf8')