python在用requests获取网页发现是乱码怎么办
的有关信息介绍如下:python在用requests获取网页发现是乱码怎么办?今天像获取网页上的电影名字,发现获取的内容中文部分都是乱码,这个问题我们要怎么办呢?
我们先写一个简单的请求代码
而获取的内容我们可以看到是一些我们看不懂的字符
对于这种情况,我一般就是在请求之后加上这一段
html.encoding = 'UTF-8'
但发现这里还是有问题,那就说明编码还是错误的
那我们只要找到对应的就可以了
先用浏览器打开网页,按F12然后找到这个head开头的
在里面找到charset后面接的就是我们要的gb2312
而我们只要把这个替换掉刚刚的UTF-8即可
这次返回的内容就没有问题了
一般我们请求的时候可以不用加编码的,但有些网页需要的时候我们可以尝试加上utf-8,如果不行可以在打开网页查看是什么编码类型,根据这个编码再来解码即可