python爬取网页使用read()读取内容decode转换报错的解决方案
之前有用python爬取图片,但是最近爬取网页时老是报错,报错代码如下:发生异常: UnicodeDecodeError'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte是解码的错误,翻阅资料,可能使用由于对方网页传输经过gzip压缩导致的问题,我们需要对其内容进行解压缩,然后再进行decode转码解决方法是#导入zli...
之前有用python爬取图片,但是最近爬取网页时老是报错,报错代码如下:发生异常: UnicodeDecodeError'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte是解码的错误,翻阅资料,可能使用由于对方网页传输经过gzip压缩导致的问题,我们需要对其内容进行解压缩,然后再进行decode转码解决方法是#导入zli...
1、escape和unescape原理:对除ASCII字母、数字、标点符号 @ * _ + - . / 以外的其他字符进行编码。编码:escape('http://www.baidu.com?name=zhang@xiao@jie&order=1')结果:"http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26ord...