UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf' in position 1235: illegal multibyte sequence RT怎么破?
在Python自带的交互式模式下编辑,交互式下,一行只能放一段代码import requests , 这一行要和下面你定义的函数隔开为两段代码
也就是import requests 要按回车键,然后在新的【>>>】开始处再输入你定义的函数代码
一些网页可以用Python的urllib来抓取内容,基本上没有问题
但是有的网页内容在浏览器看到的和抓取的有很大区别,抓取的基本上是框架实质内容没有
代码如下:uhtml = html.decode('utf-8') 如果把UTF-8换成别的会报错,那应该就是UTF-8了吧?
追答应该是了。
可以print一下,看能否正确输出就是了。
输出结果就是我问题中的那个样子.........
追答你不是说“如果把UTF-8换成别的会报错"?
到底utf8会不会错呢?
你可以用浏览器打开该页面看看编码是什么啊!
看了,是utf-8
追答你的python编程环境是什么?支持utf-8吗?还是只能gbk输出?
试试:
print html.decode('utf-8') .encode('gbk')本回答被提问者采纳