比如今天是6月30日,我抓取出来的网页信息却是26日的。然而我通过电脑浏览器查看网页源代码确实是30日。我的抓取代码如下:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
import urllib2
site="http://aqicn.org/city/beijing/"
html=urllib2.urlopen(site)
text=html.read()
fp=open(r'beijing.txt',"w")
fp.write(text)
fp.close()
能否提示一下该如何从js里提取呢?刚刚接触python半个月,不是很了解这部分。
追答类似于我给你的这个页面一样,你用浏览器打开后台就可以查找了,我用的是火狐的firebug