如何用python解析一个网页并提取其内容

如题所述

第1个回答  2012-10-18
用程序模拟访问网页获得网页内容的话就用urllib和urllib2来模拟请求

若是要截取网页中的部分内容,那就先获得全部html内容,然后直接用re根据html标签来匹配分段,然后获取
第2个回答  2012-10-09
你可以用用现成的python模板:beautifulsoup。
或者最起码你得了解Python的正则,然后自己去用正则解析网页。本回答被网友采纳
第3个回答  2012-10-15
urllib urllib2 re这些模块对你或许有帮助
相似回答