Python怎么通过 正则表达式提取汉字

字符串如下,怎么通过正则表达式拿到<p></p>标签里的内容呢
<h1 class="title">
<p>晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上111<br />晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上2223……</p>
</h1>

python有很多网页解析的包啊,BeautifulSoup,lxml之类的都很好用,犯不着正则

举个栗子:

from bs4 import BeautifulSoup
text = '<h1 class="title">.....</h1>'
soup = BeautifulSoup(text)
print soup.text

温馨提示:内容为网友见解,仅供参考
第1个回答  2016-06-17
(?<=<p>).*?(?=</p>)追问

嗯,谢谢,这个可以。 但是我需要的是作为标识, 可以再帮忙写一个吗,

做头,做结尾的

追答

这个我还真不会

追问

好的,谢谢。 如果没有更好的回答 我会采纳你,

本回答被提问者采纳
相似回答