Python怎么通过正则表达式提取汉字

字符串如下，怎么通过正则表达式拿到<p></p>标签里的内容呢
<h1 class="title">
<p>晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上111<br />晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上2223……</p>
</h1>

举报该文章

相关建议推荐于2018-03-21

python有很多网页解析的包啊，BeautifulSoup,lxml之类的都很好用，犯不着正则

举个栗子：

from bs4 import BeautifulSoup
text = '<h1 class="title">.....</h1>'
soup = BeautifulSoup(text)
print soup.text

温馨提示：内容为网友见解，仅供参考

当前网址：https://11.t2y.org/zz/fv4fm7mvs78vpqm7sp4.html

第1个回答 2016-06-17

(?<=<p>).*?(?=</p>)追问

嗯，谢谢，这个可以。但是我需要的是作为标识，可以再帮忙写一个吗，

做头，做结尾的

追答

这个我还真不会

追问

好的，谢谢。如果没有更好的回答我会采纳你，

本回答被提问者采纳

相似回答

大家正在搜

python 如何用正则表达式提取字符串中的中文字符？

python怎么用正则表达式提取中文？

python正则表达式从一行汉字中提取出数字

python正则表达式中要匹配汉字怎么弄

python正则表达式提取字符串中的中文字符串如下而且是...

python，用正则表达式匹配特定汉字

Python用正则表达式截取中文

python 正则表达式提取字符串