帮忙写一个PHP的正则表达式,提取文章中的第一个UL列表。

例如在一篇文章中有一个UL列表,我需要把整个这一部分提取出来 <ul> <li>aaaaaaa</li> <li>aaaaaaa</li> </ul>
ekai_he,我要的正是你说的这个意思,只是按你的代码我试了下,提取的内容为空,$data 是一篇文章的HTML代码,已经从数据库里边读取出来了,我只是想提取这篇文章的html代码中的第一个 从<UL>开始到</ul>结尾的代码

这些资料提供少了 ,我大概说下做法;
$data=值为整个文章的html代码; 如果是网页的话可以使用$data = vita_get_url_content("http://www.baidu.com"); 这样的方式获得;
eregi(" <ul> <li>(.*)<\/li> <\/ul>",$data, $str);

echo $str[1] ; //这样就获得了<ul> 段的html代码了

还有不明白的地方可以在 百度Hi里跟我留言!

eregi("<br /><ul>
<li>(.*)</li>
</ul>",$data, $str);

echo "<ul><li>".$str[1]."</li></ul>";

复制上面的,不要修改 上面代码被折行了 也不要修改
温馨提示:内容为网友见解,仅供参考
无其他回答

如何使用php正则表达式提取ul和ol标签里的内容?比如li标签的内容,并且...
<?php str = '<ul><li><a href="#">内容111<\/a><\/li><li><a href="#">内容111<\/a><\/li><li><a href="#">内容111<\/a><\/li><li><a href="#">内容111<\/a><\/li><\/ul> <ol><li><a href="#">内容2<\/a><\/li><li><a href="#">内容2<\/a><\/li><li><a ...

求一PHP的正则表达式
第一个可以用 "[\\d]{1,3}.[\\d]{1,3}.[\\d]{1,3}.[\\d]{1,3}"关于第2,3个用 preg_match_all()函数提取4个中文,正则表达式是[\Α-\¥]+(这个 是提取中文的)然后在数组中返回第二个和第三个就可以了。正则表达式我只是入门级,希望能帮到你 ...

正则表达式 获取 ul中的内容!高手帮忙 谢谢啊
思路是 <ul class='adf'> 开始,如果找到 "<" 则记录 这个“< ”后面的 "字符串+>" ,作为captured group1, 在后面一直找,直到找到 "<\/"+"captured gourp1",如果只是1层嵌套,那么这种内嵌的<> <\/> 都循环*次后, 找到一个<\/ul>,则退出匹配,得到中间的结果了。否则按照1楼的...

提取某一段div标签之间内容的正则表达式怎么写
public static void main(String[] args) { String source="<div class=\\"hdwiki_tmml \\"><a class=\\" FCK__AnchorC\\" name=\\"1\\">是大家是否<\/a& gt;<\/div><div class=\\"hdwiki_tmml\\"><a name=\\"2\\">士大夫士 大夫<\/a><\/div> ";StringBuilder result=new StringBuilder()...

正则表达式,想要获取多个子匹配,该如何写?
1. 提取多个匹配文本: (?<=span>)\\d+?(?=<\\\/)2. 提取一个匹配文本: [^\\d]+

如何从一个字符串中提取汉字
\/<(.*)>.*<\\\/\\1>\/这个就是匹配的所有html代码的正则。补充:using System.Text.RegularExpressions;\/\/需要引用 \/\/ 利用正则表达式去掉"<"和">"之间的内容 private string StripHT(string strHtml){ Regex regex=new Regex("<.+?>",RegexOptions.IgnoreCase);string strOutput=regex.Replace(str...

如何用python爬取豆瓣读书的数据
实验成功后,我们就可以爬取数据并导入到数据库中了,以下为全部源码,特殊情况会用注释一一说明。 import requestsfrom bs4 import BeautifulSoupimport timeimport reimport pymysqlfrom channel import channel #这是我们第一个程序爬取的链接信息import randomdef ceshi_person(person):try:person = int(person.get_...

...name="name"><\/td> <\/tr>如何写正则表达式限定只能输入
b?c?d...做为项目编号 I:表以大写罗马数字做为项目编号 i:表以小写罗马数字做为项目编号 1:表以阿拉伯数字做为项目编号(预设值) 起始数字 -- start <ol start=欲开始计数的序数> 指定编号 -- value <li value=欲指定的序数> 四、无序号的清单 <ul> <li>项目1 <li>项目2 <li>项目3 <\/ul> ...

php静态化页面方法,伪静态的也可以
http:\/\/www.2cto.com \/soft.php\/1,100,8630.html CODE:\/\/利用server变量 取得PATH_INFO信息 该例中为 \/1,100,8630.html 也就是执行脚本名后面的部分 if(@$path_info =$_SERVER["PATH_INFO"]){ \/\/正则匹配一下参数 if(preg_match("\/\\\/(\\d+),(\\d+),(\\d+)\\.html\/si",$...

虫师django是如何工作的
1、对象关系映射(ORM,object-relationalmapping):以Python类形式定义你的数据模型,ORM将模型与关系数据库连接起来,你将得到一个非常容易使用的数据库API,同时你也可以在Django中使用原始的SQL语句。 2、URL分派:使用正则表达式匹配URL,你可以设计任意的URL,没有框架的特定限定。像你喜欢的一样灵活。 3、模版系统:使用...

相似回答
大家正在搜