php正则表达式获取div标签中的a标签href问题

<div class="zx_list_l">
<ul>
<li>
<a href="xxx" target="_blank" class=""></a>

</li>
</ul>
</div>
获取a标签href 用正则怎么获取
页面上有很多<li>标签都不是我想要的，我想要的就是在这个div标签中的<li>里面的A连接
用正则的话必须先获取div里面的内容，在获取<ul><li>里面A标签连接

效果：

Array
(
[0] => http://news.cjcp.com.cn/2012/0917/4316066.html
[1] => http://news.cjcp.com.cn/2012/0917/4316065.html
[2] => http://news.cjcp.com.cn/2012/0917/4316064.html
[3] => http://news.cjcp.com.cn/2012/0917/4316063.html
[4] => http://news.cjcp.com.cn/2012/0917/4316062.html
[5] => http://news.cjcp.com.cn/2012/0917/4316061.html
[6] => http://news.cjcp.com.cn/2012/0917/4316060.html
)

举报该文章

其他看法

第1个回答 2012-09-17

先取出div,然后再处理
<a href="([^"]+)"[^>]+

话说这是基础……您还是好好看书看例子吧

第2个回答推荐于2016-10-31

现获取此div的html串，然后处理。
例如：
<ul>
<li><Ma hrMef="hMtMtp://xxx1" tarMget="_blaMnk" claMss=""></Ma></li>
<li><Ma hrMef="hMtMtp://xxx2" targMet="_blaMnk" claMss=""></Ma></li>
</ul>
正则：hMtMtp.+?(?=".+</a>.*</li>)
输出：
hMtMtp://xxx1
hMtMtp://xxx2
（把上面大写的M都去掉）本回答被提问者和网友采纳

提取某一段div标签之间内容的正则表达式怎么写
public static void main(String[] args) { String source="<div class=\\"hdwiki_tmml \\"><a class=\\" FCK__AnchorC\\" name=\\"1\\">是大家是否<\/a& gt;<\/div><div class=\\"hdwiki_tmml\\"><a name=\\"2\\">士大夫士大夫<\/a><\/div> ";StringBuilder result=new StringBuilder()...

正则表达式获取div标签里面的内容
第一、二个字符：<div[^>]>\\s*(?:<[^>]+>\\s*)+(\\w+)\\s*(?:<[^>]+>\\s*)+(\\w+)依次类推。较麻烦，可以用循环替换方法，将div标签中的所有 <> 内容替换为空，剩余的字符就有所有的字符串。<div[^>]+>.*(<[^>]+>)将捕获替换为空，需要多次查找替换，直到查找不到...

怎么用正则表达式提取下面<div>...<\/div>中的内容,里面有很多换行_百 ...
1 取出div内内容 string result = Regex.Match(html, @"<div.*?id=['""]artibody['""]>([\\W\\w]*?)<\/div>", RegexOptions.IgnoreCase).Groups[1].Value;2 去标签 result = Regex.Replace(result, @"<\/?p>", "", RegexOptions.IgnoreCase);...

用正则表达式得到某个div标签内部的div标签中的内容
先说结论：极度不推荐你使用这样的正则去从html中提取相关内容。原因：除非，你确保你的代码，使用正则表达式去匹配html内容的代码，所需处理的html是很简单的，内容很少的，嵌套很少的，否则，稍微复杂点的html代码，N多标签，甚至本身html就是不完整的，标签有误的。那么通过写正则表达式去处理的话，就...

如何用Python提取网页标签中的文本信息?
一、使用内置的正则表达式 Python代码 import reregex1 = r"<a[^>]+?>(.+?)<\/a>"regex2 = r"\/span>([\\s\\S]+?)<"html = ("<div class=\\"question\\">\\n""<span><a class=\\"normal\\" name=\\"question-2c26d7bd-90c1-415a-b881-2c560414340b\\">1、<\/a><\/span> 以下...

php正则表达来获取html中的部分内容
正则表达式如下：'%<div class="wap2"><span>功能<\/span>(.*?)<\/div>%si'以下是代码，经测试，运行正常：<?php str = '<div class="wap2"><span>功能<\/span>这里面是要获取的内容，不能确定什么字符，可能是数字(123456…)字母（babaidn…），特殊浮等(o_O\\(^o^)\/…)<\/div>';pa...

求高手帮我写一个获取网页内容的php正则表达式
如果你要<div class="nav" monkey="nav">和<div class="head-ad">之间的所有源码，用 preg_match 就可以，不用preg_match_all ，如果你要里面的所有的 <li><\/li>标签中的内容，可以用preg_match_all \/\/提取所有代码 pattern = '\/<div class="nav" monkey="nav">(.+?)<div class="...

求一PHP的正则表达式
第一个可以用 "[\\d]{1,3}.[\\d]{1,3}.[\\d]{1,3}.[\\d]{1,3}"关于第2,3个用 preg_match_all()函数提取4个中文，正则表达式是[\Α-\￥]+（这个是提取中文的）然后在数组中返回第二个和第三个就可以了。正则表达式我只是入门级，希望能帮到你 ...

正则表达式能匹配a标签之间所有内容
str=str.replace(\/<\/g,'<');str=str.replace(\/>\/g,'>');var reg=\/<a[^>]*>.*(?=<\\\/a>)<\\\/a>\/gi;alert(str.replace(reg,''));

js获取a标签的href值
js获取a标签的href值的方法和操作步骤如下：1、首先，打开html编辑器，如下图所示。2、其次，完成上述步骤后，创建一个新的html文件，例如index.html，然后编写相关代码，如下图所示。3、接着，完成上述步骤后，在index.html的<script>标记中，输入js代码：$('body').append($('a').attr('href'...

相似回答

大家正在搜