求,C#只过滤超链接a标签的正则表达式

如题所述

<a(?:(?!href=).)*href=(['""]?)(?<url>[^""'\s>]*)\1[^>]*>(?<text>(?:(?!</a>).)*)</a>

组名url可提取链接

组名text可提取内容

 

 

若不能解决,可追问,我继续帮你

追问

大师!怎么样才能不要把text过滤掉

追答

你可以举例说明,以便我准确的理解
比如
测试
你要的结果:测试

温馨提示:内容为网友见解,仅供参考
第1个回答  2014-08-13
Regex.Replace(input, "<a[^>]+>", "");

用C#怎么提取a标签的超链接?
第一种方法,正则表达式。如下所示 string reg = @"<a[^>]*href=([""'])?(?<href>[^'""]+)\\1[^>]*>";var item = Regex.Match(str, reg, RegexOptions.IgnoreCase);Console.WriteLine(item.Groups["href"].Value);第二种使用htmlagilitypack的xpath进行提取 HtmlNodeColle...

C#如何使用正则表达式提取超链接中的文字部分?就是<a>文字部分<\/a>中 ...
string innerHTML = m.Result("$1");\/\/ 得到正则的括号里的内容,就是a的innerHTML innerHTML = Regex.Replace(innerHTML, @"<[^>]*>", "",RegexOptions.IgnoreCase);\/\/ 替换掉里面的html,只保留文字 m = m.NextResult;\/\/ 循环匹配html里的下一个结果 } ...

C#怎么用正则表达式提取链接和图片标签的属性
StringCollection resultList = new StringCollection();try { Regex regexObj = new Regex(@"<a\\s*?href=""(.*?)"">\\s*?<img\\s*?src=""(.*?)"".*?title=""(.*?)"".*?\/>"); Match matchResult = regexObj.Match(subjectString); while (matchResult.Success) { re...

关于C#正则表达式截取代码的问题,网页中有很多<span class="g"> xxxxx...
为什么要用正则表达式呢?js不是简单的多嘛。.innerHTML这个属性便能得到一对标签中所有的内容。

C# 通过正则表达式进行html过滤 只留文字,图片,<p>,<br>
Match match){ string v = match.ToString();\/\/图片,<p>,<br>正则表达式 Regex rx = new Regex(@"^<(p|br|img.*)>$",RegexOptions.Compiled | RegexOptions.IgnoreCase); \/\/ if (rx.IsMatch(v)){ return v; \/\/保留图片,<p>,<br> } else { return ""; \/\/过滤掉 } });} ...

C# 求个正则表达式 过滤文章img中src除外意外的所有属性
按照你的要求写的C#正则表达式 (?is)(<img ).*?(src=\\".*?\\").*?(\/>) 替换为 $1$2$3 完整的C#过滤文章img中除src以外所有属性的程序如下 using System;using System.Text.RegularExpressions;namespace retainsrc{ class RetainSRC{ static void Main(string[] args){ string str="<...

C#常用的正则表达式 30个C#正则表达式介绍_C#常用的正则表达式 30个C#...
在C#编程中,正则表达式是处理文本的强大工具。这里列举了30个常用的C#正则表达式,它们分别适用于各种字符串验证需求。让我们一一了解:1. 检查整数:"^-?\\d+$"2. 仅正整数:"^[0-9][1-9][0-9]$"3. 仅负整数:"^-[0-9][1-9][0-9]$"4. 非负整数(包括0):"^\\d+$"5. 非正...

C#如何获取指定Url下特定标签的内容?
可以使用正则表达式,提取出来。代码如下:using System;using System.Text.RegularExpressions;namespace WebClientDemo{class Program{static void Main(string[] args){string s = @"<br>123<hr><br>456<hr><br>789<hr>";var matches = Regex.Matches(s, "<br>(.+?)<hr>");foreach (Match...

...description里字符串的正则表达式,困了很久了,请大侠们帮帮忙。_百...
keywords:<meta\\s+name=\\"keywords\\"\\s+content=\\"(.*?)\\"description同理,将上面的keywords替换为description就可以了。

C# 怎么截取到多个<li><\/li>标签中特定的一个(特定的<li><\/li>中包含...
可以用正则表达式实现(自己娘度正则表达式)如果觉得正则不好掌握 ,可以先查找<li> 然后把后面的字符串存入另一个变量,在这个变量中查找<\/il> 截取这之前的部分就是特定字符串了

相似回答