mysql正则表达式替换字符串

<p>【导读】:几十字</p>

<p>  内容几百字....  </p>

我想把前面导读<p>【导读】:几十字</p>去除掉,数据大,在_htmls表的result字段中
求用mysql正则表达式替换字符

mysql的正则匹配用regexp,而替换字符串用REPLACE(str,from_str,to_str)
举例如下:
UPDATE myTable SET HTML=REPLACE(HTML,'<br>','') WHERE HTML REGEXP '(<br */*>\s*){2,}'
达到的效果:会把所有<br>全部替换掉。
mysql中常用的替换函数

所用到的函数:
locate:

LOCATE(substr,str)
POSITION(substr IN str)
返回子串 substr 在字符串 str 中第一次出现的位置。如果子串 substr 在 str 中不存在,返回值为 0:

substring

SUBSTR(str,pos,len): 由<str>中的第<pos>位置开始,选出接下去的<len>个字元。

replace

replace(str1, str2, str3): 在字串 str1 中,当str2 出现时,将其以 str3 替代。
温馨提示:内容为网友见解,仅供参考
第1个回答  2020-05-19

MySQL 一直以来都支持正则匹配,不过对于正则替换则一直到MySQL 8.0 才支持。对于这类场景,以前要么在MySQL端处理,要么把数据拿出来在应用端处理。

比如我想把表y1的列str1的出现第3个action的子 串替换成dble,怎么实现?


1. 自己写SQL层的存储函数。代码如下写死了3个,没有优化,仅仅作为演示,MySQL 里非常不建议写这样的函数。

    mysql

    DELIMITER $$

    USE `ytt`$$

    DROP FUNCTION IF EXISTS `func_instr_simple_ytt`$$

    CREATE DEFINER=`root`@`localhost` FUNCTION `func_instr_simple_ytt`(

    f_str VARCHAR(1000), -- Parameter 1

    f_substr VARCHAR(100),  -- Parameter 2

    f_replace_str varchar(100),

    f_times int -- times counter.only support  3.

    ) RETURNS varchar(1000)

    BEGIN

    declare v_result varchar(1000) default 'ytt'; -- result.

    declare v_substr_len int default 0; -- search string length.

    set f_times = 3; -- only support  3.

    set v_substr_len = length(f_substr);

    select instr(f_str,f_substr) into @p1; -- First real position .

    select instr(substr(f_str,@p1+v_substr_len),f_substr) into @p2; Secondary virtual position.

    select instr(substr(f_str,@p2+ @p1 +2*v_substr_len - 1),f_substr) into @p3; -- Third virtual position.

    if @p1 > 0  && @p2 > 0 && @p3 > 0 then -- Fine.

    select

    concat(substr(f_str,1,@p1 + @p2 + @p3 + (f_times - 1) * v_substr_len  - f_times)

    ,f_replace_str,

    substr(f_str,@p1 + @p2 + @p3 + f_times * v_substr_len-2)) into v_result;

    else

    set v_result = f_str; -- Never changed.

    end if;

    -- Purge all session variables.

    set @p1 = null;

    set @p2 = null;

    set @p3 = null;

    return v_result;

    end;

    $$

    DELIMITER ;

    -- 调用函数来更新:

    mysql> update y1 set str1 = func_instr_simple_ytt(str1,'action','dble',3);

    Query OK, 20 rows affected (0.12 sec)

    Rows matched: 20  Changed: 20  Warnings: 0

    2. 导出来用sed之类的工具替换掉在导入,步骤如下:(推荐使用)

    1)导出表y1的记录。

    mysqlmysql> select * from y1 into outfile '/var/lib/mysql-files/y1.csv';Query OK, 20 rows affected (0.00 sec)


    2)用sed替换导出来的数据。

    shellroot@ytt-Aspire-V5-471G:/var/lib/mysql-files#  sed -i 's/action/dble/3' y1.csv


    3)再次导入处理好的数据,完成。

    mysql

    mysql> truncate y1;

    Query OK, 0 rows affected (0.99 sec)

    mysql> load data infile '/var/lib/mysql-files/y1.csv' into table y1;

    Query OK, 20 rows affected (0.14 sec)

    Records: 20  Deleted: 0  Skipped: 0  Warnings: 0

    以上两种还是推荐导出来处理好了再重新导入,性能来的高些,而且还不用自己费劲写函数代码。

    那MySQL 8.0 对于以上的场景实现就非常简单了,一个函数就搞定了。

    mysqlmysql> update y1 set str1 = regexp_replace(str1,'action','dble',1,3) ;Query OK, 20 rows affected (0.13 sec)Rows matched: 20  Changed: 20  Warnings: 0


    还有一个regexp_instr 也非常有用,特别是这种特指出现第几次的场景。比如定义 SESSION 变量@a。

    mysqlmysql> set @a = 'aa bb cc ee fi lucy  1 1 1 b s 2 3 4 5 2 3 5 561 19 10 10 20 30 10 40';Query OK, 0 rows affected (0.04 sec)


    拿到至少两次的数字出现的第二次子串的位置。

    mysqlmysql> select regexp_instr(@a,'[:digit:]{2,}',1,2);+--------------------------------------+| regexp_instr(@a,'[:digit:]{2,}',1,2) |+--------------------------------------+|                                   50 |+--------------------------------------+1 row in set (0.00 sec)


    那我们在看看对多字节字符支持如何。

    mysql

    mysql> set @a = '中国 美国 俄罗斯 日本 中国 北京 上海 深圳 广州 北京 上海 武汉 东莞 北京 青岛 北京';

    Query OK, 0 rows affected (0.00 sec)

    mysql> select regexp_instr(@a,'北京',1,1);

    +-------------------------------+

    | regexp_instr(@a,'北京',1,1)   |

    +-------------------------------+

    |                            17 |

    +-------------------------------+

    1 row in set (0.00 sec)

    mysql> select regexp_instr(@a,'北京',1,2);

    +-------------------------------+

    | regexp_instr(@a,'北京',1,2)   |

    +-------------------------------+

    |                            29 |

    +-------------------------------+

    1 row in set (0.00 sec)

    mysql> select regexp_instr(@a,'北京',1,3);

    +-------------------------------+

    | regexp_instr(@a,'北京',1,3)   |

    +-------------------------------+

    |                            41 |

    +-------------------------------+

    1 row in set (0.00 sec)

    那总结下,这里我提到了 MySQL 8.0 的两个最有用的正则匹配函数 regexp_replace 和 regexp_instr。针对以前类似的场景算是有一个完美的解决方案。

Mysql正则表达式如何表达转义字符? 如我想匹配中括号、竖线等字符该怎么...
select '|' rlike '\\\\|' 也是一样的 O(∩_∩)O~

MySQL正则表达式使用详解mysql中使用正则
1. REGEXP:检查一个字符串是否与正则表达式匹配。2. RLIKE:检查一个字符串是否与正则表达式匹配,与REGEXP相同。3. REGEXP_REPLACE:替换匹配正则表达式的子字符串。4. REGEXP_INSTR:返回与正则表达式匹配的字符串的位置。示例代码 以下是一个例子,用于说明MySQL正则表达式的使用方法:SELECT * FROM...

replace MYSQL字符替换函数sql语句分享(正则判断)
f1字段的abc替换为def UPDATE tb1 SET f1=REPLACE(f1,'abc','def');REPLACE(str,from_str,to_str)在字符串 str 中所有出现的字符串 from_str 均被 to_str替换,然后返回这个字符串:mysql> SELECT REPLACE('www.mysql.com','w','Ww');-> 'WwWwww.mysql.com'这个函数是多字节安全的。示...

MySQL数据库-正则表达式
在MySQL数据库中,正则表达式通过`REGEXP`关键字实现字符串匹配。这一功能强大而灵活,能显著提升数据检索与处理的效率。然而,具体语法与应用细节较为复杂,且可能因不同版本的MySQL而有所差异。因此,深入研究并实践使用是掌握这一功能的关键。在实际应用中,`REGEXP`关键字用于执行正则表达式的模式匹配。

MySQL如何去掉空格cmysql去掉空格
REGEXP_REPLACE函数是MySQL中的正则表达式函数之一,可以匹配并替换字符串。正则表达式是一种强大的文本处理工具,可以实现多种复杂的字符串操作。在下面的例子中,我们使用REGEXP_REPLACE函数去掉字符串中的所有空格:SELECT REGEXP_REPLACE(‘ This is a test ‘, ‘ ‘);运行...

mysql中使用正则表达式
如果你的产品编号字段下,有“半” 、“长” 这样的单个记录,就能匹配到了。因为你限制了显示记录为两条,所以有not语句其实是把所以记录都匹配上了,并不是正好相反的结果哦 应该这样写 select * from db.tb where 产品编号 RegExp '^[\一-\龥].*' limit2 ...

sql-正则表达式
7. 函数regexp_replace()用于根据正则表达式替换字符串中的特定模式,例如:REPLACE('text', 'pattern', 'replacement');8. regexp_substr()则用于提取符合模式的子串,如:SUBSTR('text', INSTR('text', 'pattern', [start_index]));9. 特殊字符匹配需要使用反斜杠(\\)进行转义,如匹配`\\`需...

深入了解MySQL空白字符背后的秘密mysql不是空白字符
可以使用正则表达式来匹配和替换字符串中的空白字符。例如,以下查询将字符串中的所有空白字符替换为空格:SELECT REGEXP_REPLACE(‘foo\\tbar\\nbaz’, ‘[\\t\\n\\r ]+’, ‘ ‘) AS replaced_string;结论 在本文中,我们了解了MySQL中的空白字符类型,以及它们...

MySQL排除数字匹配方法mysql不包含数字
1. 正则表达式 MySQL提供了REGEXP和NOT REGEXP操作符,可以用于正则表达式匹配。我们可以利用这两个操作符,来排除字符串中的数字。例如,要排除包含数字的字符串,可以使用如下SQL语句:SELECT * FROM table_name WHERE column_name NOT REGEXP ‘[0-9]’;其中,[0-9]表示匹配任意一个...

mysql语句中包含正则表达式
select ','+字段+',' from table where 字段 like ',1,' 建议最好还是新建章表进行关联

相似回答