c++正则表达式如何匹配汉字

如题所述

按.NET的标准,\w本来就是可以匹配:汉字,字母,数字,下划线。的
所以一般\w可以满足需求了。

如果需要排除字母数字的话,可以这样:
(?![a-zA-Z0-9_])\w
>_>这样写估计效率不高

所以一般来说还是直接匹配指定的unicode码
\unnnn Unicode代码中十六进制代码为nnnn的字符

汉字(字符) [\u4e00-\u9fa5]
中文及全角标点符号(字符) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
温馨提示:内容为网友见解,仅供参考
无其他回答
相似回答