简单问题:
在c#,.net中,单词字符\w
的模式是什么?
我的第一个 idea 是它符合[A-Za-z0-9_]
,documentation告诉我:
Character class Description Pattern Matches \w Matches any \w "I", "D", "A", "1", "3" word character. in "ID A1.3"
这没有多大帮助.
而\w
似乎也与äöü
相匹配.还有什么?有没有更好的(确切的)定义?
简单问题:
在c#,.net中,单词字符\w
的模式是什么?
我的第一个 idea 是它符合[A-Za-z0-9_]
,documentation告诉我:
Character class Description Pattern Matches \w Matches any \w "I", "D", "A", "1", "3" word character. in "ID A1.3"
这没有多大帮助.
而\w
似乎也与äöü
相匹配.还有什么?有没有更好的(确切的)定义?
从documentation人中:
单词字符:\w
\w
匹配任何单词字符.单词字符是下表中列出的任何Unicode类别的成员.
Ll
(字母,小写)Lu
(大写字母)Lt
(字母、标题)Lo
(信件,其他)Lm
(字母,修饰符)Nd
(数字,十进制数字)Pc
(标点符号、连接器)如果指定了符合ECMAScript的行为,则
\w
相当于[a-zA-Z_0-9]
.