我有下面这样的句子
w = "Chiang Wei-kuo (traditional Chinese: 蔣緯國; simplified Chinese: 蒋纬国; pinyin: Jiǎng Wěiguó, or Wego Chiang; and Nadezhda Nikitichna Mikhalkova (Russian: Надежда Никитична Михалкова;"
我用下面的正则表达式来捕捉非拉丁单词(蔣緯國, 蒋纬国, Надежда Никитична Михалкова)
for match in re.finditer(r'(?<=:\s)\W+(?=;)', w):
print(match[0])
所以我试图捕捉符号:
和符号;
之间的任何非单词字符\W
.但它似乎不起作用.我也试着用[^a-zA-Z0-9_]
代替\W
,但仍然不起作用.有什么帮助吗?