我正在try 用RegEx解析维基百科的文件转储.
我希望匹配并删除一组括号之间的所有内容,包括括号本身.我还希望能够判断左方括号后的第一个单词是否是某个单词,如果是,请不要删除它.在我的例子中,单个括号由两个字符组成,比如{{
和}}
.
例如,请考虑以下顺序:
{{{{}}{{}}{{}}}} Don't delete me {{notmeeither}}
个
使用以下正则表达式:
{{(?!(notmeeither))(.|\n)*?\}}
结果匹配前{{{{}}
个,从而产生剩余的方括号.让匹配变得贪婪无济于事,因为它会影响中间的文本以及不应该匹配的文本.我该怎么做呢?蒂娅.
编辑:使需求更加具体