我试图抓取'</html>'
标记之后的所有内容并将其删除,但我的代码似乎没有任何作用..replace()
不支持正则表达式吗?
z.write(article.replace('</html>.+', '</html>'))
我试图抓取'</html>'
标记之后的所有内容并将其删除,但我的代码似乎没有任何作用..replace()
不支持正则表达式吗?
z.write(article.replace('</html>.+', '</html>'))
不是的.Python中的正则表达式由re
模块处理.
article = re.sub(r'(?is)</html>.+', '</html>', article)
一般而言:
text_after = re.sub(regex_search_term, regex_replacement, text_before)