我试图抓取'</html>'标记之后的所有内容并将其删除,但我的代码似乎没有任何作用..replace()不支持正则表达式吗?

z.write(article.replace('</html>.+', '</html>'))

推荐答案

不是的.Python中的正则表达式由re模块处理.

article = re.sub(r'(?is)</html>.+', '</html>', article)

一般而言:

text_after = re.sub(regex_search_term, regex_replacement, text_before)

Python相关问答推荐

不允许 Select 北极滚动?

根据客户端是否正在传输响应来更改基于Flask的API的行为

在numpy数组中寻找楼梯状 struct

使用类型提示进行类型转换

将CSS链接到HTML文件的问题

如何为需要初始化的具体类实现依赖反转和接口分离?

如何将列表从a迭代到z-以抓取数据并将其转换为DataFrame?

在聚合中使用python-polars时如何计算模式

具有不同坐标的tkinter canvs.cocords()和canvs.moveto()

try 在单个WITH_COLUMNS_SEQ操作中链接表达式时,使用Polars数据帧时出现ComputeError

删除另一个div中的特定div容器

搜索结果未显示.我的URL选项卡显示:http://127.0.0.1:8000/search?";,而不是这个:";http://127.0.0.1:8000/search?q=name";

如何省略所有Pandas 数据帧

nameError_C未定义

优化数组加法(y,x,RGBA)

LookupError:使用Django-Configurations时未安装标签为admin&39;的应用程序

用于判断x=()的&Quot;isInstance()和Not&Quot;vs&Quot;==&Quot;

如何reshape 极地数据帧?

特定 struct 中的最大元素

为什么一些地块有网格线,而另一些地块没有网格线?