我正在运行下面的代码来清理文本

import pandas as pd

def not_regex(pattern):
        return r"((?!{}).)".format(pattern)
    
tmp = pd.DataFrame(['No one has a European accent either @',
                    'That the kid   reminds me of Kevin'])

tmp[0].str.replace(not_regex('(\\b[-/]\\b|[a-zA-Z0-9])'), ' ') 

然后它返回一个警告

<ipython-input-8-ef8a43f91dbd>:9: FutureWarning: The default value of regex will change from True to False in a future version.
  tmp[0].str.replace(not_regex('(\\b[-/]\\b|[a-zA-Z0-9])'), ' ')

你能详细说明这一警告的原因吗?

推荐答案

Pandas 1.2.0 release notes:

在future 的版本中,Series.str.replace()的默认值regex将从True更改为False.此外,设置regex=True(GH24804)时,单字符正则表达式不会被视为文字字符串

也就是说,现在明确使用正则表达式:

dframe['colname'] = dframe['colname'].str.replace(r'\D+', regex=True)

Python-3.x相关问答推荐

如何在python中有效地使用多处理和pytube库来加快下载速度?

Pandas 数据帧断言等同于NaN

如何将参数/值从测试方法传递给pytest的fixture函数?

为什么 tkinter 在 tkinter 窗口外计算鼠标事件?

对大型数据框中的选定列进行重新排序

DataFrame列中如何迭代重复值?

Python 列表求和所有出现的保留顺序

以不规则频率识别数据框日期时间列上缺失的日期,并用关联值填充它们

!date 的命令无法从 jupyter notebook 运行

为什么最简单的流光示例会出错?

Pandas数据单调行为

是否将dict转换为一个数据帧,每个值都有重复的键?

python 3中的SQLAlchemy ER图

django.core.exceptions.ImproperlyConfigured

理解 Keras 的 ImageDataGenerator 类中的 `width_shift_range` 和 `height_shift_range` 参数

如何从另一个目录导入 python 包?

TensorFlow:dataset.train.next_batch 是如何定义的?

如何使 Python3 成为 Geany 中的默认 Python

将 Python SIGINT 重置为默认信号处理程序

如何阻止散景在 Jupyter Notebook 中打开新标签?