Python和regex新手--我正在try 编写一个代码来替换我的数据框中与特定模式匹配的列中的值.
我的数据框中的一些样本值包括:自雇、退休(自营)
我的模式是--如果该值包含以self-或self-or self(空格)开头的单词[忽略self的大小写],则将整个值替换为"self employeed"
以下是我try 过的方法-
data = pd.read_csv('loan.csv',keep_default_na=False)
data['emp_title']=data['emp_title'].replace('^Self','Self Employed',regex=True)
有两个问题-
-
正则表达式似乎不正确.它是找到所有以self开头但不包含的单词.它正在考虑这个词的情况.
-
替换函数似乎只替换了单词"self",而不是整个值.例如:如果我的单元格中的值是"自雇",则Python似乎只替换了"自雇",并使该值成为"自雇".
如有任何帮助,我们不胜感激.