我试图使用regex标记Spacy中的一个单词,但我想添加一个条件:它内部的任何地方都不能包含符号"/".我的代码看起来像这样:

[{'lower': {"regex": "^.*(word).*?"}}]

我try 使用'来排除这个,但没有起作用.

所以例子:

  1. "subword w"标记:"subword"
  2. "subword/w"没有标记任何内容

推荐答案

try 一下: {'lower': {'REGEX': "^([^\/]*word[^\/]*)$"}}

Python相关问答推荐

Python -根据另一个数据框中的列编辑和替换数据框中的列值

运行回文查找器代码时发生错误:[类型错误:builtin_index_or_system对象不可订阅]

使用mySQL的SQlalchemy过滤重叠时间段

DataFrame groupby函数从列返回数组而不是值

Polars LazyFrame在收集后未返回指定的模式顺序

从收件箱中的列中删除html格式

_repr_html_实现自定义__getattr_时未显示

按列分区,按另一列排序

无法通过python-jira访问jira工作日志(log)中的 comments

按顺序合并2个词典列表

如何更改分组条形图中条形图的 colored颜色 ?

未调用自定义JSON编码器

基于Scipy插值法的三次样条系数

Beautifulsoup:遍历一个列表,从a到z,并解析数据,以便将其存储在pdf中.

解决Geopandas和Altair中的正图和投影问题

用由数据帧的相应元素形成的列表的函数来替换列的行中的值

用0填充没有覆盖范围的垃圾箱

如何在Pandas中用迭代器求一个序列的平均值?

将像素信息写入文件并读取该文件

如何在基于时间的数据帧中添加计算值