匹配+字符串的Python RegEx，直到找到下一个匹配项

发布于02月06日

我有一个从数据库出口，其中包含产品数据.每种产品的分隔使用逗号，但一些产品名称也包含逗号.

因此，我们的结局是一团糟，比如:

13371337:Bat,TH,Li-Met,Blub,9.5V,370mAHr,1/2_AA-Cell,50pcs,13351234:Radio - Antenna 2.4 GHz AB/C midi (10p),15642345:Board SMB - Some Magic Board,95653345:Board SMK 6 - Some Magic Knobs - Mod6,56735632:Control Unit Z65 - Mod9

我需要一个正则表达式，它将拆分为:

13371337:Bat,TH,Li-Met,Blub,9.5V,370mAHr,1/2_AA-Cell,50pcs

13351234:Radio - Antenna 2.4 GHz AB/C midi (10p)

15642345:Board SMB - Some Magic Board

95653345:Board SMK 6 - Some Magic Knobs - Mod6

56735632:Control Unit Z65 - Mod9

我最终得到了一个正则表达式[0-9]{5,9}，它可以很好地分隔产品编号.

然后我try :[0-9]{5,9}[^@]+，由于增加了逗号，它只与第一个字符串部分匹配.

有没有办法也包括上面所示的以下字符串？

import re s = "13371337:Bat,TH,Li-Met,Blub,9.5V,370mAHr,1/2_AA-Cell,50pcs,13351234:Radio - Antenna 2.4 GHz AB/C midi (10p),15642345:Board SMB - Some Magic Board,95653345:Board SMK 6 - Some Magic Knobs - Mod6,56735632:Control Unit Z65 - Mod9" pattern = r"\b[0-9]{5,9}:.*?(?=,\b[0-9]{5,9}:|$)" result = re.findall(pattern, s) print(result)

[ '13371337:Bat,TH,Li-Met,Blub,9.5V,370mAHr,1/2_AA-Cell,50pcs', '13351234:Radio - Antenna 2.4 GHz AB/C midi (10p)', '15642345:Board SMB - Some Magic Board', '95653345:Board SMK 6 - Some Magic Knobs - Mod6', '56735632:Control Unit Z65 - Mod9' ]

匹配+字符串的Python RegEx，直到找到下一个匹配项

推荐答案

Python相关问答推荐

如何在箱形图中添加绘制线的传奇？

Polars：用氨纶的其他部分替换氨纶的部分

Python解析整数格式说明符的规则？

在极性中创建条件累积和

使用密钥字典重新配置嵌套字典密钥名

NumPy中条件嵌套for循环的向量化

将JSON对象转换为Dataframe

Plotly Dash Creating Interactive Graph下拉列表

未调用自定义JSON编码器

合并与拼接并举

基于另一列的GROUP-BY聚合将列添加到Polars LazyFrame

将CSS链接到HTML文件的问题

Pandas在rame中在组内洗牌行，保持相对组的顺序不变，

利用SCIPY沿第一轴对数组进行内插

文本溢出了Kivy的视区

我怎样才能让深度测试在OpenGL中使用Python和PyGame呢？

使用美汤对维基百科表格进行网络刮擦未返回任何内容

解析CSV文件以将详细信息添加到XML文件

如何在Python中画一个只能在对角线内裁剪的圆？

在Django REST框架中定义的URL获得404分