我试着在网上搜索,我放弃了……我想请求您在以下方面提供帮助(我使用的是Python3和Pandas):

假设df的Values列包含集合中的整数:

在:

            VALUES
0           {2624, 1383, 2855, 1871, 16784, 9811, 2970}
1           {2898, 12, 1871, 223}
2           {2624, 2855, 519, 15662, 1230, 1871, 2970}
3          {2624, 12, 55, 519, 313, 1230, 10588, 2970}
4           {1230, 55, 89564, 1247}

Out Desired(仅包含包含特定值的行,例如,值集中的12行,其他所有行都将丢弃):

            VALUES
1           {2898, 12, 1871, 223}
3          {2624, 12, 55, 519, 313, 1230, 10588, 2970}

在下一步中,我将需要将int12移到新的单独列.此外,我也找不到一种方法来转换列表中的这些集合.

               VALUES                                  NEW_COL
1           [2898, 1871, 223]                             12
3          [2624, 55, 519, 313, 1230, 10588, 2970]        12

谢谢.

推荐答案

匹配项筛选:

booleans = [12 in val for val in df.VALUES]
out = df.loc[booleans]

从值中删除12以获得最终输出:

out.assign(VALUES = out.VALUES - {12}, NEW_COL = 12)

                                    VALUES  NEW_COL
1                        {2898, 1871, 223}       12
3  {2624, 519, 1230, 55, 313, 2970, 10588}       12

如果要转换为列表:

out.assign(VALUES = (out.VALUES - {12}).map(list), NEW_COL = 12)
                                    VALUES  NEW_COL
1                        [2898, 1871, 223]       12
3  [2624, 519, 1230, 55, 313, 2970, 10588]       12

我不确定您在做什么,但在性能方面,最好是处理诸如列表/集/元组之类的 struct ……在Pandas 外面

Python相关问答推荐

如何使用矩阵在sklearn中同时对每个列执行matthews_corrcoef?

如何在Python中使用io.BytesIO写入现有缓冲区?

如何在图片中找到这个化学测试条?OpenCV精明边缘检测不会绘制边界框

Pandas 滚动最接近的价值

PywinAuto在Windows 11上引发了Memory错误,但在Windows 10上未引发

如何根据参数推断对象的返回类型?

运行总计基于多列pandas的分组和总和

pandas滚动和窗口中有效观察的最大数量

Python,Fitting into a System of Equations

为什么Django管理页面和我的页面的其他CSS文件和图片都找不到?'

搜索按钮不工作,Python tkinter

为什么'if x is None:pass'比'x is None'单独使用更快?

如何将数据帧中的timedelta转换为datetime

ModuleNotFoundError:没有模块名为x时try 运行我的代码''

Flask运行时无法在Python中打印到控制台

30个非DATETIME天内的累计金额

Django Table—如果项目是唯一的,则单行

如何使用Azure Function将xlsb转换为xlsx?

提取数组每行的非零元素

比较两个有条件的数据帧并删除所有不合格的数据帧