我有一个数据框:

import pandas as pd
data = {'token_1': [['cat', 'run','today'],['dog', 'eat', 'meat']],
        'token_2': [[ 'in', 'the' , 'morning','cat', 'run', 'today',
                      'very', 'quick'],['dog', 'eat', 'meat', 'chicken', 'from', 'bowl']]}

df = pd.DataFrame(data)

我需要从token_2的第token_1列中找到单词,并在数组中获取它们的索引.

lst_indexes = [[3,4,5],
                [0,1,2]]

推荐答案

索引使用enumerate的列表理解:

L = [[i for i, x in enumerate(b) if x in a] for a, b in zip(df['token_1'], df['token_2'])]
print (L)
[[3, 4, 5], [0, 1, 2]]

Python相关问答推荐

Python(Polars):使用之前的变量确定当前解决方案的Vector化操作

调试回归无法解决我的问题

在Python中,什么表达相当于0x1.0p-53?

如何使用矩阵在sklearn中同时对每个列执行matthews_corrcoef?

具有症状的分段函数:如何仅针对某些输入值定义函数?

使用SciPy进行曲线匹配未能给出正确的匹配

替换字符串中的多个重叠子字符串

为什么我的Python代码在if-else声明中的行之前执行if-else声明中的行?

对某些列的总数进行民意调查,但不单独列出每列

如何访问所有文件,例如环境变量

使可滚动框架在tkinter环境中看起来自然

' osmnx.shortest_track '返回有效源 node 和目标 node 的'无'

如何获取numpy数组的特定索引值?

改进大型数据集的框架性能

实现神经网络代码时的TypeError

如何在Python中获取`Genericums`超级类型?

如何使regex代码只适用于空的目标单元格

Python—压缩叶 map html作为邮箱附件并通过sendgrid发送

从旋转的DF查询非NaN值

Gunicorn无法启动Flask应用,因为无法将应用解析为属性名或函数调用.'"'' "