Python 如何在新列中提取 pandas DataFrame 的字典值

发布于05月17日

我想将Pandas DataFrame df内的字典的值提取到该DataFrame的新列中.引用字典中的所有键在所有行中都是相同的.

import pandas as pd

df = pd.DataFrame({'a': [1, 2, 3], 'b': [{'x':[101], 'y': [102], 'z': [103]}, {'x':[201], 'y': [202], 'z': [203]}, {'x':[301], 'y': [302], 'z': [303]}]})

dfResult = pd.DataFrame({'a': [1, 2, 3],  'x':[101, 201, 301], 'y': [102, 202, 302], 'z': [103, 203, 303]})

我尽我所能从DICT中获得键和值，但我不知道如何用它们制作新的专栏:

df.b.apply(lambda x: [x[y] for y in x.keys()])

0    [[101], [102], [103]]
1    [[201], [202], [203]]
2    [[301], [302], [303]]


df.b.apply(lambda x: [y for y in x.keys()])

0    [x, y, z]
1    [x, y, z]
2    [x, y, z]

推荐答案

如果始终有一个元素列表是可能的，则使用带有字典理解的嵌套列表并传递给DataFrame个构造函数:

df = df.join(pd.DataFrame([{k: v[0] for k, v in x.items()} for x in df.pop('b')],
                           index=df.index))
print (df)
   a    x    y    z
0  1  101  102  103
1  2  201  202  203
2  3  301  302  303

另一个 idea 是为字典理解中的每一行创建DataFrame，并按concat连接:

df = df.join(pd.concat({k: pd.DataFrame(v) for k, v in df.pop('b').items()}).droplevel(1))
print (df)
   a    x    y    z
0  1  101  102  103
1  2  201  202  203
2  3  301  302  303