Python 使用预定义的标头将列表字典转换为 pandas.DataFrame

发布于06月29日

我有一本字典，如下所示:

date_pair_dict = {

    "15-02-2022 15-02-2022": ["key 1 val 1", "key 1 val 2", "key 1 val 3"],
    "15-02-2022 16-02-2022": ["key 2 val 1", "key 2 val 2", "key 2 val 3"],
    "16-02-2022 16-02-2022": ["key 3 val 1", "key 3 val 2", "key 3 val 3"],
    "16-02-2022 17-02-2022": ["key 4 val 1", "key 4 val 2", "key 4 val 3"]

}

以及标题列表:

headers = ["date pair header", "header val 1", "header val 2", "header val 3"]

我想创建一个pandas.DataFrame并将其写入Excel，格式如下expected output:

date pair header	header val 1	header val 2	header val 3
15-02-2022 15-02-2022	key 1 val 1	key 1 val 2	key 1 val 3
15-02-2022 16-02-2022	key 2 val 1	key 2 val 2	key 2 val 3
16-02-2022 16-02-2022	key 3 val 1	key 3 val 2	key 3 val 3
16-02-2022 17-02-2022	key 4 val 1	key 4 val 2	key 4 val 3

现在，我正在使用这种(可以说是非常悲哀的)方法:

import pandas

date_pair_dict = {

    "15-02-2022 15-02-2022": ["key 1 val 1", "key 1 val 2", "key 1 val 3"],
    "15-02-2022 16-02-2022": ["key 2 val 1", "key 2 val 2", "key 2 val 3"],
    "16-02-2022 16-02-2022": ["key 3 val 1", "key 3 val 2", "key 3 val 3"],
    "16-02-2022 17-02-2022": ["key 4 val 1", "key 4 val 2", "key 4 val 3"]

}

headers = ["date pair header", "header val 1", "header val 2", "header val 3"]

list_of_keys, list_of_val_1, list_of_val_2, list_of_val_3 = [], [], [], []

for key in date_pair_dict.keys():

    list_of_keys.append(key)

    val_1, val_2, val_3 = date_pair_dict.get(key)

    list_of_val_1.append(val_1)
    list_of_val_2.append(val_2)
    list_of_val_3.append(val_3)

dataframe = pandas.DataFrame(
    {
        headers[0]: list_of_keys,
        headers[1]: list_of_val_1,
        headers[2]: list_of_val_2,
        headers[3]: list_of_val_3,
    }
)

这是不可扩展的.实际上，这date_pair_dict可以具有任意数量的键，每个键对应于任意长度的列表.然而，这些列表的长度将始终保持不变，并且将事先知道(我将始终预定义headers列表).

此外，我认为，由于我执行以下操作，这可能会使我的数据帧与原始密钥的顺序不同:

for key in dictionary.keys():

    ....

键是日期对，当用作数据帧的第一列时为need to remain in order.

Is there a better way to do this, preferably using a dictionary comprehension?

import pandas as pd date_pair_dict = { "15-02-2022 15-02-2022": ["key 1 val 1", "key 1 val 2", "key 1 val 3"], "15-02-2022 16-02-2022": ["key 2 val 1", "key 2 val 2", "key 2 val 3"], "16-02-2022 16-02-2022": ["key 3 val 1", "key 3 val 2", "key 3 val 3"], "16-02-2022 17-02-2022": ["key 4 val 1", "key 4 val 2", "key 4 val 3"] } headers = ["date pair header", "header val 1", "header val 2", "header val 3"] df = pd.DataFrame([[k] + v for k,v in date_pair_dict.items()], columns=headers) print(df)

date pair header header val 1 header val 2 header val 3 0 15-02-2022 15-02-2022 key 1 val 1 key 1 val 2 key 1 val 3 1 15-02-2022 16-02-2022 key 2 val 1 key 2 val 2 key 2 val 3 2 16-02-2022 16-02-2022 key 3 val 1 key 3 val 2 key 3 val 3 3 16-02-2022 17-02-2022 key 4 val 1 key 4 val 2 key 4 val 3

Python 使用预定义的标头将列表字典转换为 pandas.DataFrame

推荐答案

Python相关问答推荐

Python多处理：当我在一个巨大的pandas数据框架上启动许多进程时，程序就会陷入困境

即使在可见的情况下也不相互作用

Deliveryter Notebook -无法在for循环中更新matplotlib情节(保留之前的情节)，也无法使用动画子功能对情节进行动画

Pandas 滚动最接近的价值

PywinAuto在Windows 11上引发了Memory错误，但在Windows 10上未引发

Telethon加入私有频道

为什么以这种方式调用pd.ExcelWriter会创建无效的文件格式或扩展名？

对象的`call`方法的setattr在Python中不起作用'

所有列的滚动标准差，忽略NaN

如何在Python中找到线性依赖mod 2

Python Tkinter为特定样式调整所有ttkbootstrap或ttk Button填充的大小，适用于所有主题

干燥化与列姆化的比较

从旋转的DF查询非NaN值

并行编程：同步进程

在二维NumPy数组中，如何 Select 内部数组的第一个和第二个元素？这可以通过索引来实现吗？

用两个字符串构建回文

Regex用于匹配Python中逗号分隔的AWS区域

遍历列表列表，然后创建数据帧

try 在单个WITH_COLUMNS_SEQ操作中链接表达式时，使用Polars数据帧时出现ComputeError

如何通过函数的强式路径动态导入函数？