EXAMPLE IMAGE 我得到了一个Electron 表格的数据,需要格式化成一个表.但是,发送过来的数据不能直接转换为表,因为它是如何格式化的.在示例图像中,我需要将数据B1和数据B1等以及数据D1和数据D1等合并到同一行的同一单元格中.我如何将跨越2行的所有单元格合并到同一个单元格和行中.我需要使用Python自动化这个过程.

我必须将它们组合在一起,以便可以将数据转换为表.如果我按原样将数据转换为表,它将创建2行:

1:[Data A1, Data B1, Data C1, Data D1, Data E1], 
2:[' ', Data B1, ' ', Data D1, ' ']

但我希望数据是这样的:

1:[Data A1, [Data B1, Data B1], Data C1, [Data D1, Data D1],DataE1]

我正在try 使用巨 Python Pandas ,但未能达到正确的结果

import pandas as pd

# Excel file named 'data.xlsx' with a sheet named 'Sheet1'
excel_file = 'data.xlsx'
sheet_name = 'Sheet1'

# Read the Excel file into a pandas DataFrame
df = pd.read_excel(excel_file, sheet_name=sheet_name)

# Combine two cells in two rows into an array of values
df['Combined'] = df.apply(lambda row: [row['Column2'], row['Column2']], axis=1)

# Save the modified DataFrame back to Excel
df.to_excel('output.xlsx', index=False)

推荐答案

您希望合并来自两个连续行的"data B1"和"data d1"的内容.您可以根据特定用例的需要调整列.此外,它还处理原始DataFrame中的行数为奇数的情况.

import pandas as pd

excel_file = 'data.xlsx'
sheet_name = 'Sheet1'
df = pd.read_excel(excel_file, sheet_name=sheet_name)

formatted_df = pd.DataFrame(columns=df.columns)

for i in range(0, len(df), 2):
    row1 = df.iloc[i]
    row2 = df.iloc[i + 1] if i + 1 < len(df) else None

    combined_row = {}
    for col in df.columns:
        if col in ['Data B1', 'Data D1']:  # Specify the columns to be combined
            combined_row[col] = [row1[col], row2[col] if row2 is not None else None]
        else:
            combined_row[col] = row1[col]

    formatted_df = formatted_df.append(combined_row, ignore_index=True)

formatted_df.to_excel('formatted_output.xlsx', index=False)

Python相关问答推荐

使用Python进行网页抓取,没有页面

将嵌套列表的字典转换为数据框中的行

如何在Python中增量更新DF

机器人与Pyton Minecraft服务器状态不和

不允许AMBIMA API请求方法

Pydantic:如何将对象列表表示为dict(将列表序列化为dict)

使用from_pandas将GeDataFrame转换为polars失败,ArrowType错误:未传递numpy. dype对象

Polars:使用列值引用when / then表达中的其他列

如何在msgraph.GraphServiceClient上进行身份验证?

如何将双框框列中的成对变成两个新列

如何记录脚本输出

在Polars(Python库)中将二进制转换为具有非UTF-8字符的字符串变量

创建可序列化数据模型的最佳方法

如何在Python中找到线性依赖mod 2

用砂箱开发Web统计分析

如何在Python中获取`Genericums`超级类型?

Tkinter菜单自发添加额外项目

启动带有参数的Python NTFS会导致文件路径混乱

lityter不让我输入左边的方括号,'

使用BeautifulSoup抓取所有链接