在用一个单独的值列旋转两个列之后,我想要一个具有特定顺序的多索引列的df,如下所示(请忽略multi—2和multi—3标签在简化示例中是没有意义的):

multi-1       one       two
multi-2   multi-2   multi-2
multi-3  SomeText  SomeText
mIndex                     
bar     -1.788089 -0.631030
baz     -1.836282  0.762363
foo     -1.104848 -0.444981
qux     -0.484606 -0.507772

从一个多索引值系列开始,标记为multi—2,我创建了一个三列的df:第1列—系列的索引(multi—1);第2列—值(multi—2);再加上另一列(multi—3),我真的只需要列标签.然后,我想将这个df围绕multi—1和multi—3旋转,值multi—2.问题:多索引列标签必须始终按照特定的顺序:multi—1,multi—2,然后multi—3.

import pandas as pd
import numpy as np

arrays = [["bar", "bar", "baz", "baz", "foo", "foo", "qux", "qux"],
          ["one", "two", "one", "two", "one", "two", "one", "two"]]

tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=["mIndex", "multi-1"])

s = pd.Series(np.random.randn(8), index=index)
s.rename("multi-2", inplace=True)

df = pd.DataFrame(s.reset_index(level=["multi-1"]))
df["multi-3"] = "SomeText"

df = df.pivot(columns={"multi-1", "multi-3"}, values=["multi-2"])
df = df.swaplevel(0,1, axis=1)      # option 1: works only sometimes
# ???? how do I name the values level ????
df = df.reorder_levels("multi-1", "multi-2", "multi-3")  # option 2: set fixed order

在透视期间在列中包含多个2将创建另一个级别.

. swaplevel方法并不总是返回相同的顺序,因为(我猜)原始索引顺序在枢轴之后并不总是相同的.这是对的吗?

为了使用reorder_levels,我需要为multi—2值级别设置一个索引标签(当前为"None",旁边为"Multi—1"和"Multi—3").

有没有办法在旋转过程中设置标签?或者在透视之后,以一种不使用索引的方式(似乎以某种方式改变了)?或者用另一种方式来获得同样的结果?

推荐答案

pivot之后,这些值没有索引名,您必须为其赋值:

(df.pivot(columns={'multi-1', 'multi-3'}, values=['multi-2'])
   .rename_axis(columns={None: 'multi-2'})
   .reorder_levels(['multi-1', 'multi-2', 'multi-3'], axis=1) 
)

输出:

multi-1       one       two
multi-2   multi-2   multi-2
multi-3  SomeText  SomeText
mIndex                     
bar      0.938079 -1.051440
baz      0.263281  1.388145
foo     -0.965295  0.611163
qux     -1.120318 -0.529974

或者:swaplevel不一致,因为您在pivot中使用了set(即unordered),请改用103:

(df.pivot(columns=['multi-1', 'multi-3'], values=['multi-2'])
   .swaplevel(0, 1, axis=1)
)

NB. you can also add 100 if desired.

输出:

multi-1       one       two
          multi-2   multi-2
multi-3  SomeText  SomeText
mIndex                     
bar      0.542184 -0.199041
baz      1.253028 -1.006294
foo      0.252699 -1.728199
qux      0.572631 -0.694103

# with more columns
# columns=['multi-1', 'multi-3', 'multi-4', 'multi-5']

multi-1       one       two
          multi-2   multi-2
multi-3  SomeText  SomeText
multi-4  SomeText  SomeText
multi-5  SomeText  SomeText
mIndex                     
bar      0.071546  0.264463
baz      0.516355  1.594471
foo     -0.194536 -1.344563
qux     -0.197232 -0.845405

Python相关问答推荐

如何从具有多个嵌入选项卡的网页中Web抓取td类元素

max_of_three使用First_select、second_select、

难以在Manim中正确定位对象

删除最后一个pip安装的包

发生异常:TclMessage命令名称无效.!listbox"

使用groupby Pandas的一些操作

我对我应该做什么以及我如何做感到困惑'

我如何根据前一个连续数字改变一串数字?

Polars asof在下一个可用日期加入

python panda ExcelWriter切换动态公式到数组公式

在方法中设置属性值时,如何处理语句不可达[Unreacable]";的问题?

(Python/Pandas)基于列中非缺失值的子集DataFrame

将链中的矩阵乘法应用于多组值

使用Python异步地持久跟踪用户输入

如何在Gekko中处理跨矢量优化

Pandas:将值从一列移动到适当的列

如果列包含空值,则PANAS查询不起作用

极点:在固定点扩展窗口

两个名称相同但值不同的 Select 都会产生相同的值(discord.py)

try 在单个WITH_COLUMNS_SEQ操作中链接表达式时,使用Polars数据帧时出现ComputeError