在用一个单独的值列旋转两个列之后,我想要一个具有特定顺序的多索引列的df,如下所示(请忽略multi—2和multi—3标签在简化示例中是没有意义的):
multi-1 one two
multi-2 multi-2 multi-2
multi-3 SomeText SomeText
mIndex
bar -1.788089 -0.631030
baz -1.836282 0.762363
foo -1.104848 -0.444981
qux -0.484606 -0.507772
从一个多索引值系列开始,标记为multi—2,我创建了一个三列的df:第1列—系列的索引(multi—1);第2列—值(multi—2);再加上另一列(multi—3),我真的只需要列标签.然后,我想将这个df围绕multi—1和multi—3旋转,值multi—2.问题:多索引列标签必须始终按照特定的顺序:multi—1,multi—2,然后multi—3.
import pandas as pd
import numpy as np
arrays = [["bar", "bar", "baz", "baz", "foo", "foo", "qux", "qux"],
["one", "two", "one", "two", "one", "two", "one", "two"]]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=["mIndex", "multi-1"])
s = pd.Series(np.random.randn(8), index=index)
s.rename("multi-2", inplace=True)
df = pd.DataFrame(s.reset_index(level=["multi-1"]))
df["multi-3"] = "SomeText"
df = df.pivot(columns={"multi-1", "multi-3"}, values=["multi-2"])
df = df.swaplevel(0,1, axis=1) # option 1: works only sometimes
# ???? how do I name the values level ????
df = df.reorder_levels("multi-1", "multi-2", "multi-3") # option 2: set fixed order
在透视期间在列中包含多个2将创建另一个级别.
. swaplevel方法并不总是返回相同的顺序,因为(我猜)原始索引顺序在枢轴之后并不总是相同的.这是对的吗?
为了使用reorder_levels,我需要为multi—2值级别设置一个索引标签(当前为"None",旁边为"Multi—1"和"Multi—3").
有没有办法在旋转过程中设置标签?或者在透视之后,以一种不使用索引的方式(似乎以某种方式改变了)?或者用另一种方式来获得同样的结果?