我最近从R的TukeyHSD测试导出了一个表,以获得不同时间组(0,5,10,20,30,40,50,60)的p值.我很好奇是否有一种方法可以将其转换成相关矩阵,其中每个轴代表时间组,并对应于各自的p值.

该表包括指示不同时间组之间的对应关系的索引(例如,5-10或10—50).我已经将它作为一个框架导入Python.有没有一种方法可以按照下面描述的方式重新排列双框?

        p adj
Groups  
50-0    2.815526e-13
60-0    2.855494e-13
20-0    4.764197e-08
50-5    1.712389e-05
50-10   1.483440e-04
50-40   1.643480e-04
60-5    5.873007e-04
60-10   5.218047e-03
60-40   5.613566e-03
10-0    6.878476e-03
40-0    1.270855e-02
20-5    7.380859e-02
50-20   1.574372e-01
40-20   3.264569e-01
20-10   3.369147e-01
5-0 3.816166e-01
60-50   7.301423e-01
60-20   8.503578e-01
10-5    9.731384e-01
40-5    9.820983e-01
40-10   1.000000e+00

我希望它是这样的:

        0    5    10    20    ...
0       ...  ...  ...  ...
5       ...  ...  ...  ...
10      ...  ...  ...  ...
20      ...  ...  ...  ...
...

我在网上没有找到类似的东西,所以我不知道从哪里开始.

推荐答案

试着:

df[["x", "y"]] = df.index.str.split("-", expand=True).to_frame().astype(int).values
print(pd.crosstab(df["x"], df["y"], df["p adj"], aggfunc="first"))

打印:

y             0         5         10        20        40        50
x                                                                 
5   3.816166e-01       NaN       NaN       NaN       NaN       NaN
10  6.878476e-03  0.973138       NaN       NaN       NaN       NaN
20  4.764197e-08  0.073809  0.336915       NaN       NaN       NaN
40  1.270855e-02  0.982098  1.000000  0.326457       NaN       NaN
50  2.815526e-13  0.000017  0.000148  0.157437  0.000164       NaN
60  2.855494e-13  0.000587  0.005218  0.850358  0.005614  0.730142

Python相关问答推荐

如何使用SubProcess/Shell从Python脚本中调用具有几个带有html标签的参数的Perl脚本?

我必须将Sigmoid函数与r2值的两种类型的数据集(每种6个数据集)进行匹配,然后绘制匹配函数的求导.我会犯错

如何在BeautifulSoup中链接Find()方法并处理无?

使用numpy提取数据块

为什么我的Python代码在if-else声明中的行之前执行if-else声明中的行?

如何将双框框列中的成对变成两个新列

通过Selenium从页面获取所有H2元素

切片包括面具的第一个实例在内的眼镜的最佳方法是什么?

如何将Docker内部运行的mariadb与主机上Docker外部运行的Python脚本连接起来

使用Python从URL下载Excel文件

使用特定值作为引用替换数据框行上的值

LocaleError:模块keras._' tf_keras. keras没有属性__internal_'''

Pandas:填充行并删除重复项,但保留不同的值

Python—为什么我的代码返回一个TypeError

ModuleNotFoundError:Python中没有名为google的模块''

如何使用大量常量优化代码?

如何在Python中自动创建数字文件夹和正在进行的文件夹?

TypeError:';Locator';对象无法在PlayWriter中使用.first()调用

时长超过24小时如何从Excel导入时长数据

通过对列的其余部分进行采样,在Polars DataFrame中填充_null`?