Python 类型错误：输入类型不支持ufuncisnan在执行MannWhitney U测试时[SOLVED]

发布于04月18日

我有两个数据帧primary_tumor_df和healthy_tissue_df来执行Mann-Whitney U测试.我还从两个数据帧中删除了nan个值.

Structure of primary_tumor_df.

Structure of healthy_tissue_df.

primary_tumor_df.dropna(inplace=True)
healthy_tissue_df.dropna(inplace=True)

This shows that there are no nan or null values.

但在执行测试时，它给我带来了以下错误:

from scipy.stats import mannwhitneyu
p_value_dict = {}
for gene in primary_tumor_df.columns:
stats, p_value = mannwhitneyu(primary_tumor_df[gene], healthy_tissue_df[gene],
                              alternative='two-sided')

Error:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
Cell In[9], line 4
      2 p_value_dict = {}
      3 for gene in primary_tumor_df.columns:
----> 4     stats, p_value = mannwhitneyu(primary_tumor_df[gene],
      5                                  healthy_tissue_df[gene],
      6                                  alternative='two-sided')
      7     p_value_dict[gene] = p_value
      9 # converting into DataFrame

File ~/.local/lib/python3.10/site-packages/scipy/stats/_axis_nan_policy.py:502, in _axis_nan_policy_factory.<locals>.axis_nan_policy_decorator.<locals>.axis_nan_policy_wrapper(***failed resolving arguments***)
    500 if sentinel:
    501     samples = _remove_sentinel(samples, paired, sentinel)
--> 502 res = hypotest_fun_out(*samples, **kwds)
    503 res = result_to_tuple(res)
    504 res = _add_reduced_axes(res, reduced_axes, keepdims)

File ~/.local/lib/python3.10/site-packages/scipy/stats/_mannwhitneyu.py:460, in mannwhitneyu(x, y, use_continuity, alternative, axis, method)
    249 @_axis_nan_policy_factory(MannwhitneyuResult, n_samples=2)
    250 def mannwhitneyu(x, y, use_continuity=True, alternative="two-sided",
    251                  axis=0, method="auto"):
    252     r'''Perform the Mann-Whitney U rank test on two independent samples.
    253 
    254     The Mann-Whitney U test is a nonparametric test of the null hypothesis
   (...)
    456 
    457     '''
    459     x, y, use_continuity, alternative, axis_int, method = (
--> 460         _mwu_input_validation(x, y, use_continuity, alternative, axis, method))
    462     x, y, xy = _broadcast_concatenate(x, y, axis)
    464     n1, n2 = x.shape[-1], y.shape[-1]

File ~/.local/lib/python3.10/site-packages/scipy/stats/_mannwhitneyu.py:200, in _mwu_input_validation(x, y, use_continuity, alternative, axis, method)
    198 # Would use np.asarray_chkfinite, but infs are OK
    199 x, y = np.atleast_1d(x), np.atleast_1d(y)
--> 200 if np.isnan(x).any() or np.isnan(y).any():
    201     raise ValueError('`x` and `y` must not contain NaNs.')
    202 if np.size(x) == 0 or np.size(y) == 0:

TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe''

即使数据帧中没有任何nan个值，为什么它会产生错误？

import numpy as np import pandas as pd from scipy import stats rng = np.random.default_rng(435982435982345) primary_tumor_df = pd.DataFrame(rng.random((10, 3)).astype(object)) healthy_tissue_df = pd.DataFrame(rng.random((10, 3)).astype(object)) # generates your error: # for gene in primary_tumor_df.columns: # res = stats.mannwhitneyu(primary_tumor_df[gene], # healthy_tissue_df[gene], # alternative='two-sided') # no error for gene in primary_tumor_df.columns: res = stats.mannwhitneyu(primary_tumor_df[gene].astype(np.float64), healthy_tissue_df[gene].astype(np.float64), alternative='two-sided')

Python 类型错误：输入类型不支持ufuncisnan在执行MannWhitney U测试时[SOLVED]

推荐答案

Python相关问答推荐

Pandas ：多索引组

使用Keras的线性回归参数估计

根据不同列的值在收件箱中移动数据

在Python中处理大量CSV文件中的数据

为什么这个带有List输入的简单numba函数这么慢

Python库：可选地支持numpy类型，而不依赖于numpy

如何在python xsModel库中定义一个可选[December]字段，以产生受约束的SON模式

如何更改分组条形图中条形图的 colored颜色？

如果条件不满足，我如何获得掩码的第一个索引并获得None？

如何从数据库上传数据到html？

名为main. py的Python模块在导入时不运行'

在www.example.com中使用`package_data`包含不包含init. py的非Python文件

如何禁用FastAPI应用程序的Swagger UI autodoc中的application/json？

下三角形掩码与seaborn clustermap bug

根据Pandas中带条件的两个列的值创建新列

使用嵌套对象字段的Qdrant过滤

多个矩阵的张量积

多索引数据帧到标准索引DF

将标签与山脊线图对齐

迭代工具组合不会输出大于3的序列