我正在为一个不平衡的数据集绘制ROC曲线,但它们看起来根本不像正常的ROC曲线.它们看起来更像阶跃函数(参见提供的图像).从我能找到的所有来源来看,这应该表明我的机器学习算法是有效的,但我仍然得到很多误报.如果我的算法无效,为什么我的ROC曲线的形状会这么好?有没有更好的方法来衡量这个算法的"好"程度?谢谢

Step-Function ROC Curve

推荐答案

有时,ROC曲线不是分析不平衡数据集算法的最佳方法,因为"好"ROC曲线的真阳性率较高,而假阳性率较低,这有时会对不平衡数据集产生误导,因为真阳性率可能很高,但由于多数类支配少数类(如您所述),仍然会标记错误.

相反,try PR(精度召回)曲线-PR曲线对于不平衡的数据集更好,因为精度不会被不平衡的数据所扭曲.请参见此链接:PR Curves

Python相关问答推荐

Image Font生成带有条形码Code 128的条形码时出现枕头错误OSErsor:无法打开资源

Python -Polars库中的滚动索引?

用gekko解决的ADE方程系统突然不再工作,错误消息异常:@错误:模型文件未找到.& &

通过优化空间在Python中的饼图中添加标签

Python上的Instagram API:缺少client_id参数"

使用索引列表列表对列进行切片并获取行方向的向量长度

如何获取TFIDF Transformer中的值?

Polars:用氨纶的其他部分替换氨纶的部分

Django REST Framework:无法正确地将值注释到多对多模型,不断得到错误字段名称字段对模型无效'<><>

无法在Docker内部运行Python的Matlab SDK模块,但本地没有问题

如何使Matplotlib标题以图形为中心,而图例框则以图形为中心

使用groupby方法移除公共子字符串

如何在达到end_time时自动将状态字段从1更改为0

通过追加列表以极向聚合

如何使用正则表达式修改toml文件中指定字段中的参数值

Python类型提示:对于一个可以迭代的变量,我应该使用什么?

当HTTP 201响应包含 Big Data 的POST请求时,应该是什么?  

如何编辑此代码,使其从多个EXCEL文件的特定工作表中提取数据以显示在单独的文件中

查找查找表中存在的列值组合

如何将列表从a迭代到z-以抓取数据并将其转换为DataFrame?