我有一个数据框

import polars as pl
import numpy as np
df = pl.DataFrame(
    {
        "nrs": [1, 2, 3, None, 5],
        "names": ["foo", "ham", "spam", "egg", None],
        "random": np.random.rand(5),
        "groups": ["A", "A", "B", "C", "B"],
    }
)

我想只 Select list中的列:

mylist = ['nrs', 'random']

这似乎奏效了:

import polars.selectors as cs
df.select(cs.by_name(mylist)))

这是惯用的做法吗?还是有更好的办法?

推荐答案

实际上要简单得多:

df.select(['nrs', 'random'])

┌──────┬──────────┐
│ nrs  ┆ random   │
│ ---  ┆ ---      │
│ i64  ┆ f64      │
╞══════╪══════════╡
│ 1    ┆ 0.662732 │
│ 2    ┆ 0.437345 │
│ 3    ┆ 0.43857  │
│ null ┆ 0.701177 │
│ 5    ┆ 0.390494 │
└──────┴──────────┘

selectors通常用于更复杂的 Select --如所有字符串列、以特定短语开头的列等等.

正如在select()文档中所写的,您可以在那里找到列的路径列表或表达式.

所以这些都行得通--.select('nrs', 'random').select(pl.col('nrs', 'random')).select(pl.col('nrs'), pl.col('random')).

Python相关问答推荐

Pandas 第二小值有条件

如何使用symy打印方程?

将jit与numpy linSpace函数一起使用时出错

追溯(最近最后一次调用):文件C:\Users\Diplom/PycharmProject\Yolo01\Roboflow-4.py,第4行,在模块导入roboflow中

查找两极rame中组之间的所有差异

如何从在虚拟Python环境中运行的脚本中运行需要宿主Python环境的Shell脚本?

为什么默认情况下所有Python类都是可调用的?

Python解析整数格式说明符的规则?

解决调用嵌入式函数的XSLT中表达式的语法移位/归约冲突

未调用自定义JSON编码器

Pandas:计算中间时间条目的总时间增量

在方法中设置属性值时,如何处理语句不可达[Unreacable]";的问题?

以异步方式填充Pandas 数据帧

从嵌套极轴列的列表中删除元素

Python:从目录内的文件导入目录

Polars时间戳同步延迟计算

BeatuifulSoup从欧洲志愿者服务中获取数据和解析:一个从EU-Site收集机会的小铲子

函数()参数';代码';必须是代码而不是字符串

关于数字S种子序列内部工作原理的困惑

如何有效地计算所有输出相对于参数的梯度?