我试着用POLARS从S3中读取一些拼图文件.
这些文件是由RedShift在启用并行的情况下使用卸载生成的.
这4个文件是:0000_part_00.parquet
、0001_part_00.parquet
、0002_part_00.parquet
、0003_part_00.parquet
当我使用:pl.read_parquet("s3://my_bucket/my_folder/*.parquet")
时,它只返回第一个文件(0000_part_00.parquet
)->;340行的结果.
奇怪的是,在本地运行相同的命令:pl.read_parquet("*.parquet")
将返回所有行->;1239行.
这是正常行为还是我漏掉了什么?