我想知道在R的arrow
工作流程中是否可以发送一个关于duckdb
的SQL查询.
我知道它的意图是使用dplyr
个动词,但有一些动词翻译不流畅,代码在dplyr
后端工作,但不是duckdb
或arrow
.
我想在呼叫期间使用直接的SQL
查询,类似于下面的示例:
library(duckdb)
library(arrow)
library(dplyr)
# Open dataset using year,month folder partition
ds <- arrow::open_dataset("nyc-taxi", partitioning = c("year", "month"))
ds %>%
# Pass off to DuckDB
to_duckdb() |>
SQL_QUERY("SELECT * LIMIT 100") |> # <- something like this
collect()