如果使用polars- DataFrame构建如下所示的python:
import polars as pl
from polars import col
from datetime import datetime
df = pl.DataFrame({
"dates": ["2016-07-02", "2016-08-10", "2016-08-31", "2016-09-10"],
"values": [1, 2, 3, 4]
})如何选择某个日期范围之间的行,即"2016-08-10"和"2016-08-31"之间的行,以便期望的结果是:
┌────────────┬────────┐
│ dates ┆ values │
│ --- ┆ --- │
│ date ┆ i64 │
╞════════════╪════════╡
│ 2016-08-10 ┆ 2 │
├╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌╌┤
│ 2016-08-31 ┆ 3 │
└────────────┴────────┘发布于 2021-10-15 22:35:47
首先,您需要将dates中的字符串值转换为datetimes,然后进行过滤:
# eager
(df.with_column(pl.col("dates").str.strptime(pl.Date))
.filter(col("dates").is_between(datetime(2016, 8, 9), datetime(2016, 9, 1)))
)
# lazy
(df.lazy()
.with_column(pl.col("dates").str.strptime(pl.Date))
.filter(col("dates").is_between(datetime(2016, 8, 9), datetime(2016, 9, 1)))
.collect()
)两者都会产生所需的输出:
┌────────────┬────────┐
│ dates ┆ values │
│ --- ┆ --- │
│ date ┆ i64 │
╞════════════╪════════╡
│ 2016-08-10 ┆ 2 │
├╌╌╌╌╌╌╌╌╌╌╌╌┼╌╌╌╌╌╌╌╌┤
│ 2016-08-31 ┆ 3 │
└────────────┴────────┘https://stackoverflow.com/questions/69591233
复制相似问题