DEVGRU

プログラミングと競馬予想について書きます

Pandas で 日付の入っているカラムを年でフィルタする

競馬情報で特定の年以降のレースを絞り込むときの便利な書き方がわかったので紹介する。

dateカラム(datetime型)が2019年以降のデータを選ぶには、ストレートにするとこのような感じになる。

import datetime

data[data.date <= datetime.datetime(2019, 1, 1)]

しかし、これはコード量的にも視覚的にもイマイチわかりにくい。

以下のように書くと、分かりやすくなる。

data.query('date >= 2019`)

もし、2019年2月1日以降なら以下のように記述できる。

data.query('date >= 20190201')

ただし、このようには書けないようだ。

data.query('date >= 201902')

Pythonデータ分析/機械学習のための基本コーディング!  pandasライブラリ活用入門 (impress top gear)

Pythonデータ分析/機械学習のための基本コーディング! pandasライブラリ活用入門 (impress top gear)

  • 作者: Daniel Y. Chen,福島真太朗,吉川邦夫
  • 出版社/メーカー: インプレス
  • 発売日: 2019/02/22
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る

pandasクックブック ―Pythonによるデータ処理のレシピ―

pandasクックブック ―Pythonによるデータ処理のレシピ―

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

  • 作者: Wes McKinney,瀬戸山雅人,小林儀匡,滝口開資
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2018/07/26
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習