競馬情報で特定の年以降のレースを絞り込むときの便利な書き方がわかったので紹介する。
dateカラム(datetime型)が2019年以降のデータを選ぶには、ストレートにするとこのような感じになる。
import datetime data[data.date <= datetime.datetime(2019, 1, 1)]
しかし、これはコード量的にも視覚的にもイマイチわかりにくい。
以下のように書くと、分かりやすくなる。
data.query('date >= 2019`)
もし、2019年2月1日以降なら以下のように記述できる。
data.query('date >= 20190201')
ただし、このようには書けないようだ。
data.query('date >= 201902')
Pythonデータ分析/機械学習のための基本コーディング! pandasライブラリ活用入門 (impress top gear)
- 作者: Daniel Y. Chen,福島真太朗,吉川邦夫
- 出版社/メーカー: インプレス
- 発売日: 2019/02/22
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
pandasクックブック ―Pythonによるデータ処理のレシピ―
- 作者: Theodore Petrou,黒川利明
- 出版社/メーカー: 朝倉書店
- 発売日: 2019/02/08
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,瀬戸山雅人,小林儀匡,滝口開資
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/07/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
- 作者: Jake VanderPlas,菊池彰
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/05/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る