作ったものを振り返る Part1.2 - ぴょこぴょこブログ

初めに

教習所予約確認botは全てPythonで実装しました。

ここではログイン処理とソースの取得について振り返ります。

ログインの方法はCookieを使う方法や仮想ブラウザを使う方法がありますが、今回は動的なページに強い・実装が楽(ﾂｶｯﾃﾐﾀｶｯﾀ)というので仮想ブラウザを使う方法を選択しました。

というわけで以下ではSeleniumのchrome-webdriverを使用した説明を行います。

たったこれだけでログイン処理ができてしまいます！

このログイン処理をすると仮想ブラウザ内でログイン処理をした後のページ(図2)に遷移します。

[caption id="attachment_77" align="alignnone" width="600"] login 図1. ログイン画面[/caption]

[caption id="attachment_78" align="alignnone" width="300"] select_car_type 図2. 車種の選択[/caption]

図2のページでは車種を選択します。

これで図3のように車種を指定したときの予約ページに遷移することができました！

このページについてスクレイピングをしていきたいのでこのページのソースを返してブラウザの処理は終了です。

ブラウザをclose()しないとメモリに残るので注意しましょう。

[caption id="attachment_79" align="alignnone" width="600"] reservation_list 図3. 予約リスト[/caption]

Seleniumのchrome-webdriverは標準ではGPUを使った実行がされます。

もともとの構想としてHerokuでの定期実行を行いたかったのでGPUを使いたくなかったわけです。

そんな時に見つけたのがこの記事です。

chrome-driverのoptionでheadless指定をしてあげるだけです！簡単ですね！

Herokuで運用し始めようとした時にこのwebdriverの部分でエラーが出ました。

解決方法としてはこの記事にある通り

の2つをbuildpackに追加するのと

options.binary_location = '/app/.apt/usr/bin/google-chrome'
self.browser = webdriver.Chrome(chrome_options=options)

のようにバイナリの場所を指定してあげる必要があります。