作ったものを振り返る Part1.3 - ぴょこぴょこブログ

概略

今回はスクレイピング処理について振り返ります。

ここでの目標はhtmlファイルであるソースから必要な情報を切り出して、利用しやすいように情報を保存することです。

前回まででスクレイピング対象サイトのソースまで取得までしていました。そのソースに対してスクレイピング処理をしていきます。

今回は使い慣れたBeautifulSoup を使いました。

図1. から

と、それぞれの規則があることがわかります。

[caption id="attachment_150" align="alignnone" width="688"] 図1. 生成規則[/caption]

あとはこれをプログラムにしてやれば全ての日付・時間・状態を取得することができます！

次回は、ここで作った整形済みの予約リストを使ってデータベースの操作を行います。

では。