Pythonを何に使うのかにもよるが、私の場合はWebブラウザで特定のページにログインし、必要なデータファイルをダウンロード。それをExcelで加工という手順になるので、webブラウザ操作のためにWebDriverが必要になる。webブラウザがchromeでもEdgeでもこれは必要。
BeautifulSoupとSeleniumってどっちもスクレイピングできるよね? と思われている方も多いのではないでしょうか?確かに 抜き出す部分は確かにそう言えると思います。言いすぎかもですが、Seleniumがあれば 「一発でスクレイピング」 がこなせてしまいます。
今回は、 Selenium ServerによるWebブラウザ自動操作環境を、 Ubuntu上にDockerを使って簡単に構築する方法を紹介します。 Webブラウザの自動操作を可能にするSelenium Seleniumは、 Webアプリケーションのテストを、 人が操作することなく自動で行うために開発されている ...
前々回に紹介したMicrosoft Edge WebDriverの起動処理をスクリプト用に整えていく。まず、起動処理を始める前に不要なプロセスの終了処理を走らせる。 webdriver_edge_stop.ps1 PowerShellからSelenium経由でWebDriverを使うことになるので、PowerShell Seleinumモジュールが必要だ。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する