Google Apps Scriptでスクレイピングに使用するcheeriogsの使い方

cheeriogsとは

GASで使用可能なHTMLをパースできるライブラリ。

GASでWebサイトのHTMLを取得するにはUrlFetchApp.fetch(url).getContentText()を使用する。

しかし、これだとテキストでHTMLを取得しているだけなのでquerySelectorなどで要素で取得することができないため、スクレイピングの際は正規表現で取得することになるため不便である。

cheeriogsを使用すれば$('title').text()とjQueryようなコードで簡単に取得できるようになる。

cheeriogsを使用するには

スクリプトエディタでリソース => ライブラリを選択してAdd a libraryに「1ReeQ6WO8kKNxoaA_O0XEQ589cIrRvEBA9qcWpNqdOP17i47u6N9M5Xh0」を追加したあと、最新バージョンを選択して保存を押せば使えるようになる。

1ReeQ6WO8kKNxoaA_O0XEQ589cIrRvEBA9qcWpNqdOP17i47u6N9M5Xh0
スクリプトエディタでリソース => ライブラリを選択してAdd a libraryにcheeriogsを追加