cheeriogsとは
GASで使用可能なHTMLをパースできるライブラリ。
GASでWebサイトのHTMLを取得するにはUrlFetchApp.fetch(url).getContentText()を使用する。
しかし、これだとテキストでHTMLを取得しているだけなのでquerySelectorなどで要素で取得することができないため、スクレイピングの際は正規表現で取得することになるため不便である。
cheeriogsを使用すれば$('title').text()とjQueryようなコードで簡単に取得できるようになる。
cheeriogsを使用するには
スクリプトエディタでリソース => ライブラリを選択してAdd a libraryに「1ReeQ6WO8kKNxoaA_O0XEQ589cIrRvEBA9qcWpNqdOP17i47u6N9M5Xh0」を追加したあと、最新バージョンを選択して保存を押せば使えるようになる。
1ReeQ6WO8kKNxoaA_O0XEQ589cIrRvEBA9qcWpNqdOP17i47u6N9M5Xh0