[Google Apps Script] Google Apps Script で sitemap.xml から URL とタイトルのリストを生成する

Google Spreadsheet で使う関数を作成します。

sitemap.xml から URL リストを取得する

UrlFetchApp.fetch() でファイルを取得。
XmlService を利用してパースします。

とても分かりやすいコードが公開されていましたので利用させて頂きましょう。

コード.js にコードをコピーすれば sitemap() 関数が利用できるようになります。

URL リストから対応する title を取得する

UrlFetchApp.fetch() で HTML を取得。
.match を利用してマッチした文字列を抜き出します。

コード.js
/**
 * Return <title> content
 *
 * @param {"https://www.example.com/foo.html"} url REQUIRED The url of the page
 * @return Return string from a page title
 * @customfunction
 */

function getTitle(url) {
  var _options = {
    method: "GET"
  };

  try {
    var _response = UrlFetchApp.fetch(url, _options);
    var _regexp = /<title>(.*?)<\/title>/;
    var _title = _response.getContentText().match(_regexp);

    return _title[1];
  } catch (e) {
    return e;
  }
}

コメントを書いておくと関数利用時にヘルプが表示されます。

補遺