[Document workflow] Pandoc: HTML を Markdown に変換する

オンライン版を少し探したが見つけられなかったので、Pandoc ですませた。

インストール

brew cask で入れた方がバージョンが新しい。

% brew cask info pandoc
pandoc: 1.12.3
http://johnmacfarlane.net/pandoc
Not installed
https://github.com/phinze/homebrew-cask/commits/master/Casks/pandoc.rb
==> Contents
  pandoc-1.12.3.pkg (install)
% brew cask install pandoc
==> Downloading https://pandoc.googlecode.com/files/pandoc-1.12.3.pkg.zip
######################################################################## 100.0%
==> Running installer for pandoc; your password may be necessary.
Password:
==> installer: Package name is pandoc
==> installer: Installing at base path /
==> installer: The install was successful.
  pandoc installed to '/opt/homebrew-cask/Caskroom/pandoc/1.12.3' (13 files, 17M)

つかいかた

a.html というファイルから、a.md という Markdown ファイルを生成する。

% pandoc -o a.md a.html

補遺

当ブログのエントリーを HTML => Markdown 形式へ変換してみましたが、以下のような問題が起きました。

  • 意図しない書き方に変換される。
  • Code が一部欠損する。

何も確認せずに自動変換、とはいかなさそうです。

追記:2015/04/07
markdown には方言があるので、pandoc の入力オプション -f/--from と出力オプション -t/--to を適切に指定すれば問題なく変換できたかも知れないですね。

  • markdown (Pandocによる拡張Markdown)
  • markdown_strict (オリジナルの拡張されていないMarkdown)
  • markdown_phpextra (PHP Markdown Extraによる拡張Markdown)
  • markdown_github (GitHubによる拡張Markdown)

ブラウザで HTML を Markdown に変換する

追記:2014/05/15
サービスを見つけました。