[Document & Workflow] Pandoc: HTML を Markdown に変換する

オンライン版を少し探したが見つけられなかったので、Pandoc ですませた。

[markdown]
> * [Pandoc – About pandoc](http://johnmacfarlane.net/pandoc/)
> * [Pandoc ユーザーズガイド 日本語版 – Japanese Pandoc User’s Association](http://sky-y.github.io/site-pandoc-jp/users-guide/)

## インストール

brew cask で入れた方がバージョンが新しい。

“`prettyprinted
% brew cask info pandoc
pandoc: 1.12.3
http://johnmacfarlane.net/pandoc
Not installed
https://github.com/phinze/homebrew-cask/commits/master/Casks/pandoc.rb
==> Contents
pandoc-1.12.3.pkg (install)
% brew cask install pandoc
==> Downloading https://pandoc.googlecode.com/files/pandoc-1.12.3.pkg.zip
######################################################################## 100.0%
==> Running installer for pandoc; your password may be necessary.
Password:
==> installer: Package name is pandoc
==> installer: Installing at base path /
==> installer: The install was successful.
pandoc installed to ‘/opt/homebrew-cask/Caskroom/pandoc/1.12.3’ (13 files, 17M)
“`

## つかいかた

a.html というファイルから、a.md という Markdown ファイルを生成する。

“`prettyprinted
% pandoc -o a.md a.html
“`

## 補遺

当ブログのエントリーを `HTML => Markdown` 形式へ変換してみましたが、以下のような問題が起きました。

* 意図しない書き方に変換される。
* Code が一部欠損する。

何も確認せずに自動変換、とはいかなさそうです。

追記:2015/04/07
markdown には方言があるので、pandoc の入力オプション `-f/–from` と出力オプション `-t/–to` を適切に指定すれば問題なく変換できたかも知れないですね。

– markdown (Pandocによる拡張Markdown)
– markdown_strict (オリジナルの拡張されていないMarkdown)
– markdown_phpextra (PHP Markdown Extraによる拡張Markdown)
– markdown_github (GitHubによる拡張Markdown)

### ブラウザで HTML を Markdown に変換する

追記:2014/05/15
サービスを見つけました。

> * [to-markdown.js – an HTML to Markdown converter written in javascript](http://domchristie.github.io/to-markdown/)
[/markdown]