参考
Web ページをテキストにしたいな〜とおもったので w3m をインストールして。
w3m -dump -cols 80 hoge.html > hoge.txt
あら、日本語が文字化けした。
w3m . で起動して o で設定
Display charset を [Japanese(EUC-JP)]
Default document chaset を [Japanese(EUC-JP)]
System charset を [Japanese(EUC-JP)]
System charset follows locale(LC_TYPE) を [NO]
で OK