【初心者スレ】Ubuntu Linux 52 at LINUX
[2ch|▼Menu]
380:login:Penguin
10/06/05 01:15:08 JfmbJ71m
hyper estraierを使っていて、日本語、英語のpdfが途中までしかテキスト化されてませんでした.
スレリンク(unix板:138-149番)
やられているとおり
estfxpdftohtml の中の
pdftotext -enc UTF-8 -htmlmeta "$infile" - 2> "/dev/null" | output を
pdftotext -enc UTF-8 -raw -nopgbrk "$infile" - 2> "/dev/null" | output
として 2カラム ページ情報捨てるestfxpdftotextという名前でコピーし
estcmd gather -cl -fx ".pdf" "T@estfxpdftotext" -fz -ic UTF-8 -pc UTF-8 -il ja -lf -1 -lt -1 -sd -cm casket ~/PDFDIR
とやってみました
hyper estraierを使ってPDFを十分に引っかけられている人はいますか?


次ページ
続きを表示
1を表示
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5109日前に更新/282 KB
担当:undef