【初心者スレ】Ubuntu Linux 52
at LINUX
380:login:Penguin
10/06/05 01:15:08 JfmbJ71m
hyper estraierを使っていて、日本語、英語のpdfが途中までしかテキスト化されてませんでした.
スレリンク(unix板:138-149番)で
やられているとおり
estfxpdftohtml の中の
pdftotext -enc UTF-8 -htmlmeta "$infile" - 2> "/dev/null" | output を
pdftotext -enc UTF-8 -raw -nopgbrk "$infile" - 2> "/dev/null" | output
として 2カラム ページ情報捨てるestfxpdftotextという名前でコピーし
estcmd gather -cl -fx ".pdf" "T@estfxpdftotext" -fz -ic UTF-8 -pc UTF-8 -il ja -lf -1 -lt -1 -sd -cm casket ~/PDFDIR
とやってみました
hyper estraierを使ってPDFを十分に引っかけられている人はいますか?
次ページ続きを表示1を表示最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5109日前に更新/282 KB
担当:undef