【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』　Meta AI [すらいむ★]

【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』　Meta AI [すらいむ★] at SCIENCEPLUS

1:すらいむ ★
23/09/05 22:24:09.63 y/N6f1WW.net
数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
　科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。
　しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。
　この問題に対処するために、Meta AIの研究チームは『Nougat（Neural Optical Understanding for Academic Documents）』という新しいOCR（光学式文字認識）技術を開発しました。
（以下略、続きはソースでご確認ください）
aiboom　2023/9/5
URLﾘﾝｸ(aiboom.net)

2:名無しのひみつ
23/09/06 00:14:25.56 KsubIiCX.net
本田望結、美くびれ際立つ抜群のスタイルに「ウエストラインの美しさよ」「スタイルほんといいな」の声
URLﾘﾝｸ(fgjuyt.paulgross.net)

3:名無しのひみつ
23/09/06 01:08:26.53 kyzzQG/w.net
それでも日月と明を識別できるようになるには結構な壁がある

4:名無しのひみつ
23/09/06 02:26:26.51 fx3sqApX.net
「インド人を右に」は最後の伝説

5:名無しのひみつ
23/09/06 06:33:46.74 ZCK366KO.net
これ、ヌガーって読むの？

6:名無しのひみつ
23/09/06 08:13:40.66 +ith8zYD.net
※内容は治りません

7:名無しのひみつ
23/09/06 23:12:07.87 t/uSz4PZ.net
盗み撮りした機密文書の状態が悪くてもデータ化できますとか

8:名無しのひみつ
23/09/07 02:00:20.66 cQiFlVKi.net
>>3
前後の文脈で判断するんじゃね？

9:名無しのひみつ
23/09/07 11:01:48.16 X4/BCAPh.net
アルファベットは読めても漢字は難しいだろう

10:名無しのひみつ
23/09/08 10:14:51.12 WE2yPhY4.net
古い論文だとpdf化していても単にスキャンして画像データ化しただけのものって今だに多いからな
 >>9
そもそも漢字が使われる論文自体が限定的

11:名無しのひみつ
23/09/08 10:21:42.10 hblXy8SZ.net
OCRって似た文字に誤変換されるから
それ探すのに時間がかかって
時間的に手打ちするのとかわらなかったりするのな

12:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています