[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2ch.scのread.cgiへ]
Update time : 08/27 04:28 / Filesize : 249 KB / Number-of Response : 994
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

青空文庫 11棚目



1 名前:無名草子さん [2022/05/03(火) 21:14:18.76 .net]
青空文庫
https://www.aozora.gr.jp/

【前スレ】
青空文庫 10棚目
https://mevius.5ch.net/test/read.cgi/books/1556609356/

【過去スレ】
青空文庫
book.5ch.net/test/read.cgi/books/1053625425/
※青空文庫 2冊目※
book3.5ch.net/test/read.cgi/books/1073138957/
【※】青空文庫 3棚目【※】
https://book3.5ch.net/test/read.cgi/books/1090913506/
【※】青空文庫4棚目【通りすがり】
https://book3.5ch.net/test/read.cgi/books/1107162580/
青空文庫 5棚目
https://love6.5ch.net/test/read.cgi/books/1152838732/
青空文庫 6棚目
https://kamome.5ch.net/test/read.cgi/books/1272024810/
青空文庫6.5棚目
https://toro.5ch.net/test/read.cgi/books/1284042704/
青空文庫 7.5棚目
https://toro.5ch.net/test/read.cgi/books/1330433965/
青空文庫 8棚目
https://peace.5ch.net/test/read.cgi/books/1349105770/
青空文庫 8.5棚目
https://mevius.5ch.net/test/read.cgi/books/1427638306/
青空文庫 9棚目
https://mevius.5ch.net/test/read.cgi/books/1507638527/

2 名前:無名草子さん [2022/05/03(火) 21:14:51.14 .net]
【青空文庫について】

青空文庫早わかり
https://www.aozora.gr.jp/guide/aozora_bunko_hayawakari.html

青空文庫のしくみ
https://www.aozora.gr.jp/aozora_bunkono_shikumi.html

青空文庫収録ファイルの取り扱い規準
https://www.aozora.gr.jp/guide/kijyunn.html

青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

耕作員を志願される皆さんへ
https://www.aozora.gr.jp/guide/kousakuin.html

青空文庫への作品収録を望まれる方へ
https://www.aozora.gr.jp/guide/shuuroku.html

図書カード:青空文庫の提案 (青空文庫)
https://www.aozora.gr.jp/cards/001790/card56572.html

図書カード:「天に積む宝」のふやし方、へらし方 (富田 倫生)
https://www.aozora.gr.jp/cards/000055/card59489.html

青空文庫 - Wikipedia
https://ja.wikipedia.org/wiki/%E9%9D%92%E7%A9%BA%E6%96%87%E5%BA%AB

3 名前:無名草子さん [2022/05/03(火) 21:15:13.25 .net]
【主な青空文庫の関連・派生サイト(順序不同)】

本の未来基金
https://honnomirai.net/

aozorahack
https://aozorahack.org/

青空WING
https://aozorawing.osdn.jp/

ふりがな文庫
https://furigana.info/

青空朗読
aozoraroudoku.jp/

4 名前:無名草子さん [2022/05/03(火) 21:16:14.51 .net]
【主な青空文庫の類似サイト(順序不同)】

国立国会図書館デジタルコレクション
https://dl.ndl.go.jp/

Wikisource
https://ja.wikisource.org

プロジェクト杉田玄白
https://www.genpaku.org/

うわづら文庫
www.let.osaka-u.ac.jp/~okajima/uwazura.html

科学図書館
www.cam.hi-ho.ne.jp/munehiro/science/scilib.html

PD図書室
books.salterrae.net/

5 名前:青空文庫アクセスランキング [2022/05/05(木) 19:32:33 .net]
2022年4月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_04_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_04_txt.html

6 名前:aozorablog [2022/05/09(月) 12:28:24.03 .net]
青空文庫’22/03月-’22/04月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5033

7 名前:無名草子さん mailto:sage [2022/05/15(日) 17:11:39.20 .net]
アメリカで著作権保護期間を短縮する法案(遡及適用あり)が提出されたらしい
まぁ日本の保護期間延長はアメリカ云々ではなく欧州に歩調を合わせたもの(日欧EPAによる取り決め)だが


米国:「Woke」したディズニーへの報復として著作権保護期間を56年に短縮する法案が提出される | P2Pとかその辺のお話R
https://p2ptk.org/copyright/3582

ディズニーの著作権の特別保護を剥奪する法案をアメリカ上院議員が提出、2022年内にミッキーが「フリー素材」化する可能性 - GIGAZINE
https://gigazine.net/news/20220513-disney-copyright-hawley/

8 名前:無名草子さん mailto:sage [2022/05/15(日) 18:11:47.16 .net]
これで十分だ。

> 1970年にアメリカで初めて成立した著作権法は、「14年間」の保護期間という短いものでした。

9 名前:無名草子さん mailto:sage [2022/05/15(日) 20:52:31.27 .net]
というか没後何年じゃなくて公開後何年にしてほしい
存命中は延長申請可とかの特例措置で折り合いを付けて

「没年が重要な基準なのに著作者がいつ亡くなったのかが必ずしも分かるわけじゃない」というのが著作権上の問題の1つなので


あと保護期間中に著作者が亡くなったらどうするのかという「著作者や著作権承継者の連絡先が分からない」問題については著作権情報センターあたりで管理・仲介をしてほしいな

10 名前:無名草子さん [2022/05/16(月) 20:30:42.46 .net]
アメリカだと、一定の年数の作品だと公開後95年じゃなかったっけ?
(だから日本だと保護期間がある作家や画家の作品がWikipediaとかで公開されてたりする)



11 名前:無名草子さん [2022/05/17(火) 02:47:42.02 .net]
したらば、爆 サ イは企業(パチンコ店など)と提携してステマをしてる可能性が高い(ステマ掲示板)。
5ちゃん(2ちゃん)も?
掲示板は企業がステマするためのサイトになってる。
したらば、爆サイ、5ちゃんの管理人はユーザーをハッキングして個人情報を覗き見してる。
したらば、爆サイ、5ちゃんの管理人はユーザーを特定しようと自宅やネカフェまで探しに来る。
管理人はユーザーが掲示板を見てるだけでも今どこを見てるか分かります。
掲示板を見るだけのときも必ず匿名性の高いプロキシを使ってください(低いのは意味ないです)。

爆サイ管理人=したらば管理人=ネット工作会社ピットクルー=パチンコ店(パチンコ業界)。
爆サイ管理人(したらば管理人)、ネット工作会社ピットクルー、パチンコ店社員は連絡取り合いながら連携してパチンコ店スレに書き込んでるようです。
「客の悪口荒らし」「長文荒らし」をしてるのは爆サイ管理人(したらば管理人)やピットクルーやパチンコ店社員です。
それを削除してるのも同じ爆サイ管理人です。
ニコニコは5ちゃん管理人と情報を交換していたから安全ではない。

ピットクルーなどが爆サイ管理人もしてます。
爆サイ、したらば、5ちゃんはパチンコ業界などの資金で運営されてるようです。

パチンコ店は無抽選台に遠隔大当たり信号を送って大当たりさせてるだけです。
大当たり確率は嘘です。
パチンコ店は営業中に確率を自由に変えています。
パチンコ、スロットは詐欺です。
そして店は暴力団配下のサクラ軍団の台に遠隔大当たりをさせ、サクラ軍団は違法に年間数億円、数10億円を稼いでいます。
大手パチンコ店でも大勝ちしてるのはこのサクラ軍団ばかりです。

マルハン、楽園などの大手パチンコ店は顔認証データを交換していて、勝たせた客が他店で勝てないようにしてます(最後は全員負けるようになってる)。
嫌がらせ対象に選ばれた客の顔認証データも交換していて、その客が来店して席に着いた瞬間に隣や後ろの台を大当たりさせる嫌がらせをしてきます。
この客は他の席に移動してもすぐに隣や後ろの台を大当たりさせる。
これはパチンコ店の違法行為、犯罪です
パチンコ店の社員は偏差値40くらいしかないです。

12 名前:無名草子さん mailto:sage [2022/05/19(木) 23:46:54.93 .net]
底本も古い作品に関しては、これで入力・校正が更に捗るな。

「個人向けデジタル化資料送信サービス」の開始について(付・プレスリリース)|国立国会図書館―National Diet Library
https://www.ndl.go.jp/jp/news/fy2022/220519_01.html

13 名前:無名草子さん mailto:sage [2022/05/26(木) 12:42:36.42 .net]
DLは1月からだからそれまでは手持ちの底本で作業しよう。
しかしありがたいことだ

14 名前:無名草子さん mailto:sage [2022/05/26(木) 19:42:05.93 .net]
>>12のニュースは青空文庫とは直接関係ないのでは?
著作権保護期間中であっても一定条件を満たせば閲覧やダウンロードが可能になるということだけど
これはあくまでも国会図書館と個人利用者との間のやりとりの話であって、第三者へのデータ再配布が許可されたわけではないでしょ

15 名前:無名草子さん mailto:sage [2022/05/26(木) 20:44:47.36 .net]
図書館に行ったり国会図書館に複写送付頼まなくても、家から底本が確認できるってことじゃない?

16 名前:無名草子さん mailto:sage [2022/05/26(木) 20:51:02.35 .net]
>>14
国立国会図書館デジタルコレクションの限定公開の基準だと序文や挿絵とか装幀とかで1人でも著作権保護期間中の人が居たら裁定か限定公開になるから
(※ちなみに完全に著作権保護期間が満了してても復刻版が市販されてたら限定公開になる場合がある)
本文を書いた人は著作権保護期間満了してるとか分担執筆で第○章だけは著作権保護期間満了してるとかの部分は普通にパブリックドメインなので青空文庫に収録できる


そしてそういう再版も復刻もしてないような入手が困難な古い作品(しかも全く同じ底本)を
入力者も校正者も青空文庫の運営側も簡単に閲覧出来る状況になったわけだから入力や校正のやりやすさは格段に上がった

古い本だと仮に古書店で手に入れられてもコピーやスキャンが大変なレベルで劣化してたり元の所蔵者の書き込みがあったりするし
そもそも国立国会図書館以外の所蔵がほとんど確認できない本も少なくない

17 名前:14 mailto:sage [2022/05/26(木) 22:09:44.43 .net]
>>16
なるほどそういうことか
言われてみればたしかに「著作権が切れてるはずなのに、なんで限定公開なの?」って作品がありました

18 名前:無名草子さん mailto:sage [2022/05/26(木) 22:39:31.76 .net]
デジタルコレクションの図書館・個人送信限定のやつって
国立国会図書館の転載に関する利用規約を読むと複写物の(つまり画像としての)話しかしてない気がするけど
青空文庫みたいに文字起こしにして公開するのは問題ないのかな

国立国会図書館ウェブサイトからのコンテンツの転載 |国立国会図書館
https://www.ndl.go.jp/jp/use/reproduction/index.html

掲載/展示/放映/インターネット・ホームページ等への掲載のための国立国会図書館デジタルコレクションの画像データ提供(試行)|国立国会図書館
https://www.ndl.go.jp/jp/copy/reproduction/index.html
青空文庫側は前々から備考欄に
>国立国会図書館デジタルコレクション(https://dl.ndl.go.jp/)で公開されている当該書籍画像に基づいて、作業しました。
って書くようにしてるっぽいけど

青空文庫編 青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

19 名前:無名草子さん mailto:sage [2022/05/27(金) 12:18:57.86 .net]
国立国会図書館デジタルコレクションは本単位で公開/限定公開が決められてるっぽいけど
青空文庫は著者単位で収録されるからそこだけ抜き出して読んでも面白いもの作品は入力されるかもね

特に雑誌の寄稿なんかは分量も多くないし本を出してないような人でも書いてる場合があるから
「この人って作家や学者じゃないけど文章を遺してたんだ」みたいな人が収録されるかもしれない

20 名前:19 mailto:sage [2022/05/27(金) 12:29:32.63 .net]
人任せみたいになってしまったけど自分は自分でこの話題が出る前から入力中/校正中の作品があるので……



21 名前:無名草子さん mailto:sage [2022/05/27(金) 15:29:56.44 .net]
個人送信のものは権利者からの除外申請で今後見れなくなる可能性もあるのね。
アクセスしやすいから底本にしたのに、デジコレで見れなくなって逆にアクセスの難易度が上がることもあるかも

22 名前:無名草子さん mailto:sage [2022/05/27(金) 16:12:26 .net]
かつて夢野久作の犬神博士は青空文庫で公開されていまいたが、今は作業中かつ非公開になっているようです。
過去に公開された版になにか問題があってそれは今公開することは不適切なのでしょうか?

23 名前:無名草子さん mailto:sage [2022/05/27(金) 19:22:08.89 .net]
>>22
入力者がYahoo!ジオシティーズで青空文庫と同じフォーマット(ただし校正者欄等は空白)で公開してたらしいのでそれと混同してるのではないでしょうか

https://web.archive.org/web/20190330051028/www.geocities.jp/tamiyagi2/inugami_hakase.html
※インターネットアーカイブ


青空文庫内を検索しても2005年のそらもようの

>入力中としてきた、夢野久作「犬神博士」(新字新仮名)、横光利一「寝園」(新字新仮名)、幸田露伴「五重塔」(新字新仮名)、矢田津世子「仮面」(新字新仮名)を、入力取り消しに変更しました。

https://www.aozora.gr.jp/soramoyou/soramoyou2005.html

という報告しか見当たらなかったので青空文庫では公開されてなかったと思います

24 名前:23 mailto:sage [2022/05/27(金) 19:39:19.60 .net]
一応過去スレも確認したけど

>夢野久作の犬神博士.
>1998/09/14入力開始として2004/04/08現在で5年半ほど放置されたまんまですねぇ......
>どうするつもりなんだろ?

https://mevius.5ch.net/test/read.cgi/books/1073138957/369

という書き込みを発見しただけで終わった

25 名前:無名草子さん mailto:sage [2022/05/27(金) 20:49:52.36 .net]
>>23-24
なるほど私の勘違いのようですね。ありがとうございました。

26 名前:無名草子さん mailto:sage [2022/05/28(土) 01:09:15.20 .net]
2004年のスレを流し読みしたけど色んな意味で時代を感じるな……

27 名前:無名草子さん mailto:sage [2022/05/28(土) 06:48:24.95 .net]
>>19
私は実際に、とある女性画家の画集(展覧会図録)に、「掲載先不明」って扱いで載ってた文章が気になって、その画家の事を調べていたら地元の図書館で閲覧できる国会図書館のサイトで偶然掲載元を発見して、そこから青空文庫に載せました。

28 名前:無名草子さん mailto:sage [2022/05/28(土) 19:05:34.33 .net]
前スレで『コロロッチョ』って何だよみたいなこと書いたけど
「コロロッチョ」は登場人物の名前で原文(下記参照)では"Grillino"だった

というか何の救いもない理不尽な童話だな……

Il raccontafiabe/Grillino - Wikisource
https://it.wikisource.org/wiki/Il_raccontafiabe/Grillino

29 名前:無名草子さん mailto:sage [2022/05/30(月) 23:56:16.50 .net]
本文を書いた著者の著作権が切れてない本で別の著作権が切れた人の書いた序文とかは
本文を書いた著者の作品が収録できなくて苦渋を嘗めた工作員への手慰みになる

30 名前:2022年6月公開予定作品一覧 [2022/05/31(火) 18:27:15.93 .net]
2022-06-01 ホワイト フレッド・M『悪の帝王 12 第12話 マルコス将軍』
2022-06-02 柳田 国男『おばけの声』
2022-06-03 山本 周五郎『艶妖記 忍術千一夜 第一話』
2022-06-04 李 箱『街衢ノ寒サ ――一九三三 二月十七日ノ室内ノコト――』
2022-06-05 中谷 宇吉郎『大阪人と科学精神』
2022-06-06 グリム兄弟『三つのことば』
2022-06-07 管野 須賀子『肱鉄砲』※誕生日
2022-06-08 作者不詳『現代語訳 平家物語 06 第六巻』
2022-06-09 有島 武郎『小さき影』※命日(星座忌)
2022-06-10 大町 桂月『鎌倉大仏論』※命日
2022-06-11 山本 周五郎『三悪人物語 忍術千一夜 第二話』
2022-06-12 小川 未明『雪くる前の高原の話』
2022-06-13 田山 花袋『月明夜々』
2022-06-14 チェスタートン ギルバート・キース『共産主義者の犯罪』※命日
2022-06-15 中谷 宇吉郎『九谷の皿』
2022-06-16 芳賀 矢一『鎌倉』※誕生日



31 名前:2022年6月公開予定作品一覧 [2022/05/31(火) 18:27:54.88 .net]
2022-06-17 寺田 寅彦『赤』
2022-06-18 坂口 安吾『豊島さんのこと』※豊島与志雄命日
2022-06-19 パスカル ブレーズ『パスカルの言葉』※誕生日
2022-06-20 永井 荷風『枯葉の記』
2022-06-21 岡本 かの子『ひばりの子』
2022-06-22 山本 周五郎『おさん』『日日平安』※誕生日
2022-06-23 壺井 栄『風』※命日
2022-06-23 三木 露風『修道院の月』※誕生日
2022-06-24 中谷 宇吉郎『御馳走の話』
2022-06-25 オーウェル ジョージ『あなたと原子爆弾』※誕生日
2022-06-26 山川 健次郎『マルクス主義は科学にあらず』※命日
2022-06-27 石川 善助『仙台の夏』※命日
2022-06-28 山本 周五郎『四日のあやめ』
2022-06-29 寺田 寅彦『「万年筆」欄より』
2022-06-30 田山 花袋『夏』

32 名前:無名草子さん [2022/05/31(火) 22:26:03.85 .net]
来月は
・管野須賀子(1881-1911、幸徳事件で処刑された死刑囚)
・パスカル(1623-1662、フランスの哲学者)
・山川健次郎(1854-1931、元東大・九大・京大総長)
が新しく入るのか

中々に濃いメンツだ

33 名前:無名草子さん mailto:sage [2022/06/01(水) 17:06:39.71 .net]
それにしても、幸徳秋水は真っ先に入ったのに他の処刑された人物は今に至るまでそんなに入らなかったのは何故なのか……

34 名前:無名草子さん mailto:sage [2022/06/01(水) 19:34:44.01 .net]
・誰もその人に興味がない
・その人に興味を持つ層が青空文庫工作員に居ない
・その人に興味がある青空文庫工作員の居住地では底本の入手が困難

今回は該当しないけど場合によっては「そもそも(活版印刷による)著作物がない」という可能性もある

35 名前:無名草子さん mailto:sage [2022/06/01(水) 20:47:21 .net]
Twitterとかだと、いろいろ政治的な話をしてる人や戦前または戦時中の日本の話題を良かれ悪かれしてる人がいっぱいいるのに、あんまりその時代の思想家や政治家の文章が青空文庫に入らないのも不思議だよね
(知ってる限りだと、石原莞爾や北一輝があるくらい…)

36 名前:無名草子さん mailto:sage [2022/06/01(水) 21:49:37.70 .net]
良かれ側の層は出版された専門書とか論文を読むだろうし
悪かれ側の層は電子とか紙とか専門性とか以前にそもそも本なんか進んで読まないでしょ

37 名前:無名草子さん mailto:sage [2022/06/01(水) 22:04:42.96 .net]
僅かではあるけど専門書的な作品は一応あるよね

38 名前:無名草子さん mailto:sage [2022/06/01(水) 23:56:32.94 .net]
あと単純に有名な作品(または広めたい作品)がまだ著作権切れてないから入力出来ないってパターンもある

39 名前:無名草子さん mailto:sage [2022/06/03(金) 12:40:09.38 .net]
分野別リストで政治の欄を見ると124件ある

青空文庫 分野別リスト:31 政治
https://yozora.main.jp/3/ndc31.html

40 名前:無名草子さん mailto:sage [2022/06/04(土) 07:39:18.53 .net]
戦前や戦後すぐの首相はだいたいパブリックドメインだと思うけど、何割ぐらい網羅されてるんだろう?
(有名な東条英機もページすらできてないような……)



41 名前:無名草子さん [2022/06/04(土) 15:29:02 .net]
>>40
せっかくだから調べてみた
今ある校了作品が全員公開されると約1割(34人中4人)になるね

1967年以前死亡の内閣総理大臣は34人

公開中の作品があるのは2人(5.9%)
→大隈重信、吉田茂

作業中の作品だけがあるのは6人(17.6%)
→伊藤博文、松方正義、西園寺公望、山本権兵衛、高橋是清、池田勇人
※高橋是清と池田勇人は校了作品あり
※山県有朋は校正待ち作品あり

ページのみあるのは1人(2.9%)
→原敬

42 名前:無名草子さん mailto:sage [2022/06/04(土) 16:32:15.68 .net]
大隈重信→早稲田出身か佐賀出身が頑張った?
吉田茂→1967年没だから2018年1月1日のパブリックドメインデイに合わせて頑張った?

あたりかな?

43 名前:無名草子さん [2022/06/05(日) 10:43:21.90 .net]
>>41
幣原喜重郎も公開されてるから3人じゃない?
それから、校了の高橋是清作品は秘書官の上塚司の編集等が入ってるから2049年まで公開できない。

44 名前:青空文庫アクセスランキング [2022/06/05(日) 12:08:34.01 .net]
2022年5月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_05_xhtml.html
※書き込み時点で1位から10位までの作品名と著者名が空白(何かしらの人為的ミスか不具合?)

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_05_txt.html

45 名前:無名草子さん [2022/06/05(日) 18:29:41.10 .net]
>>43
見落としてた
失敬

46 名前:無名草子さん mailto:sage [2022/06/06(月) 18:36:18.28 .net]
前もこんなのなかったっけ?

47 名前:aozorablog [2022/06/06(月) 23:13:52.97 .net]
青空文庫’22/04月-’22/05月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5050

48 名前:無名草子さん mailto:sage [2022/06/09(木) 22:19:23.49 .net]
早稲田創立者の大隈重信や慶應義塾創立者の福沢諭吉は結構あるけど他の大学創立者はほとんど網羅されてない……みたいなのもある

49 名前:無名草子さん mailto:sage [2022/06/12(日) 13:49:53.97 .net]
>>48
津田塾大学の津田梅子さんは校了してるからそのうち入るよ

50 名前:無名草子さん mailto:sage [2022/06/12(日) 15:59:15.47 .net]
新紙幣つながりで北里大学学祖の北里柴三郎も考えなきゃな
(※渋沢栄一は作業中作品あり)



51 名前:無名草子さん mailto:sage [2022/06/12(日) 22:13:33 .net]
>>49
なるほど
ググったらデジタルコレクションでも読めるっぽいけど良い流れですな

52 名前:無名草子さん mailto:sage [2022/06/12(日) 23:51:43.10 .net]
新紙幣とか時代劇とか何かしらのきっかけで急に話題性が出た時に「この人青空文庫に作品載ってるじゃん!!」って形の話題に出るように先手に回りたいねぇ
(それで話題になるのは自叙伝とか回顧録とかに限定されそうだけど……)

53 名前:無名草子さん mailto:sage [2022/06/14(火) 22:09:34.50 .net]
人なり作品なりの種類を増やしたいのは分かるがまずは目の前の作業中作品を公開作品にすることを考えよう
特に「校正中」でいくつかストップさせてる俺

54 名前:無名草子さん mailto:sage [2022/06/19(日) 22:21:05.50 .net]
ある作品を入力しようかと考えてるんだけど底本候補が初出誌、単行本、作品集、著作集、選集、全集……と色々あって有名な作品は底本を選ぶのが難しいね
文字遣いの別や総ルビ/パラルビの別、後の発行による加筆訂正の有無があれば複数の底本を収録するという道も残るらしいけど

55 名前:無名草子さん mailto:sage [2022/06/20(月) 22:48:50.79 .net]
「VSCode」を縦書きビューや文字数カウントを備えた原稿エディターにする拡張機能「novel-writer」/青空文庫注記法の注記やルビにも対応。品詞の色分け表示やPDF出力もできる【レビュー】 - 窓の杜
https://forest.watch.impress.co.jp/docs/review/1417878.html

>本拡張機能を「Visual Studio Code」に導入すると、テキストファイルを開いた際に、青空文庫注記法のルビや傍点などが強調表示されるほか、単語が品詞ごとに色分けされて表示される。

56 名前:無名草子さん mailto:sage [2022/06/23(木) 11:54:06.14 .net]
どこかで曇天文庫がひっそりと復活してる、とかはないか…

57 名前:無名草子さん mailto:sage [2022/06/24(金) 19:22:07.34 .net]
近代書籍の旧字や複雑なレイアウトに対応したOCRソフト発売、90%以上の読み取り精度 - INTERNET Watch
https://internet.watch.impress.co.jp/docs/news/1419225.html

欲しい

58 名前:無名草子さん mailto:sage [2022/06/25(土) 14:40:21.79 .net]
>>56
yahooブログ終わる前に全部DLして曇天文庫読むためにkindle端末を買ったよ

59 名前:無名草子さん mailto:sage [2022/06/26(日) 15:13:59.28 .net]
>>56
下記ツイートが事実という前提だとして
普通に考えたらやりたくてもやりたくないだろうなぁ

https://twitter.com/bsbakery/status/1487675595211567104
(deleted an unsolicited ad)

60 名前:無名草子さん mailto:sage [2022/06/26(日) 15:34:52.42 .net]
日本語がおかしい



61 名前:無名草子さん mailto:sage [2022/06/26(日) 15:47:14.61 .net]
曇天文庫みたいな活動それ自体についてはまたやりたいと思ったとしても
それを悪用する輩の存在を考えると活動そのものへのモチベーションとは別にやりたくなくなるだろうってことでしょ

62 名前:無名草子さん mailto:sage [2022/06/26(日) 16:24:03.02 .net]
青空文庫作品の利権を奪ったわけじゃないんでしょう?
kindleに廉価版のドストエフスキーとかあるけど
青空文庫で校正待ちになるより販売して収益を得ても
それはそれで利用者側としてもメリットがあるんだし。

63 名前:無名草子さん mailto:sage [2022/06/26(日) 16:53:29.74 .net]
曇天文庫を悪用したという話題でないのか。

64 名前:無名草子さん mailto:sage [2022/06/26(日) 17:19:50.55 .net]
青空文庫の作品を朗読して自分のホームページとかYouTubeあたりに公開してたら勝手にCDにされて売られてたみたいな話でしょ

65 名前:無名草子さん mailto:sage [2022/06/27(月) 22:03:24.74 .net]
Kindle化されたときはtxt配布やめてmobiとepubで続けてたんじゃなかったっけ?
発表待ちで作っておいたのが、70年になって気持ちが折れたような気がする

66 名前:無名草子さん mailto:sage [2022/06/27(月) 23:09:07.28 .net]
>>65
収録作品選んで目次作って表紙作ってmobiやepubに変換して、手間ひまかけて電子書籍にしたのに、それをそのまんま勝手にkindleストアとかで売られたらもうやめよってなるんじゃないの

67 名前:無名草子さん mailto:sage [2022/06/28(火) 03:28:29.54 .net]
>>66
もちろんそれも大きな要因だと思うけど、パクられてたあともいくつかアップしてくれてたんだよね
著作権の延長の年に止まったんで、これで完全にやる気なくしてしまったのかなと

68 名前:2022年7月公開予定作品一覧 [2022/06/30(木) 19:06:12.44 .net]
2022-07-01 稲生 正令『三次実録物語』※作品初公開
2022-07-02 ホワイト フレッド・M『ドレントン・デン特派員の冒険 01 第一回 黄蛾』
2022-07-03 山本 周五郎『青竹』
2022-07-04 中谷 宇吉郎『科学の限界』※誕生日
2022-07-05 山本 周五郎『葦は見ていた』
2022-07-06 作者不詳『現代語訳 平家物語 07 第七巻』
2022-07-07 寺田 寅彦『天河と星の数』※七夕
2022-07-07 ドイル アーサー・コナン『最後の事件』※誕生日
2022-07-08 山本 周五郎『荒法師』
2022-07-09 アーヴィング ワシントン『新浦島』※翻訳者(森鴎外)命日(鴎外忌)
2022-07-10 賀川 豊彦『死線を越えて 01 死線を越えて』※誕生日
2022-07-10 熊平 武二『告・原民喜』※誕生日、作品初公開
2022-07-11 山本 周五郎『石ころ』
2022-07-12 岡本 かの子『智慧に埋れて』
2022-07-13 山本 周五郎『一人ならじ』
2022-07-14 中谷 宇吉郎『人工衛星へ汲取舟が行く話』
2022-07-15 植木 枝盛『官僚は減るべし、役人は増えるべし』

69 名前:2022年7月公開予定作品一覧 [2022/06/30(木) 19:07:02.73 .net]
2022-07-16 山本 周五郎『艶書』
2022-07-17 司馬 遷『国訳史記列伝 05 孫子呉起列伝第五』※翻訳者(箭内亙)誕生日
2022-07-18 寺田 寅彦『蚊帳の研究』
2022-07-19 永井 荷風『夏すがた』
2022-07-20 山本 周五郎『危し? 潜水艦の秘密』
2022-07-21 坂口 安吾『選後感〔第二十六回芥川賞選後評〕』※第167回芥川龍之介賞受賞作発表日
2022-07-22 山本 周五郎『黒襟飾組の魔手』
2022-07-23 葛西 善蔵『呪はれた手』※命日
2022-07-24 芥川 竜之介『読書の態度』※命日(河童忌)
2022-07-24 谷崎 潤一郎『文壇昔ばなし』※誕生日
2022-07-25 山本 周五郎『幽霊屋敷の殺人』
2022-07-26 中谷 宇吉郎『校正の話』
2022-07-27 山本 周五郎『骸骨島の大冒険』
2022-07-28 江戸川 乱歩『薔薇夫人』『魔術師』※命日(石榴忌)
2022-07-29 山本 周五郎『謎の頸飾事件』
2022-07-30 伊藤 左千夫『竹乃里人』※命日(左千夫忌)
2022-07-30 谷崎 潤一郎『日本に於けるクリップン事件』※命日(潤一郎忌)
2022-07-30 新美 南吉『空気ポンプ』※誕生日
2022-07-31 柳田 国男『幻覚の実験』『忘れ難い郷里のたべ物』※誕生日

70 名前:無名草子さん mailto:sage [2022/06/30(木) 22:36:59.32 .net]
7月に新しく収録されるのは2人か

稲生正令(1735-1803)…江戸時代中期の武士
熊平武二(1906-1960)…原民喜の旧友でもある詩人



71 名前:無名草子さん mailto:sage [2022/06/30(木) 22:53:48.28 .net]
妖怪文献界の古典が公開されるとは、珍しい……

72 名前:無名草子さん mailto:sage [2022/07/01(金) 15:28:09.81 .net]
山本周五郎はどれ読んでもおもしろいのすごい

73 名前:無名草子さん mailto:sage [2022/07/01(金) 16:51:21.45 .net]
今月、誕生月より山周多い

74 名前:無名草子さん [2022/07/02(土) 06:50:31.33 .net]
山本周五郎だけでも青空文庫の存在意義がある...と言ったら怒られるかなw

75 名前:無名草子さん mailto:sage [2022/07/02(土) 10:29:00.52 .net]
山本周五郎読んでないままだけどそんなに面白いのか

76 名前:無名草子さん mailto:sage [2022/07/02(土) 11:10:22.51 .net]
青空文庫呼びかけ人の1人である富田倫生さんは
自身のTwitterアカウントを『あおべか物語』から取って「aobeka」 にしたり
「周五郎さんの公開に立ちあえたら、本望だなあ」(朝日新聞2011年6月10日)と語ったりしていたが
山本周五郎が公開される2018年1月1日を待たずして2013年に病気で亡くなってしまった

77 名前:無名草子さん mailto:sage [2022/07/02(土) 13:04:47.44 .net]
富田倫生の怨霊が時を遡り、山本周五郎を5年早く呪殺する怪談を、誰か書かないかな。

78 名前:無名草子さん mailto:sage [2022/07/03(日) 02:50:01.90 .net]
ホラー×SF×社会派?

79 名前:青空文庫アクセスランキング [2022/07/05(火) 07:07:48 .net]
2022年6月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_06_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_06_txt.html

80 名前:無名草子さん [2022/07/06(水) 21:03:32 .net]
>>74
吉川英治さんとかも人気じゃない?
あと宮本百合子さんと小川未明さんの充実ぶり



81 名前:そらもよう [2022/07/07(木) 12:18:40.02 .net]
2022年07月07日 青空文庫の「式年遷宮」に向けて
https://www.aozora.gr.jp/soramoyou/soramoyouindex.html

82 名前:無名草子さん [2022/07/07(木) 12:23:37.97 .net]
青空文庫と式年遷宮アーキテクチャ: 青空文庫200周年に向けて
https://www.slideshare.net/takahashim/aozora20th-2017

式年遷宮で思い出したが青空文庫20周年ももう5年前か……

83 名前:無名草子さん mailto:sage [2022/07/07(木) 15:02:30.09 .net]
作業した作品が初めて校了になってた
気長に待ってたけど嬉しいね

84 名前:無名草子さん [2022/07/07(木) 21:19:17.84 .net]
>>83
おめでとう(?)

85 名前:無名草子さん mailto:sage [2022/07/07(木) 21:38:27.38 .net]
やっぱりGmailで不具合が起こってたんだなぁ
自分もGmailだけど、うまく送れるように設定するのはどうすれば……

86 名前:無名草子さん [2022/07/07(木) 23:27:30.33 .net]
>>83
おめでとうございます。

ちなみに点検していただいて校了まで、どれくらいかかるものですか?

とはいえ作品サイズやいろんな条件で、けっして一律でも受領順でもないのでしょうけれども

87 名前:無名草子さん [2022/07/11(月) 22:33:53.27 .net]
青空文庫、25周年を記念してオンラインでの「ささやかな催し」を企画中。近日発表か【やじうまWatch】 - INTERNET Watch
https://internet.watch.impress.co.jp/docs/yajiuma/1423746.html

88 名前:無名草子さん mailto:sage [2022/07/12(火) 20:00:24.73 .net]
青空怪談 〜青空文庫の怖い話50選〜|みもねる|note
https://note.com/mimonelu/n/n84b11a67629e

89 名前:無名草子さん [2022/07/14(木) 22:05:24.01 .net]
文豪 森鴎外の直筆原稿の一部 新たに見つかる | NHK
https://www3.nhk.or.jp/news/html/20220714/k10013718191000.html

図書カード:渋江抽斎 (森 鴎外)
https://www.aozora.gr.jp/cards/000129/card2058.html

90 名前:aozorablog [2022/07/15(金) 23:48:00.28 .net]
青空文庫’22/05月-’22/06月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5067



91 名前:無名草子さん [2022/07/24(日) 15:31:28.02 .net]
新しい入力・校正申請をどの程度にしてすればいいのか迷う……

92 名前:無名草子さん [2022/07/24(日) 18:21:39.94 .net]
点検さんたちの底本の収集が難しい事情もわかるけれど
ボランティア側からすると
ステイホーム(半ば死語)な時勢だからこそ作業が捗るというのもあって

点検や校了、公開がかなり遅くなっても構わないから
作業受付だけはしてもらえないだろうか
と思ったりする

93 名前:無名草子さん [2022/07/24(日) 19:01:46.39 .net]
作業受付自体は既に再開してるんだよね(下記参照)
問題は「複数の底本にわたる大量の入力・校正申請を控える」の「大量」がどれくらいを想定してるのか

2020年07月07日 受付・点検の制限付き再開のお知らせ(そらもよう)
https://www.aozora.gr.jp/soramoyou/soramoyou2020.html#000516

94 名前:無名草子さん mailto:sage [2022/07/24(日) 19:12:40.17 .net]
そう、それなんです
作業状況ページを見ると、日々まとまった申請はあるようだけど
どれくらいを受け付けてもらえるかは
ボランティアさんのスキルにもよるのだろうかと考えたり

95 名前:無名草子さん [2022/07/24(日) 19:24:59.78 .net]
ここでの問題って図書館に行って底本を確認出来ないことにあるから
底本の画像データも申請と同時に送れば大抵の申請は認められるのかもしれない

知らんけど

96 名前:無名草子さん [2022/07/24(日) 21:17:36.07 .net]
Wikipediaの央端社の話を知ってふと思ったんだけど
実在しない本を捏造して入力する工作員(スパイ?)とかいるのかな

97 名前:無名草子さん [2022/07/24(日) 21:22:44.90 .net]
そのための点検グループなんじゃないかな?

98 名前:無名草子さん [2022/07/24(日) 21:33:01.13 .net]
でも今は入力者から送られてきた画像データを元に点検してるわけでしょ?
国立国会図書館サーチやCinii booksの検索に引っ掛からない本だって少なからずあるし、古い新聞や雑誌の記事ならGoogle検索すら厳しくなるから、場合によっては捏造でもバレない可能性が……
……とは言え愉快犯だとしても何が目的でそんなことするんだという疑問は当然あるけどね

99 名前:無名草子さん [2022/07/24(日) 22:12:42.67 .net]
著作権者の権利問題がクリアできないと
(著作権者の実在性と、没後70年が確認できないと)
青空文庫としてのGOはでないと思う

それとも実在の作家の作品と称して捏造してもわからないんじゃないかって話?

100 名前:無名草子さん [2022/07/24(日) 22:43:16 .net]
イメージとしては
「当時自分の地元に旅行に来ていた夏目漱石が地元の○○新聞に寄稿しているのを発見して、タイトルを調べると全集には未収録のようだから是非とも青空文庫に収録したい」
みたいな感じかな

流石に夏目漱石レベルの作家なら、未発見作品が実在するのか、本当に全集未収録作品か(初出不明で改題収録されてるだけではないか)とか、青空文庫とは別に研究家が検証するだろうけど
本格的な人物研究の伝記が出版されてなかったり、そもそも作品集の類が出版されてないレベルの人なら「マイナーな作家のマイナーな作品を入力してるねぇ」で済まされるんじゃないかと

一応言っておくけどあくまでも「もしかして気付けないのでは?」って話であって、これをして誰がどういう風に得するのかとかは考慮してないからね



101 名前:無名草子さん [2022/07/24(日) 23:26:28.21 .net]
なるほどね。
もしかするとその意味もあってこれまで、
基本的に底本の確保は各自というルールがあったのかもね。

いやもちろん勝手な想像です。

102 名前:無名草子さん mailto:sage [2022/07/24(日) 23:37:33 .net]
「そういえば」と言うほど関連してるか微妙だが坂口安吾の全集未収録作品が発見されたとかいうニュースがあったな
一昨年くらいだったと思って調べたら2018年だった

川端・安吾、埋もれた小説発掘 新聞に発表、全集未収録 あす発売「新潮」掲載:朝日新聞デジタル
ttps://www.asahi.com/articles/DA3S13388989.html

103 名前:無名草子さん mailto:sage [2022/07/25(月) 01:52:29 .net]
>>93
他の工作員の動きも関わってくるので各々具体的に何作品までというと難しいですよね。
点検する側は確保すべき底本の冊数が増えると大変ということらしいので
1冊ずつ申請したほうがいいのは間違いないと思いますが

104 名前:無名草子さん [2022/07/25(月) 20:51:43.62 .net]
昨日作業申請が通った量の膨大さにびっくり

105 名前:無名草子さん [2022/07/25(月) 20:54:28.75 .net]
底本一冊の70作品以上の校正申請が一括で通ってるね
やはり底本をしぼることこそがポイントなのかな?

106 名前:無名草子さん [2022/07/25(月) 21:20:02.06 .net]
【底本画像有】というのも大きいのかな?

107 名前:無名草子さん [2022/07/25(月) 21:31:04.09 .net]
なるほど
校正完了時じゃなくて申請時に送ってしまうのか

108 名前:無名草子さん [2022/07/25(月) 21:32:56.01 .net]
羨ましくてたまらない

109 名前:無名草子さん [2022/07/25(月) 21:55:39.08 .net]
校正者も数年に渡って百数十作品の校正をしてるという実績がある人のようだね
経験の多さで申請受理の優先劣後の区分がされてるかどうかは知らないけど

110 名前:無名草子さん [2022/07/25(月) 22:02:59.98 .net]
たしかに、経験豊富なボランティアさんなら
点検グループの負担はずいぶん軽減されるだろうね



111 名前:無名草子さん [2022/07/25(月) 22:30:35.23 .net]
なんなら必要事項を説明すれば校正作業に加えて(一部の)点検作業も任せられるだろうしね

112 名前:無名草子さん [2022/07/25(月) 22:33:48.90 .net]
>>111訂正追記

校正申請を受け付けてる時点で点検は終わってるか……

113 名前:無名草子さん mailto:sage [2022/07/26(火) 19:51:10.29 .net]
そういや「江戸川乱歩」も同姓同名で作品書いてた作家がいるって話聞いたことあるなぁ
政治家の「吉田茂」も同姓同名で2人いたらしいし、青空文庫の登録上はどうなるんだろ?

114 名前:無名草子さん [2022/07/26(火) 19:51:36.62 .net]
ハンセン病、もっと知って 国立療養所を小中学生が見学 | 共同通信
https://nordot.app/924562691536502784


北条民雄(1914-1937)の「いのちの初夜」は
ハンセン病を発病した北条が自信の入院直後を描いた作品

作家別作品リスト:北条 民雄
https://www.aozora.gr.jp/index_pages/person997.html

図書カード:いのちの初夜
https://www.aozora.gr.jp/cards/000997/card398.html

115 名前:無名草子さん [2022/07/26(火) 20:42:34.28 .net]
>>113
同一作家での作品の名前被りは副題の所に作品の冒頭を〔〕で書いて区別してるっぽいけど、そうしてないのもあるし普通に載せるんじゃないの
どのみち名前だけじゃなく生没年や登録番号のデータでも管理してるはずだしね

116 名前:無名草子さん mailto:sage [2022/07/28(木) 17:09:48.78 .net]
【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net
https://egg.5ch.net/test/read.cgi/software/1470745451/

117 名前:無名草子さん mailto:sage [2022/07/29(金) 19:39:25.97 .net]
山本周五郎ってミステリーも書いてんの?!
知らんかったわ~

118 名前:無名草子さん [2022/07/30(土) 11:49:11.35 .net]
芥川龍之介の手紙見つかる 友人で作家の佐藤春夫に送ったもの | NHK
https://www3.nhk.or.jp/news/html/20220729/k10013742861000.html

119 名前:無名草子さん [2022/07/31(日) 14:05:58 .net]
『ごんぎつね』の読めない小学生たち、恐喝を認識できない女子生徒……石井光太が語る〈いま学校で起こっている〉国語力崩壊の惨状 | 文春オンライン
https://bunshun.jp/articles/-/55970

図書カード:ごん狐 (新美 南吉)
https://www.aozora.gr.jp/cards/000121/card628.html

120 名前:2022年8月公開予定作品一覧 [2022/07/31(日) 18:00:03.32 .net]
2022-08-01 佐藤 春夫『若き日の室生犀星』
2022-08-01 萩原 朔太郎『室生犀星君の人物について』
2022-08-01 室生 犀星『ふたりのおばさん』※誕生日
2022-08-02 三富 朽葉『水のほとりに』『ピアノ』※命日
2022-08-03 山本 周五郎『殺生谷の鬼火』
2022-08-04 木下 夕爾『晩夏』※命日
2022-08-05 壺井 栄『暦』『日めくり』※誕生日
2022-08-06 木下 夕爾『火の記憶 広島原爆忌にあたり』※広島原爆忌
2022-08-07 山本 周五郎『亡霊ホテル』
2022-08-08 柳田 国男『かはたれ時』『狸とムジナ』※命日
2022-08-09 作者不詳『現代語訳 平家物語 08 第八巻』
2022-08-10 山本 周五郎『天狗岩の殺人魔』
2022-08-11 中谷 宇吉郎『八幡馬と墨の研究』
2022-08-12 山本 周五郎『劇団「笑う妖魔」』
2022-08-13 古川 緑波『売薬ファン』※誕生日
2022-08-14 三富 朽葉『深夜』『メランコリア』※誕生日
2022-08-15 釈 迢空『鵠が音 03 追ひ書き』



121 名前:2022年8月公開予定作品一覧 [2022/07/31(日) 18:00:30.83 .net]
2022-08-16 津田 梅子『女教邇言』※命日
2022-08-17 山本 周五郎『花咲かぬリラ』
2022-08-18 ホワイト フレッド・M『ドレントン・デン特派員の冒険 02 第二回 赤い斑点』
2022-08-19 永井 荷風『虫の声』
2022-08-20 山本 周五郎『海浜荘の殺人』
2022-08-21 中谷 宇吉郎『永久凍土地帯』
2022-08-22 山本 周五郎『水中の怪人』
2022-08-23 坂口 安吾『選後感〔第二十七回芥川賞選後評〕』
2022-08-24 若山 牧水『沼津千本松原』※誕生日
2022-08-25 山本 周五郎『廃灯台の怪鳥』
2022-08-26 平野 零児『丹波篠山』※命日
2022-08-27 山本 周五郎『流血船西へ行く』
2022-08-28 岡本 かの子『花子』
2022-08-29 山本 周五郎『鵜』
2022-08-30 中谷 宇吉郎『紙の洪水』
2022-08-31 山本 周五郎『月の松山』

122 名前:2022年8月公開予定作品一覧 [2022/07/31(日) 18:18:50.08 .net]
【訂正】
どれくらい皆の興味の対象か知りませんが、
先月から「作品初公開」の注釈付け足すことにしたの忘れてました。

2022-08-02 三富 朽葉『水のほとりに』『ピアノ』※命日、作品初公開
2022-08-04 木下 夕爾『晩夏』※命日、作品初公開
2022-08-16 津田 梅子『女教邇言』※命日、作品初公開

123 名前:無名草子さん mailto:sage [2022/07/31(日) 19:44:29.99 .net]
松本清張が青空文庫入りするまであと40年か
生きてるかなおれ

124 名前:無名草子さん mailto:sage [2022/07/31(日) 20:11:13.15 .net]
いい作品を読むと感動の次にすぐ
この本を入力公開できる日を自分が迎えられるか考えちゃう自分がいる

125 名前:無名草子さん mailto:sage [2022/07/31(日) 20:16:07.05 .net]
俺の目の黒い内に星新一の作品を入力出来る日は来るのだろうか

126 名前:無名草子さん mailto:sage [2022/07/31(日) 20:21:53.11 .net]
無理じゃね

127 名前:無名草子さん mailto:sage [2022/07/31(日) 20:32:18.69 .net]
太宰治とか中島敦とか青空文庫入りしてるのに生年では彼らより以前の
井上靖が入ってなくてお前とっとと死んどけよなんて一瞬思ったけど
そうなるとそもそも井上靖の作品全てが読めなくなるわけで
申し訳ありませんでしたって即座にあやまったわ。

128 名前:無名草子さん mailto:sage [2022/07/31(日) 20:35:22.01 .net]
「目の黒いうち」の使い方マチガッテル

129 名前:無名草子さん mailto:sage [2022/07/31(日) 20:53:44.60 .net]
目の黒い内に=生きている内に
だから別に間違ってないでしょ

目の黒い内とは - コトバンク
https://kotobank.jp/word/%E7%9B%AE%E3%81%AE%E9%BB%92%E3%81%84%E5%86%85-396433

130 名前:無名草子さん mailto:sage [2022/07/31(日) 20:57:46.02 .net]
>>127
逆に自殺とか不慮の事故や災害で早世した人って現在で傑作だと評価されている作品よりも優れた作品を書き上げることなく亡くなった可能性があるんだよな



131 名前:無名草子さん mailto:sage [2022/07/31(日) 21:19:54.15 .net]
自分の目の黒いうちに世界一周旅行したい

俺の目の黒いうちはそんなことはさせない

上のような使い方は変だよ

132 名前:無名草子さん mailto:sage [2022/07/31(日) 21:35:39.97 .net]
それは単に下の(拒絶や否定などのマイナスイメージを彷彿とさせる)言い回しの時に聞き馴染みがある慣用句だからそう感じるだけでしょう

「全然」は否定を伴う副詞だと勝手に思ってるようなもの

133 名前:無名草子さん mailto:sage [2022/07/31(日) 22:14:36.10 .net]
古い作品を読んでると言葉の意味を間違って使ってるのかなってのが結構ある
んで調べるとそれもありらしいってわかる

134 名前:無名草子さん mailto:sage [2022/07/31(日) 22:20:44.19 .net]
そうそう、入力校正してると特に

135 名前:無名草子さん mailto:sage [2022/08/01(月) 19:21:22.73 .net]
>>125
ショートショートなら山川方夫さんがあるぞ

136 名前:無名草子さん mailto:sage [2022/08/01(月) 21:54:38.68 .net]
山川方夫さんのショートショートも勿論とても良いが
独特のSF風味の強い、しかも先見の明ある星新一さんの世界観を青空文庫で見たい気持ちはわかる

137 名前:無名草子さん mailto:sage [2022/08/04(木) 21:11:25 .net]
【新文化】 - 最新号(22年8月4日号)案内:日販王子DC、トラック待機時間30分以内に/注文品トラック予約システム導入/ESGの取組みで実効/CO2削減量年間10トン《1面特集》
https://www.shinbunka.co.jp/saishin.htm


>最終面特集は、【インターネット図書館「青空文庫」の25年/著作権切れ&著者が公開同意した作品/1万7000点以上を登録・公開】

>著作権の保護期間を過ぎた著者の作品を電子化して公開するインターネット上の図書館「青空文庫」がこの7月、開始から25年を迎えた。
>登録作品数1万7000点以上にのぼり、パソコンのほかスマホや電子書籍リーダーなどで読まれるとともに、商業出版や朗読に利用されている。
>この青空文庫の立ち上げの経緯から現状、今後の展望について関係者に取材した。(南陀楼綾繁)

138 名前:無名草子さん mailto:sage [2022/08/05(金) 09:36:33.97 .net]
ん、梅ちゃん先生か

139 名前:無名草子さん [2022/08/05(金) 12:17:02.22 .net]
こんな新聞があるんですね.
面白そう.昨年度縮刷版を買おうかと思ってしまいました.
読む時間なさそうなので買いませんけど.

140 名前:無名草子さん mailto:sage [2022/08/05(金) 12:32:37.74 .net]
「新聞?」って思ったけど雑誌じゃなくて新聞(業界紙)という扱いなのね



141 名前:無名草子さん mailto:sage [2022/08/06(土) 01:01:49.56 .net]
コンビニのコピー機で専門紙を印刷して読めるなんて初めて知りましたわ

142 名前:青空文庫アクセスランキング [2022/08/06(土) 20:54:22.91 .net]
2022年7月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_07_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_07_txt.html

143 名前:aozorablog [2022/08/07(日) 00:15:54.49 .net]
青空文庫’22/06月-’22/07月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5076

144 名前:無名草子さん mailto:sage [2022/08/24(水) 17:20:37.47 .net]


145 名前:無名草子さん [2022/08/24(水) 23:02:18.40 .net]
スキャナーが古いせいで入力作業よりスキャンに時間がかかってる気がする

146 名前:無名草子さん [2022/08/25(木) 22:07:53.76 .net]
>>145
自分もスキャナーだとたまに読み込みが遅かったり不具合が出るから、急ぎで入れたい時はスマホ使ってる

147 名前:無名草子さん [2022/08/25(木) 23:17:07.29 .net]
分厚くてあまり貸し出しがない全集ものだと
本がしっかり開かなくてノドが影になるし
文字も読み取りにくいからCCDスキャナー買った

でもそうか、スマホを使うという手があったね

148 名前:無名草子さん [2022/08/25(木) 23:54:08.86 .net]
本→スキャン
よりも
本→コピー(画質調整あり)→スキャン
の方が古い本のシミとか分厚い本のノドとかがマシになる

まぁ特に理由がない限りはスマホ直撮りでも良いんだが
(青空文庫に送る時はPDF化とかしなくてもスマホのデータでも良いと言ってるし)

149 名前:無名草子さん [2022/08/29(月) 19:51:55.21 .net]
入力中 で何年も作業状況が止まっている作品って
ほんとうに入力者が投げ出しているものもあるかもしれないけれど
入力は終わっていて青空文庫に納品されてるけど
点検の人手が足りなくて「校正待ち」になれないものが実は多いんじゃないかという希ガス

150 名前:無名草子さん [2022/08/29(月) 20:00:25.28 .net]
「校正待ち(点検前)」という作業状態が設けられてるからそれはないんじゃなかろうか



151 名前:無名草子さん [2022/08/29(月) 20:51:53.39 .net]
校正待ち(点検前)はそういう意味ではないと思う
入力ファイルが古く、現行の注記ルールに倣っていないもののこと

152 名前:無名草子さん [2022/08/29(月) 20:54:13.21 .net]
と、校正待ち検索のサイトに書いてあったと思う

153 名前:無名草子さん [2022/08/29(月) 21:36:05.89 .net]
とは言っても近年でも使われてるからな
(単純な入力ミスの可能性もあるけど)

青空文庫 作業中作品リスト:校正待ち(点検前) 2022年
https://yozora.main.jp/cgi-bin/inp/sagyo.cgi?s=4&y=2022

154 名前:153 [2022/08/29(月) 22:32:15.10 .net]
ちょっと語気が強いような書き方になってしまった
申し訳ない

155 名前:無名草子さん [2022/08/29(月) 23:38:13.61 .net]
ほーう参考になるありがとう

156 名前:2022年9月公開予定作品一覧 [2022/08/31(水) 18:59:03.73 .net]
2022-09-01 佐藤 春夫『サーベル礼讃』※関東大震災
2022-09-02 山本 周五郎『蘭』
2022-09-03 木下 夕爾『新秋の記』
2022-09-04 山本 周五郎『柘榴』
2022-09-05 吉江 喬松『海潮の響』※誕生日
2022-09-06 山本 周五郎『合歓木の蔭』
2022-09-07 泉 鏡花『浅茅生』※命日
2022-09-07 平野 零児『吉川さんの声と眼』※吉川英治命日(英治忌)
2022-09-08 山本 周五郎『山椿』
2022-09-09 作者不詳『現代語訳 平家物語 09 第九巻』
2022-09-10 田山 花袋『中秋の頃』※中秋(旧暦8月15日)
2022-09-11 山本 周五郎『女は同じ物語』
2022-09-12 中谷 宇吉郎『ツンドラへの旅』
2022-09-13 山本 周五郎『しじみ河岸』
2022-09-14 小泉 八雲『おしどり』
2022-09-15 山本 周五郎『初夜』

157 名前:2022年9月公開予定作品一覧 [2022/08/31(水) 18:59:39.38 .net]
2022-09-16 大杉 栄『お別れ』※命日
2022-09-16 菊池 寛『競馬の一日に就いて』※競馬の日
2022-09-17 山本 周五郎『みずぐるま』
2022-09-18 ホワイト フレッド・M『ドレントン・デン特派員の冒険 03 第三回 放火団』
2022-09-19 田山 花袋『水源を思ふ』
2022-09-20 山本 周五郎『豹』
2022-09-21 中谷 宇吉郎『墨流しの物理的研究』
2022-09-22 山本 周五郎『蕗問答』
2022-09-23 坂口 安吾『花田清輝論』※花田清輝命日
2022-09-24 山本 周五郎『溜息の部屋』
2022-09-25 寺田 寅彦『卵の形』
2022-09-26 小泉 八雲『術数』『無法な火葬』※命日(八雲忌)
2022-09-27 山本 周五郎『城中の霜』
2022-09-28 永井 荷風『独居雑感』
2022-09-29 山本 周五郎『柿』
2022-09-30 中谷 宇吉郎『墨並びに硯の物理学的研究』

158 名前:無名草子さん [2022/09/02(金) 17:17:14.74 .net]
>>149
「校正待ち」の日付には、基本的に入力者が提出した日が入っているはずで、
よっぽど底本確認が大変なもの以外で点検で何年も遅れているのはなさそう
初作業の人のファイルは優先的に進めてくれるし

初作業でそのまま投げ出してる人は多い
入力は別にいいけど、校正は当たった入力者が気の毒だなと思っている

159 名前:無名草子さん [2022/09/02(金) 17:28:34.96 .net]
>>158

とてもやりとげられないと思ったら遠慮なく、と言ってくれてはいるが
やりとげるも何も作業者がそのまま忘れているケースも中にはあるんだろうな

動きがないまま二年経ったら引き継ぎ申請していいんだっけ

入力はともかく、校正は二年経ったら自動でシステムから進捗問い合わせメールが届くようになってたら
忘れてた人も思い出してくれたり、できないなら取消申請してくれるいいきっかけとタイミングになると思うから嬉しいのだけど

160 名前:無名草子さん [2022/09/02(金) 19:33:11.59 .net]
普通に2年以上放置してるわ
まだ1章まで(全体の1割未満)しか校正してない

すまん



161 名前:無名草子さん [2022/09/02(金) 19:36:56.28 .net]
>>160
単純計算で、20年計画で草。

162 名前:無名草子さん [2022/09/02(金) 20:28:54.35 .net]
>>161
1日1ページやれば1年以内に終わるはずだったが「やったー1章まで終わったー」あたりで止まってしまった
(運営側から校正者変更の打診は来てないのでどちらにせよ公開が本来より遅れたということにはなってないと信じたい)

逆に邪魔かもしれんが校正意欲は一応まだ持ってる

163 名前:無名草子さん [2022/09/02(金) 20:38:55.09 .net]
応援してる∩(´∀`∩)

164 名前:無名草子さん [2022/09/02(金) 23:01:09.15 .net]
一通り校正するのに1年かかるという意味なら300ページを超えるし、校正は4回やるということを混みで1年としても100ページ近いことになる
入力にせよ校正にせよ全集の片隅に載ってるような数ページの短編でもヒーコラ言ってる身としては申請するだけでも凄いと感じる

165 名前:無名草子さん mailto:sage [2022/09/03(土) 10:27:36.35 .net]
ちょっとずつコツコツやろうってのが間違いの元
むしろある程度集中して一気にやったほうがやれる

166 名前:無名草子さん [2022/09/03(土) 12:55:00.34 .net]
たしかに。

167 名前:無名草子さん [2022/09/03(土) 13:08:27.06 .net]
>>165
本1冊レベルの分量になると話は変わるのかもしれんが
基本的にはマジでこれだと思う

168 名前:無名草子さん [2022/09/04(日) 02:36:12.13 .net]
作業着手連絡システムの自動応答メールが来ないな

169 名前:無名草子さん [2022/09/04(日) 02:45:57.29 .net]
>>168
そらもよう(>>81)で少し触れてたけどgmailなら多分届かない

170 名前:無名草子さん mailto:sage [2022/09/04(日) 11:17:22.92 .net]
長年の校正待ちの中にある
南洲手抄言志録 00 題字(山県有朋)
っていうのはほんとうに題字だけなんだろうか

本文のほうはすでに公開されているようだが



171 名前:無名草子さん [2022/09/04(日) 13:55:15.50 .net]
よく分からんが校正受付システムのデータベースではサイズが288,664バイトとなってるな

底本見てもそんなことないと思うけど
https://dl.ndl.go.jp/info:ndljp/pid/756228

172 名前:無名草子さん [2022/09/04(日) 17:45:28.91 .net]
>>169
ありがとう
そらもよう読んでたけど先月まで届いてたから油断してた

173 名前:無名草子さん mailto:sage [2022/09/04(日) 18:03:17.03 .net]
>>171
そのバイト数の見方はいつも正直良く解らんのだが
画像込みなんだろうか?
テキストだけで36メガあるようには思えぬが

というか
NDL見たが、これどう校正したらいいのww

174 名前:無名草子さん [2022/09/04(日) 18:58:45.76 .net]
>>173
バイト数は単純にテキスト・ファイルとしての容量じゃないの?

多分「感慨係之矣/明治廿年六月/有朋題」って書いてるから
そう書いてるかどうかだけ確認する簡単なお仕事な気がする
(一部の漢字は外字注記にしてる気もするけど)

175 名前:無名草子さん mailto:sage [2022/09/04(日) 19:23:28.45 .net]
あ、ほんとだKBだったw

176 名前:無名草子さん mailto:sage [2022/09/04(日) 19:37:41.13 .net]
(*ノ▽ノ)はずかしい

177 名前:無名草子さん mailto:sage [2022/09/04(日) 22:26:37.89 .net]
【文学は大人の教養!】初心者が青空文庫検索Botを作った - Qiita
https://qiita.com/kunimuraM/items/776318bc630a8ad964b1

178 名前:青空文庫アクセスランキング [2022/09/05(月) 07:49:38.34 .net]
2022年8月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_08_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_08_txt.html

179 名前:無名草子さん [[ここ壊れてます] .net]
狂ったように山周ばっかなのはなじぇ?
銭平やってほしい

180 名前:無名草子さん [[ここ壊れてます] .net]
入力する人と校正する人がいるから



181 名前:無名草子さん [2022/09/06(火) 10:13:19.32 .net]
山があるからみたいなw

182 名前:無名草子さん [2022/09/06(火) 19:28:03.95 .net]
甲「なぜ公開されるんですか?」
乙「そこに校了作品があるから」

たしかに

183 名前:aozorablog [2022/09/07(水) 07:52:29.60 .net]
青空文庫’22/07月-’22/08月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5087

184 名前:無名草子さん mailto:sage [2022/09/07(水) 08:18:37.37 .net]
テキスト版新規公開作品一日当たりアクセス数ランキング
1位から11位まで山本周五郎が独占、流石だな
>>179 需要があるのだよ

185 名前:無名草子さん [2022/09/07(水) 18:40:13.59 .net]
(200超過アクセス/日)

200を一律に引いているのは何故?

表示テストその他で、どの作品も200程度はアクセス数から差し引く必要があるということ?

186 名前:無名草子さん [2022/09/07(水) 21:49:18.33 .net]
俺も気になってたのでちょうどいい機会だから過去のブログを調べてみた。
公開日のズレを埋めて比較できるようにと2013年頃に試行錯誤した結果っぽいね。

>公開日が新しい作品ほどランクが上位にあるから、一日あたりのアクセス数というのは、実はあまり良い指標ではないのかもしれない。
青空文庫’13/04月-’13/05月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2221

>新規公開作品は一日当たりアクセス数という指標の計算方法がどうも適切でないようなので、該当作品のアクセス数から500位のアクセス数を引いたアクセス数を公開日からの日数で割った値で順位付けしてみた。
青空文庫’13/05月-’13/06月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2264

>ランキングの指数としている超過分アクセス数/日は、またまた計算方法を変えて、該当作品のアクセス数からアクセス数200を引いたアクセス数を公開日からの日数で割った値とすることにした。
>毎月、ベースの数値を変えるのは遷移を考える際に難しいと思ったからである。
青空文庫'13/07月-'13/08月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2337

187 名前:無名草子さん [2022/09/08(木) 01:02:51.15 .net]
なるほどなぁ。

>公開日が新しい作品ほどランクが上位にあるから

どの作品も公開直後はアクセスが集中する(いわばボーナスタイム)であるから、
月の初めに公開された作品の30(31)日と
月の終わりに公開されたボーナスタイムのみの作品の数日とでは
「一日の重みと意味」が違うであろう、ということか。

9年以上この200アクセスを引く計算式で落ち着いているということは、
統計的におおむね200アクセス程度が、
ボーナスタイムに得られるアクセス数の平均値ということなんだろうな。

今度から注目してみよう。

>>186 ありがとう。

188 名前:無名草子さん mailto:sage [2022/09/08(木) 08:05:33.51 .net]
漱石ばっかり読んでるオレ
全く進歩なし
それも猫ばっかり

189 名前:無名草子さん mailto:sage [2022/09/08(木) 08:28:30.95 .net]
タダで読めるとこでもなんか既読のばっかり読んじゃうってあるな…

190 名前:無名草子さん mailto:sage [2022/09/08(木) 11:17:59.17 .net]
青空文庫ブラウザで、既読の作品にはチェックマークがつけられるようなのあったら使いたい

自分はコンプリート欲が強いので、コンプ経過が目に見えるとうれしくなる



191 名前:無名草子さん mailto:sage [2022/09/08(木) 11:26:26.30 .net]
親譲りの無鉄砲な猫の夢を見た。

192 名前:無名草子さん mailto:sage [2022/09/08(木) 13:11:58.46 .net]
私はその人の事を先生とよんでいる

だったっけ?

193 名前:無名草子さん [2022/09/08(木) 23:35:26.97 .net]
aozorablog、初期の頃はアクセス分析以外にも色々書いてたんだね

194 名前:無名草子さん mailto:sage [2022/09/12(月) 21:25:36.52 .net]
(´・ω・`) アオゾラ ウンコ

195 名前:無名草子さん mailto:sage [2022/09/12(月) 22:10:12.82 .net]
(´・ω・`) アオゾラ チンコ

196 名前:無名草子さん mailto:sage [2022/09/12(月) 22:49:27.97 .net]
青空ウンコ・チンコ

197 名前:無名草子さん mailto:sage [2022/09/12(月) 23:40:27.44 .net]
無料

198 名前:無名草子さん [2022/09/13(火) 08:21:13.38 .net]
隙あらば山周、時々中宇でウケル(´・ω・`)

199 名前:無名草子さん [2022/09/13(火) 23:28:56.53 .net]
やっぱり校正者が出てくるのが強い

200 名前:無名草子さん [2022/09/14(水) 21:00:38.94 .net]
結局そこにかかってくる



201 名前:無名草子さん [[ここ壊れてます] .net]
1の壁…収録したい作品の著作権保護期間が満了している
(※原則として、個人は著作者の死後70年、無名/変名/団体名義は公表後70年。
 ただし、1967(昭和42)年12月31日以前に死亡/公表している場合は保護期間満了済み。
また、本文の著者だけでなく、編集や校訂、翻訳などをした人の没年も必要に応じて要確認)

2の壁…入力者が存在する

3の壁…校正者が登場する


1の壁も法改正のせいで最近高くなったし色々確認する必要があるんだけど、文章にすると滅茶苦茶シンプルな2と3の壁(特に3の壁)が高すぎるんだよな

俺も入力した作品がいくつ校正待ちのままになっているか……

202 名前:無名草子さん mailto:sage [2022/09/15(木) 04:21:08.31 .net]
今日も山周・・・(´・ω・`)

203 名前:無名草子さん [2022/09/15(木) 12:09:32.91 .net]
「嫌なら読むな」じゃなくて「嫌なら工作員になれ」だな

204 名前:無名草子さん [[ここ壊れてます] .net]
山本周五郎、公開作品数160で21位か(6作品が今月公開予定なので今月中に20位になる)
パブリックドメインになった時期が遅いことを考えるとやっぱり人気なんだろうな

青空文庫 公開中の作品数(作家別)一覧
https://yozora.main.jp/inp/klist1.html

205 名前:無名草子さん [2022/09/15(木) 22:39:04.26 .net]
2018年から4年足らずで160作品ということになるから毎年40作品以上公開されてるのか
山本周五郎の波を止めたいなら別の作家で年間40作品以上の作業をしなければならない

206 名前:無名草子さん [2022/09/15(木) 23:13:57.42 .net]
それは公開中の作品数だけの話だしな。

水面下(作業中)はそんなのメじゃない数の山周作品が進行している。

あれほどの数を作業進行中にできるかっていうとなかなか

207 名前:無名草子さん [2022/09/15(木) 23:16:29.96 .net]
実際のところ、青空文庫における山周ムーブメントには
富田倫生さんの遺志を残された者たちが継ぐ!という意識が関係していると思う?

208 名前:無名草子さん [2022/09/15(木) 23:27:25.58 .net]
山本周五郎の作品が公開された時に作品名でググると青空文庫公開前からアップロードされてる朗読動画とか出てくるし普通に人気なんだと思う

もっとも公開/作業中の作品の入力者や校正者を見ると数人が大量に作業してるっぽいから中にはそう考えて頑張ってる人もいるかもしれないけど

209 名前:無名草子さん [2022/09/15(木) 23:38:43.08 .net]
>>201
自分は校正やりたいマンなんだけど
このご時世も手伝ってなかなか申請が進まないでいる。

頑張るから待ってて。

210 名前:無名草子さん [2022/09/16(金) 00:08:01.31 .net]
青空文庫校正待ち作品検索(※何故かURLが貼れない)の原稿用紙換算の数字が1桁の作品を片っ端から校正すれば、少ない負担で山周ムーブメントに待ったをかけられるかもしれない



211 名前:無名草子さん mailto:sage [2022/09/16(金) 01:15:52.33 .net]
校正は公開に直結するのが魅力だね
他者の作業を見るわけだから勉強にもなるし

212 名前:無名草子さん mailto:sage [2022/09/16(金) 09:16:04.03 .net]
明日も山周・・・(´・ω・`)

213 名前:無名草子さん [2022/09/16(金) 12:30:08.25 .net]
入力者校正と点検を経てなお残る誤字って、要するに見落とされやすいということだから、今後自分が入力者校正する際に注意する指標が増やせる

214 名前:無名草子さん mailto:sage [2022/09/16(金) 12:34:24.86 .net]
20日も山周・・・(´・ω・`)

215 名前:無名草子さん [2022/09/16(金) 12:47:57.60 .net]
>>213
なるほど、我がふり直せ的な良い視点。

……とはいえ具体的には思い浮かばないな、
よくあるものでいえば注記漏れだろうか

216 名前:無名草子さん [2022/09/16(金) 19:04:03.27 .net]
経験則だと

・当用漢字の変換ミス(例:「游泳」が「遊泳」、「熔岩」が「溶岩」になってる)
・濁点と半濁点の間違い(例:「びっくり」が「ぴっくり」になってる)
・門構えの中(例:「時間」が「時問」や「時聞」になってる)

あたりがパッと思い付くかな
最後のはほぼ確実にOCRを介してる入力だろう

217 名前:無名草子さん [[ここ壊れてます] .net]
三連休でいくつか校正を終わらせたいなぁ

218 名前:無名草子さん mailto:sage [2022/09/17(土) 00:23:23.48 .net]
左翼爺の宮本百合子ちゃんラッシュは終わったね

219 名前:無名草子さん [2022/09/17(土) 00:37:25.82 .net]
短篇の入力1件終えたー
いつか校正者さまの降臨がありますように!

220 名前:無名草子さん mailto:sage [[ここ壊れてます] .net]
>>218
マイナーだけどプロレタリア系だと中野鈴子が大量校了してるから、そのうちラッシュ来るで



221 名前:無名草子さん [[ここ壊れてます] .net]
保守主義的な作品を入力してバランスを取るか(?)

222 名前:無名草子さん mailto:sage [2022/09/17(土) 02:22:52.99 .net]
作品の内容や著者でフィルターをかけることは青空文庫の趣旨にもとるわけだが、
あまりにもイデオロギー色が強く出過ぎた作品のラッシュが続くと
(保守、リベラルにかかわらず)
青空文庫自体がそういう思想団体と思われそうで、愉快ではない

223 名前:無名草子さん [2022/09/17(土) 02:29:09.25 .net]
だからこそ「著作権切れてるかどうかだけが判断基準なんだな」と思われるようにしなければならない(?)

まぁマジな話をすると興味の皆無な分野の作品にモチベーション沸く気がしないから申請しないけど

224 名前:無名草子さん mailto:sage [2022/09/17(土) 02:49:10.55 .net]
昔は芥川の比率が高すぎて芥川文庫とか呼ばれてたんだっけ

ワイの入力したマイナー作家も誰か大量校正しちくり~

225 名前:無名草子さん mailto:sage [2022/09/17(土) 08:35:21.11 .net]
隙あらば山周、時々中宇予報


2022-09-20 山本 周五郎『豹』
2022-09-21 中谷 宇吉郎『墨流しの物理的研究』
2022-09-22 山本 周五郎『蕗問答』
2022-09-24 山本 周五郎『溜息の部屋』
2022-09-27 山本 周五郎『城中の霜』
2022-09-29 山本 周五郎『柿』
2022-09-30 中谷 宇吉郎『墨並びに硯の物理学的研究』

226 名前:無名草子さん [2022/09/17(土) 09:12:19.88 .net]
校正したい作品がずっと校正待ち(点検前)になってる
どうしたら?

227 名前:無名草子さん mailto:sage [2022/09/17(土) 09:30:03.09 .net]
>>226
校正申請すれば点検してくれるよ
底本画像を送っとくと早い

228 名前:無名草子さん [2022/09/17(土) 11:19:27.49 .net]
校正待ち(点検前) : 790件 (内訳)
校正待ち(点検済み) : 1,959件 (内訳)

内訳見たら最近は減ってるっぽいが割とあるのね

229 名前:無名草子さん [2022/09/17(土) 13:50:56.62 .net]
校正申請があるその時その時に点検をしてると折角の校正が中々始められなくなる(その分公開も遅れる)というデメリットがあるんだろうけど
早い内に点検までしてくれたのに何年も校正待ちのままっていうのも悲しいね

230 名前:無名草子さん [2022/09/17(土) 14:50:56.39 .net]
>>224
作家名晒しちゃおう



231 名前:無名草子さん mailto:sage [2022/09/17(土) 16:18:41.75 .net]
宮本百合子はウヨサヨ関係なくすごい作家じゃないか?
佐多稲子のほうが上だとは思うが

232 名前:無名草子さん [2022/09/17(土) 21:29:58.10 .net]
ふと思ったけど、耕作員のフォーラムみたいなものって存在しないよね。

とくに青空文庫が出来た頃はインターネット黎明期で、
「ホームページ」に設置の掲示板でやり取りするのがスタンダードだった時代

少数精鋭ではじめた当時にはそういうものがあったのかあるいは無かったのか知らないけれど、
どうして無いのだろう?と思った。

それなりに大きい組織の統制のためだろうか?

233 名前:無名草子さん [2022/09/17(土) 21:32:31.03 .net]
たとえば
点検グループでない者が私見で指導したり可否を談じたりすることがないように、
相談事の生じるであろう場は作らないとかの。

234 名前:無名草子さん [2022/09/17(土) 21:57:18.14 .net]
青空文庫の掲示板や情報交換フォーラムは「みずたまり」とか「よぞら」とか「こもれび」とか「むしとりあみ」とか「AOZORAX」とか色々あったんですよ……

235 名前:無名草子さん mailto:sage [2022/09/17(土) 22:17:09.52 .net]
なんでなくなったの?

236 名前:無名草子さん [2022/09/17(土) 22:42:27.42 .net]
その疑問こそが答えでは

237 名前:無名草子さん mailto:sage [2022/09/17(土) 22:50:59.58 .net]
aozorahack に参加したいなんて思ってたけど
github も動いてないしどうしたものか。

前にも言ったことあるけど青空文庫のテキストを
sjisからutf8とかにすると使える漢字が増えて
注釈を減らせるしホームページにそのまま載せれるし
メリットが大きい(と思う)。

移行しない理由が作業が大変ってだけなら
一発変換のスクリプトとか提供できるのに。

238 名前:無名草子さん [2022/09/18(日) 00:10:45.48 .net]
>>236
よくわからんが、

「自治厨が、私見で間違った指導」
「運営を差し置いた相談事とその決定」
「フォーラム乱立によるローカルルールの発生、ひいては作業ルールに対する解釈のブレ」

そして
「そうしたトラブルや不都合を防ぐためには、点検グループの中の人のように公式な管理者を常駐させる必要がある」→肝心の点検作業に差し支えるようになる

といったような解釈で良いのかな?

昔はそんなにあったんだね……フォーラム。
それがどれも存続してないという結果が全てな感じがする。

239 名前:無名草子さん [2022/09/18(日) 00:12:19.95 .net]
>>237
すごい

240 名前:無名草子さん [2022/09/18(日) 00:44:14.59 .net]
昔のそらもよう調べたら掲示板とかについても触れてるよ



241 名前:無名草子さん [2022/09/18(日) 01:34:03.40 .net]
それが答えって知名度的な意味?

242 名前:無名草子さん [2022/09/18(日) 08:49:05.19 .net]
>>237
一括置換で済めばいいけど、底本尊重だから、これまで包括判定していた漢字を底本に戻って確認しなきゃならないみたいな文を読んだ気がする

243 名前:無名草子さん mailto:sage [2022/09/18(日) 09:47:16.13 .net]
なるほどなあ。

であればこそ、いまの「空白の(著作権消滅待ちの)20年」の間に
utf8化に向けてできることがありそうな気がするが……

包摂文字をマークアップするプログラム組んで、
底本再確認の負担を減らせないかとか……

まあ、言うは易しなのだろうな

244 名前:237 mailto:sage [2022/09/18(日) 11:30:03.80 .net]
ruby を使ったスクリプトで半年ほど前に作りました
バッチファイル自体は三十数行の短いものです
いくつか課題があったはずですが詳しくは忘れました

・文字をsjisからutf8に変換する
・ユニコードのコード表と注記の番号を照合し取り込み可能な漢字を取り込む
・バッチファイルをダブルクリックすると処理を開始
・バッチファイルのあるフォルダ以下のテキストファイルを加工し、バックアップをとる
というものです。以下に置いてあるので興味のある方は試して見て下さい

ttp://pansy.s1010.xrea.com/2022/03/05/sjis%e3%81%8b%e3%82%89utf8%e3%81%ab%e5%a4%89%e6%8f%9b/

245 名前:無名草子さん mailto:sage [2022/09/18(日) 11:52:35.79 .net]
いっそウィキソースとかに置いたほうがいいのかもな

246 名前:無名草子さん mailto:sage [2022/09/18(日) 13:07:32.39 .net]
「えあ草紙」や「ソラリ」みたいに外字注記を自動でUnicodeに置き換えてくれるアプリがすでにあるよね。
個人的にはそれで充分だから青空文庫本体の元データまでUnicodeに移行すべきとは思わないな。

247 名前:無名草子さん [2022/09/19(月) 11:53:35.55 .net]
>>244
すごい

aozorahackはいま稼動していないのか

248 名前:無名草子さん [2022/09/19(月) 16:21:01.92 .net]
aozorahackって経常的に活動してるの?

249 名前:無名草子さん [2022/09/20(火) 18:21:31.81 .net]
藤沢周平が青空文庫に登場するまで長生きしたい。

250 名前:無名草子さん mailto:sage [2022/09/20(火) 18:29:40.44 .net]
立川市図書館が日本トップレベルの電子図書館に!東京立川こぶしロータリークラブが青空文庫500タイトル・電子伊能図を寄贈、市内の小中学生を対象にレビュワー大賞も開催!|東京立川こぶしロータリークラブのプレスリリース
https://prtimes.jp/main/html/rd/p/000000002.000011282.html



251 名前:無名草子さん mailto:sage [2022/09/20(火) 18:40:44.29 .net]
柳田国男の炭焼日記とか戦争中に書いていた日記を追加してくれ
ぜひとも読んでみたい

252 名前:無名草子さん mailto:sage [2022/09/20(火) 20:20:55.96 .net]
>>251
入力したら校正担当してくれるって事か?

253 名前:無名草子さん mailto:sage [2022/09/21(水) 21:19:16.65 .net]
Twitterで「#青空特務司書」や「#広がれ特務司書工作員の輪」の工作員交流用ハッシュタグがあるけど余り使われてないね

254 名前:無名草子さん mailto:sage [2022/09/21(水) 21:43:54.62 .net]
>>251
古川ロッパの日記が校正待ちになってるなぁ

255 名前:無名草子さん [2022/09/22(木) 07:28:45.47 .net]
>>253
文アル齧ってるけどなかなか交流はし辛い

256 名前:無名草子さん mailto:sage [2022/09/22(木) 08:59:11.96 .net]
がっきぅう うんこ
てやったよな?

257 名前:無名草子さん mailto:sage [2022/09/22(木) 09:21:00.88 .net]
ガッキーうんこなんて暴言は許せん

258 名前:無名草子さん [2022/09/22(木) 11:39:32.00 .net]
>>255
文アル知らないけど、特務司書の名を借りてるだけで文アル関係なさそうじゃない?

まあ見つけにくいタグではあるよなぁ、耕作員用のタグないかな?と思った人が見つけられる名前ではないな。

校正依頼PRもできて、上手く使えば便利そうなのに

259 名前:無名草子さん mailto:sage [2022/09/22(木) 18:10:59.29 .net]
稲垣足穂が1冊も登録されてないように見えるんだけど
この方の小説ものすごく良いのにもったいない

260 名前:無名草子さん [2022/09/22(木) 18:55:49.35 .net]
入力しろ定期



261 名前:無名草子さん mailto:sage [[ここ壊れてます] .net]
入力しても良いんですか?
そのための小説を僕にください
まさかここ10年で小説がこんな高騰するなんて思わなくて
断捨離してほぼ全て捨てたんだよ
なんで1200円とかするのよ

262 名前:無名草子さん [2022/09/22(木) 20:06:01.03 .net]
没後50年すら経ってない作家なのか
ひとつも登録がないとかあたりまえの話じゃないか
出直して来い

263 名前:無名草子さん [2022/09/22(木) 20:07:26.43 .net]
半年ROMれ

264 名前:無名草子さん mailto:sage [2022/09/22(木) 20:08:15.64 .net]
1977年10月25日没って改正前ですら2023年1月1日からじゃん

265 名前:無名草子さん mailto:sage [2022/09/22(木) 20:09:09.04 .net]
>>264
2023年じゃなくて2028年だわ

266 名前:無名草子さん [2022/09/22(木) 20:10:40.76 .net]
それな

青空文庫を、乞食の巣窟にはしたくないものだ

267 名前:無名草子さん mailto:sage [2022/09/22(木) 21:15:58.87 .net]
>>265
そうだったか
皆ありがとう
一千一秒物語好きだから注文した

268 名前:無名草子さん mailto:sage [2022/09/22(木) 21:33:29.98 .net]
著作権切れの官能小説って無いん?
広義でじゃなくて、もうひたすら抜け!って感じの

269 名前:無名草子さん mailto:sage [2022/09/22(木) 21:47:08.42 .net]
墨東綺譚がそんな感じかと思ってたのに期待してたのと違った

270 名前:無名草子さん mailto:sage [2022/09/22(木) 22:39:23.58 .net]
Wikipediaの官能小説のページには

>近代的な小説のジャンルとして、読者の性欲を刺激することを目的に据え、性愛を描いた作品は明治時代から存在した。

とあるけど具体的な作品名は殆んど出されてない



271 名前:無名草子さん [2022/09/22(木) 22:55:02.05 .net]
別に著作権保護期間が法改正で70年に延長されたの知らなくてもいいよ
それこそ知的財産権に関わらないなら何年間かも知らなくても別にいいよ
でも青空文庫にあるかどうか確認するならせめて自分で調べようよ

272 名前:無名草子さん mailto:sage [2022/09/22(木) 23:14:48.14 .net]
>>271
それらしいレスだが既に終わった話題を蒸し返すのはださい

273 名前:無名草子さん [2022/09/22(木) 23:18:04.59 .net]
戦中戦後の作品なら
××を×って××××たり×××××××
みたいな伏せ字で妄想がはかどるぞ。

274 名前:無名草子さん mailto:sage [2022/09/22(木) 23:26:55.26 .net]
NDLのデジコレをそれらしい単語で検索すると性生活や性教育についての本は山ほど出てくるね
カストリ雑誌なんかもかなりあけすけなものも載ってるな

275 名前:無名草子さん mailto:sage [2022/09/24(土) 06:59:02.31 .net]
稲垣足穂はないけど、
「一千一秒物語」の序文(佐藤春夫)は校正待ちになってるよ。

276 名前:無名草子さん [2022/09/24(土) 16:33:34.90 .net]
底本に明らかなへんな誤字みつけると、ママ注記にするか、訂正の上「底本では」注記にするかで悩む。

277 名前:無名草子さん [2022/09/24(土) 16:45:59.22 .net]
>>276
>青空文庫での入力校正作業は、原稿の誤りをただす「校閲」でも、最善と思われる本文を編集する「校訂」でもありません。
>つい底本の全文を初出や親本と突き合わせてみたくなる気持ちも、テキストに対する積極的な愛情のひとつではあります。
>とはいえ作業の上では、別底本が参照できて客観的に訂正可能なもののみを誤植注記し、辞書や用例等に鑑みて疑わしいと思われるだけのときは、ママ注記にとどめてください。

青空文庫編 青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

278 名前:無名草子さん mailto:sage [2022/09/24(土) 16:54:36.28 .net]
ありがとう。
FAQ、耕作員になったときに目を通したはずだが、
実際の作業をいくつも経験してから改めて読むと、深いな。

279 名前:無名草子さん mailto:sage [2022/09/24(土) 17:38:38.00 .net]

皆協力する姿勢に感動した
俺もそのうち工作員になりたい
しかし工作員ってイメージ悪いなw

280 名前:無名草子さん [2022/09/24(土) 19:56:56.65 .net]
「耕作員」もあるよ



281 名前:無名草子さん [2022/09/24(土) 22:21:44.03 .net]
佐藤春夫と幸田露伴ってどっちが日中の古典に造詣が深かったのですか?

282 名前:無名草子さん mailto:sage [2022/09/25(日) 22:44:51.33 .net]
も~山本周五郎ばっかりじゃん!!!
山本周五郎死ね!!!!

283 名前:無名草子さん mailto:sage [2022/09/25(日) 23:42:00.71 .net]
お前が死んだことにして工作員に生まれ変わるんやで

284 名前:無名草子さん mailto:sage [2022/09/25(日) 23:52:49.33 .net]
>>267
一応買いなおした証明どうぞ
一番気に入ってる方だけ買ったけど
今は3部作というくくりになってるらしくて他も気になってきあ
https://i.imgur.com/9meVydG.jpg

285 名前:無名草子さん mailto:sage [2022/09/25(日) 23:59:07.48 .net]
>>284
すまんちゃ
はりなおし
https://i.imgur.com/93G5f49.jpg
久々に文庫本読んでるけれどスマホの画面になれてると文字が小さいしページ中央辺りが読みづらくて辛い
昔はこんなのを朝から晩まで熱中して読んでたんだな

286 名前:無名草子さん mailto:sage [2022/09/26(月) 00:01:34.25 .net]
今のうちに予言しておくと’22/08月-’22/09月の月間アクセス増率分析では知里幸恵が躍進。
「100分de名著」で「アイヌ神謡集」が取り上げられた効果が見られるでしょう。

287 名前:無名草子さん [[ここ壊れてます] .net]
>>282 もう死んでるww

288 名前:無名草子さん mailto:sage [2022/09/26(月) 02:23:35.52 .net]
山本周五郎は2度死ぬ!

289 名前:無名草子さん mailto:sage [2022/09/26(月) 03:45:42.05 .net]
工作員に転生させられた。が、そこは青空文庫のない異世界だった。続く...

290 名前:無名草子さん mailto:sage [2022/09/26(月) 04:50:57.83 .net]
青空文庫好きの下剋上!



291 名前:無名草子さん mailto:sage [2022/09/26(月) 12:48:07.89 .net]
>>290
それストーリーが全く予想できません

292 名前:無名草子さん mailto:sage [2022/09/26(月) 13:09:17.44 .net]
工作員に転生って背乗りとかの話じゃないのか
いや青空文庫で入力校正作業するのに戸籍の偽造をする必要は当然ないけど……

293 名前:無名草子さん mailto:sage [2022/09/26(月) 19:07:47.87 .net]
私は青空文庫の工作員。
北の黒電話のお陰で嫌な印象が付いたけれど言葉だけれどパンチドランカーの私にはとても誇らしい名称です。
パンチドランカーというのはボクシングじゃなくて保護期間が切れた小説を入力公開する人の二つ名です。
なんせ青空文庫の8割は私が入力したんだから。
私は地震で倒れてきた書棚の下敷きとなり呆気なく異世界転生。
転生先はとても貧しい家族の末娘。
私の異世界青空文庫ビブリアファンタジーの始まりだ。

こんな感じ?

294 名前:無名草子さん [2022/09/26(月) 19:13:20.35 .net]
↑「著作権存続中」で登録申請してください

295 名前:無名草子さん mailto:sage [2022/09/26(月) 19:18:08.64 .net]
>>294
いやいやまってよ
異世界だと日本の著作権関係ないから
あとビブリアファンタジーってのが何なのか分からん
ビブリアってなに?

296 名前:無名草子さん [[ここ壊れてます] .net]
ギリシャ語で本(複数形)、ラテン語で聖書

『ビブリア古書堂の事件手帖』を御存知でない?

297 名前:無名草子さん [[ここ壊れてます] .net]
>>281
どういう指標で優劣つけるの?

298 名前:無名草子さん mailto:sage [[ここ壊れてます] .net]
>>296
ありゃーした
タイトルだけは知ってる
そうかスコップとシャベルみたいなもんか

299 名前:無名草子さん [2022/09/27(火) 05:38:39.48 .net]
高見順は最近解禁だからあんまり作品数ない感じ?
なんか過小評価されてねえかい。左翼転向組だからかな
あと武田麟太郎は戦前めちゃくちゃ人気だったし46年没だからどんどん追加して

300 名前:無名草子さん mailto:sage [2022/09/27(火) 06:36:47.17 .net]
没後50年なら椎名麟三とか来年来たはずなのにな
TTPだかTPPだかPPTだか知らんが死ね!



301 名前:無名草子さん [2022/09/27(火) 08:02:30.02 .net]
>>299
校正待ちが待ってるよ

302 名前:無名草子さん mailto:sage [2022/09/27(火) 18:42:59.10 .net]
> TTP
知らん
> TPP
ターボパスカル
> PPT
パワーポイント

303 名前:無名草子さん [2022/09/27(火) 20:13:36.92 .net]
TPP11よりも日欧EPAの方が……

304 名前:無名草子さん mailto:sage [2022/09/29(木) 16:07:46.82 .net]
>>268
四畳半襖の下張り

305 名前:無名草子さん [2022/09/29(木) 23:33:50.88 .net]
「某のアレを入力したいけどこの御時世だと顰蹙を買いそう……」と思ってしまう

306 名前:無名草子さん [2022/09/30(金) 12:38:01.00 .net]
著作権切れてるか切れてないか以外の基準なんて設けるだけ無駄
公開も作業もされてないから入力する、校正待ちだから校正する

もちろん全部やるのは不可能なので底本が入手出来るかどうかとか分量とか好みとか作者との縁(同じ出身地とか)による取捨選別はあるけどね

307 名前:2022年10月公開予定作品一覧 [2022/09/30(金) 18:10:12.09 .net]
2022-10-01 山本 周五郎『入婿十万両』
2022-10-02 佐藤 春夫『二つの愛国型』
2022-10-03 山本 周五郎『暗がりの乙松』
2022-10-04 ホワイト フレッド・M『ドレントン・デン特派員の冒険 04 第四回 灰』
2022-10-05 山本 周五郎『正体』
2022-10-06 坂口 安吾『「大国主命」』
2022-10-07 作者不詳『現代語訳 平家物語 10 第十巻』
2022-10-08 山本 鼎『「槐多の歌へる」序』※命日、作品初公開
2022-10-09 山本 周五郎『蛮人』
2022-10-10 中谷 宇吉郎『無知』
2022-10-11 岡本 一平『怪物取組画譜 出羽ヶ嶽その日その日』※命日
2022-10-11 片山 敏彦『暗い時間に』※命日
2022-10-12 浅沼 稲次郎『休養を取る日を』※命日
2022-10-13 山本 周五郎『松風の門』
2022-10-14 正岡 子規『牡丹句録 子規病中記』※誕生日
2022-10-15 岡本 綺堂『河鹿』※誕生日(旧暦)
2022-10-15 木下 杢太郎『伊豆伊東』※命日
2022-10-16 山本 周五郎『嫁取り二代記』

308 名前:2022年10月公開予定作品一覧 [2022/09/30(金) 18:10:45.15 .net]
2022-10-17 柳田 国男『産婆を意味する方言』
2022-10-18 尾崎 士郎『風蕭々』
2022-10-19 山本 周五郎『あすなろう』
2022-10-20 九条 武子『六甲山上の夏』※誕生日、初公開
2022-10-20 坂口 安吾『私の探偵小説』※誕生日
2022-10-21 江戸川 乱歩『暗黒星』※誕生日
2022-10-21 尾崎 士郎『早稲田大学』※早稲田大学創立記念日
2022-10-22 坂口 安吾『神童でなかったラムボオの詩 中原中也訳『学校時代の詩』に就て』※中原中也命日
2022-10-23 山本 周五郎『榎物語』
2022-10-24 中谷 宇吉郎『紙の行方』
2022-10-25 原 杞憂『追悼記』
2022-10-25 原 民喜『追悼記』
2022-10-26 山本 周五郎『改訂御定法』
2022-10-27 尾崎 士郎『叛骨・中野正剛 ――主観的な覚え書き』※中野正剛命日
2022-10-27 木下 夕爾『夜学生』※誕生日
2022-10-28 正宗 白鳥『ペンクラブと芸術院』※命日
2022-10-29 山本 周五郎『源蔵ヶ原』
2022-10-30 永井 荷風『心づくし』
2022-10-31 ポリドリ ジョン・ウィリアム『吸血鬼』

309 名前:無名草子さん mailto:sage [2022/09/30(金) 18:53:13.37 .net]
>>305
某のアレってどれだろう

310 名前:無名草子さん [2022/09/30(金) 19:18:36.07 .net]
単純に時代錯誤な作品というだけならいくらでもあるだろうけど
「この御時世」がもっと狭い期間を指すなら山口二矢の供述調書あたりかな



311 名前:無名草子さん [2022/09/30(金) 19:27:58.38 .net]
来月の公開作品に浅沼稲次郎いるじゃん

312 名前:無名草子さん mailto:sage [2022/09/30(金) 20:45:59.62 .net]
ハロウィンに「吸血鬼」公開はなるほどと思った

313 名前:無名草子さん mailto:sage [2022/09/30(金) 21:02:23.10 .net]
>>312
どの吸血鬼なんだろう

314 名前:無名草子さん [2022/09/30(金) 21:09:39.24 .net]
>>313
「どの」も何もジョン・ポリドリの『吸血鬼』って複数あるの?

吸血鬼 (ポリドリ) - Wikipedia
https://ja.wikipedia.org/wiki/%E5%90%B8%E8%A1%80%E9%AC%BC_(%E3%83%9D%E3%83%AA%E3%83%89%E3%83%AA)

315 名前:無名草子さん mailto:sage [2022/09/30(金) 21:22:55.99 .net]
>>314
いあ、タイトルだけだからドレかわからなかったのよ
んで見てきた
ぱっと見て失業中に見えた
目薬刺してくる
https://www.aozora.gr.jp/index_pages/person2039.html

316 名前:無名草子さん [2022/09/30(金) 21:29:22.49 .net]
ちょっと上にめっちゃ大ヒントあるやん……

と思ったが最近来た人なら1ヶ月分の公開予定作品の一覧が前月末に定期保守代わりとして書き込まれるのは知らないか

317 名前:無名草子さん [2022/09/30(金) 22:56:36.90 .net]
入力申請しようかどうか迷ってると他の人に入力はおろか校正まで済まされて公開まで話が進んでしまう(※もちろん良いことではある)
その一方で同じ程度の知名度があるはずの作品を入力したらしたで何故か校正待ちの状態が長く続いてしまう

なんでだろ~なんでだろ~

318 名前:無名草子さん mailto:sage [2022/09/30(金) 23:49:20.04 .net]
>>316
別だけど長文は自動的にあぼーんしてるので最初から見てない俺がいる
青空文庫スレは落ち着いてるのですが
他のスレが危なくてこういう設定入ってるやつもいると頭の片隅にでも入れておいてもらえると嬉しいです

319 名前:無名草子さん [2022/09/30(金) 23:57:45.75 .net]
既に組んだことのある人がいたら
その人の癖や作業の信頼度が分かっているから
自然とそういう相手(の入力テキスト)を選んでしまうということはあるんだろうか

「この方とこの方のペア、よく見かける気がする」というのがある

だとすれば、作品そのものや申請タイミングなどの要素よりも、
属人的要素によりそのマーフィーの法則的なのが発動している可能性あり

320 名前:無名草子さん [2022/09/30(金) 23:59:49.63 .net]
>>318
それはあくまでもあなたの嗜好から来る選択(都合)であって
合理的とはいえない

皆に配慮を求めることではない



321 名前:無名草子さん [2022/10/01(土) 00:06:07.98 .net]
むしろ意図的に見てない書き込みがあるなら話の流れがありそうな時くらい確認しそうだが

322 名前:無名草子さん [2022/10/01(土) 00:16:59.70 .net]
>>319
大前提としてアクティブユーザーが少ないから常連で組んでる印象が強くなるのでは?

文アル文スト経由で工作員になった人達は特定の作家の作業で固まってるかもしれないけど

323 名前:無名草子さん mailto:sage [2022/10/01(土) 00:27:23.66 .net]
>>320
他人に配慮しろなんて一切書かれてないので過剰反応するな
落ち着け
自分自身が馬鹿だというレスはいくらでもしてよいが
他人へのヘイトレスは控えようぜ

324 名前:無名草子さん [2022/10/01(土) 00:36:30.59 .net]
他人をヘイトはしていないし
そんな言葉を使ってはいないから
あなたこそ落ち着いて読んでくれ

なにかを頭の片隅に置いてほしいということは
それを踏まえて考えてくれということ

それを配慮を求めると言わなかったらなんだと言うのかなあ


「こういう環境で見ている人は、気づけないこともある」
という事実だけが提示されてれば、そういうこともあるのかーと思うだけだったが

それを身体的理由でもないのに
自分の勝手で見ないようにしているものを
頭の隅に置いてくれと言われても、
それはいかがなものですか?
と感じたにすぎない

325 名前:無名草子さん mailto:sage [2022/10/01(土) 00:43:25.27 .net]
触れたらダメっぽい

326 名前:無名草子さん mailto:sage [2022/10/01(土) 00:56:07.42 .net]
>>322
文アル文ストから耕作員ってコース、あるんだ?

文アル文ストから文豪本人に興味を持つまではありかもなと思ってたが
実際問題、世界観はまるで別物だし
そこまでのめり込めないかと思ってた

327 名前:無名草子さん mailto:sage [2022/10/01(土) 01:46:17.95 .net]
文ストは知らないけど文アルから工作員は結構いると思う、というか、以前はもっといた
何人か要領のいい人がいて、いろんな作家の入力校正をやっていたから
少し前までは今よりも誕生日とか命日の公開が充実していた気がする
最近は動きがないみたいだけど……

328 名前:無名草子さん mailto:sage [2022/10/01(土) 02:04:23.82 .net]
自分は入力も校正もやる方だけど、自分の入力作品を校正してくれた人の入力作品を
お返しの気持ちで校正することは確かにある(※お互い面識はない)
ただし手を出すのは興味のある作家・作品だけですね
知らない作家の校正はミスしそうで、ハードルが高く感じる

329 名前:無名草子さん [2022/10/01(土) 02:13:49.94 .net]
>>326
文ストか文アルかは知らんが佐藤春夫あたりはその辺のファンが布教活動の一環で作業してるのが如実に現れてると思う

330 名前:無名草子さん [2022/10/01(土) 02:20:46.79 .net]
むしろ少なくとも第一印象では著者にも内容にも興味ないくらいの方が「いつもの感じだろうと何となく読んでしまう」ということが起こらないので間違いを見つけやすい気がする



331 名前:無名草子さん mailto:sage [2022/10/01(土) 11:30:08.04 .net]
文スト文アル関係者で一番貢献してたのは、花袋の校正を黙々と片づけてくれてた人たちだと思う
(本人に直接確認したわけではないから関係者というのは推測だけど)
春夫は……まあ声が大きい工作員がいるな、とは思う……

332 名前:無名草子さん mailto:sage [2022/10/01(土) 11:37:43.75 .net]
知らない作家の入力校正をすると、たとえば「一見して誤記っぽいけどその作家ではよく見られる表現」みたいなものに
気づかず誤記注記とかママ注記とかをつけてしまって、後の作業をする人に迷惑をかけたりするから
まあ作家の知識はあるに越したことはない

333 名前:無名草子さん mailto:sage [2022/10/01(土) 13:07:14.34 .net]
>>331
花袋、そうなんだ

自分はキャラ設定画くらいしか知らんのだけど
ほかの文豪の格好よさに比べて
蒲団キャラはあんまりにもあんまりじゃないかwwと思っていたので
何か安心したw

334 名前:無名草子さん mailto:sage [2022/10/01(土) 13:09:17.90 .net]
ワイの入力してるマイナー作家もイケメン擬人化しないかな

335 名前:無名草子さん mailto:sage [2022/10/01(土) 13:12:48.18 .net]
何きっかけだろうと何年かかろうと
最後までやりきれるならどんな人でも嬉しい

336 名前:無名草子さん mailto:sage [2022/10/01(土) 18:59:48.11 .net]
10月も隙あらば山周なんだな・・・
中宇が減ったな

337 名前:無名草子さん [2022/10/01(土) 19:23:22.56 .net]
隙を見せてるのは山本周五郎作品の作業してる方じゃなくて他の作家の作品の作業をしてない方

338 名前:無名草子さん mailto:sage [2022/10/01(土) 19:27:27.26 .net]
著作権切れしていて作業未定の作者名と作品名一覧とかあるのだろうか
参加出来るようなの有ればと思うんだが

339 名前:無名草子さん mailto:sage [2022/10/01(土) 19:32:02.80 .net]
>>338
作者の一覧はあるけど(青空文庫のトップページから見られたはず)
さすがに作品名はないから各自お調べヨロってところじゃないかな?

340 名前:無名草子さん mailto:sage [2022/10/01(土) 19:41:20.55 .net]
アクティブ耕作員さんはそんなに少ないのだろうか?

yozoraで見られる作業状況(最近4週間の動き)を見るとたしかに
耕作員名が限られた常連だけにしか見えないけれど、

入力テキストや校正テキストが点検済みや校了になる時の日付が
点検チームに送ったメールの日付になることをあわせて考えると、
点検済みや校了に進んでも「最近の動き」に載らないものの方がたぶん多い思うんだ

常連さんのは品質が安定していて点検も早くすむだろうから、「最近の動き」に載りやすいというか



341 名前:無名草子さん mailto:sage [2022/10/01(土) 19:46:54.64 .net]
>>338
青空文庫の「登録全作家インデックス」なら「公開中:0、作業中:0」が載ってる
具体的な作品一覧はない(Wikipediaやコトバンクを調べたら載ってるかも)
https://www.aozora.gr.jp/index_pages/index_all.html

校正だけでいいなら「青空文庫校正待ち作品検索」がある
ここのURLは何が引っかかってるか分からないけど何故か書き込めない

「死せる作家の会」は没年別に作家の生没年と一部の作品名が載ってるが青空文庫との直接的なリンクはしてない
ちなみに2004年で更新が止まってる
www.jca.apc.org/~earthian/aozora/dead.html

あとWikipediaには没年カテゴリがあるので1967年以前の没年カテゴリをちまちま調べたら良い作家に巡り会えるかもしれない
例:Category:1967年没
https://ja.wikipedia.org/wiki/Category:1967%E5%B9%B4%E6%B2%A1

342 名前:無名草子さん [2022/10/01(土) 20:03:21.88 .net]
今月の公開作品でいえば
山本周五郎は10作品公開に3人が関わってる
(※1つは法人名義なので複数人いるかもしれないが)
尾崎士郎は4作品公開に5人が関わってる
坂口安吾は3作品公開に4人が関わってる

入力者と校正者さえ見つかればいくらでも作品が公開されるというだけのこと

343 名前:無名草子さん mailto:sage [2022/10/01(土) 21:21:35.01 .net]
>点検済みや校了に進んでも「最近の動き」に載らないものの方がたぶん多い

受け取り報告メール、どれくらい来なかったら問い合わせする?
それとも問い合わせはいっさいしない?
点検が忙しいのだろうことは想像に難くないし、催促するつもりもまったくない
けれど、ファイルが届いてないのでは(または見逃されてしまったのでは)と心配になること、ない?

344 名前:無名草子さん mailto:sage [2022/10/01(土) 21:58:06.42 .net]
>>343
>受付の確認やファイルの点検について

>入力ファイル受領時、校正ファイル送付時の「点検作業」は、少数の点検チーム(ボランティア)によって担われています。
>作業待ちのタスクが重なっている場合、返信や送付・確認にしばらく時間がかかることがあります。こちらも気長にお待ちください。

作業着手連絡システム
https://reception.aozora.gr.jp/


俺も8月末に入力ファイルをいくつか送って1ヶ月くらい待ってる
Gmailで送ったのもあるから1ヶ月超えると受理されてないかもという心配も出てくるけど
別に校正者確保したわけでもないし残りの作業中作品を送る際にも受領メールが届いてなかったら確認すればいいかなって思ってる

345 名前:無名草子さん mailto:sage [2022/10/01(土) 22:00:34.70 .net]
一ヶ月くらい確認メール遅れるのはざらって大久保さんもツイートしてたな

346 名前:無名草子さん [2022/10/01(土) 22:02:31.12 .net]
最近の動きに載らなくても舞台裏には載るから、それで大体の動き(今は●月提出の辺り処理してくれてるんだなとか)はわかるので、問い合わせたことはないな
半年音沙汰なかったら、次の提出の時にでも軽く訊くかも

347 名前:無名草子さん mailto:sage [2022/10/01(土) 22:03:56.65 .net]
>>339
反応早っ
以降の皆さんも有難う

>>342 さんも
んー作者名分かれば検索に突っ込んで作品名探せばいいしな
ぼちぼち見て行きます

山本周五郎繋がりですが「殺生谷の鬼火」で表示されない文字があるようにみえるのですが
これはandroidビューアー側の問題かな
読書尚友Freeという青空文庫ビューアーだと「……」のような表示になるのです
例えば以下のように「…」で出てきます
怨霊の呻声、鬼火、……立派な道具立てだ、

これはFONT問題とかビューアー側の問題なんだろうか?
分かりづらかったらすまん

348 名前:無名草子さん mailto:sage [2022/10/01(土) 22:06:27.15 .net]
舞台裏なんてあるんだ。知らなかった

349 名前:無名草子さん mailto:sage [2022/10/01(土) 22:18:07.24 .net]
点検グループって何人くらいいるんだろう。入力校正とは違う苦労がかなりあるんだろうな。

350 名前:無名草子さん mailto:sage [2022/10/01(土) 22:35:05.14 .net]
>>347
『殺生谷の鬼火』の話がよく分からん
ブラウザで見てもテキストファイルで見ても三点リーダーだし
「・・・」っぽく見えるか「...」っぽく見えるか、みたいな話?



351 名前:無名草子さん mailto:sage [2022/10/01(土) 22:48:14.68 .net]
>>349
私の知る限りすくなくとも5名はおられる。

352 名前:無名草子さん [2022/10/01(土) 22:54:02.86 .net]
↑何かへんな書き方になってしまった
以前、ここだったかおーぷんだったかで
中の人はふたりくらいしかいないのではないか(二人としかやり取りしたことがない)というレスを見たことがあったから

それよりは多いよ、という意味であって、すくなくとも五人もいるのだから十分だという意味ではないよ

ほんとうはまだほかにもいらっしゃると思うし
こなす作業量と苦労の数々からしたら少数精鋭の極み、とても大変だと思う

353 名前:無名草子さん mailto:sage [2022/10/01(土) 22:55:33.61 .net]
sage忘れた……

354 名前:無名草子さん mailto:sage [2022/10/01(土) 23:07:06.88 .net]
>>350
ありがと
テキストビューアーはうっかり忘れてました
見てきます

355 名前:無名草子さん mailto:sage [2022/10/01(土) 23:34:49.79 .net]
殺生谷の鬼火 山本周五郎
確認しましたが元テキストから三点多用されていたようです
お騒がせしました
https://www.aozora.gr.jp/cards/001869/files/59102_76053.html

356 名前:無名草子さん mailto:sage [2022/10/02(日) 00:10:53.85 .net]
この間の「新文化」の記事には「現在の運営メンバーは6、7人」と記載があります。

357 名前:無名草子さん mailto:sage [2022/10/02(日) 02:48:04.19 .net]
>>356
そういえば>>137で気になってたのに買うのすっかり忘れてたわ
ファミマでプリントしてきた
サンクス

358 名前:無名草子さん mailto:sage [2022/10/02(日) 14:58:22.70 .net]
( ^ω^)あ~お~ぞ~ら う~ん~ ?

359 名前:無名草子さん mailto:sage [2022/10/02(日) 15:48:21.83 .net]
連絡遅いのはしょうがないからどうでもいいけど、連絡来ないと次の入力や校正の申請していいかどうか分からないのよね
連絡来ない状況で新規に申請したところで受付の負担を増やすだけなんだけど

360 名前:無名草子さん mailto:sage [2022/10/02(日) 16:50:52.86 .net]
だいたい青空文庫の話題が出るときって「青空文庫で読めるおすすめ作品!」みたいなのが多いのにここだけは工作員多くてなんか面白い



361 名前:無名草子さん mailto:sage [2022/10/02(日) 18:33:51.76 .net]
ネット掲示板見るかどうかとか抜きに対象者が少なすぎるので、長期間書き込みがなくても落ちないスレくらいしか作業関連の相談や雑談が出来る場所がないんですわ

Twitterとかでもいいんだけど、名前が出た状態で交流しようとすると
「(青空文庫関係かどうかに関わらず)相談に乗ってもらったから、恩返し代わりにこの人の校正やった方がいいかな」
みたいな気遣いも出ちゃって交流が密にならない懸念もある

362 名前:無名草子さん [2022/10/02(日) 21:20:30.82 .net]
>>359
自分はいつも完了前に次の校正申請と底本画像送ってるな
入力は断られたり被ったりしそうもない作品しかやらないから、申請前に着手することもある
作業できる余裕があるときに、待ちの期間をなるべく作りたくないもんで

363 名前:無名草子さん mailto:sage [2022/10/02(日) 21:51:07.82 .net]
>>362
ワイも

作業はじめた後で断られることがあるとしても
ルール違反をしているのは自分だから
自業自得と割り切ってる

ワイも申請するのは(作業人気度的には)マイナー作家だから
実際断られたことはないですが

364 名前:無名草子さん mailto:sage [2022/10/02(日) 21:53:02.43 .net]
>>358


365 名前:無名草子さん mailto:sage [2022/10/02(日) 22:11:29.07 .net]
入力申請が被るのは分からないでもないけど、それと別枠で断られることってあるの?

366 名前:無名草子さん mailto:sage [2022/10/02(日) 22:21:33.85 .net]
>>362,363
ロシアンルーレットしてる様でドキドキしますね

367 名前:無名草子さん [2022/10/03(月) 05:55:07.11 .net]
>>365
とある作家さんの和歌を一首だけ作業しようとした(全集等が刊行されてないマイナーな作家)ら、文化財指定されている短冊の翻刻(豊臣秀吉等)の例外を除き、和歌や俳句の1作品のみでの登録はページ数や作業量の関係上認められない、って感じで断られたことあるよ

368 名前:無名草子さん mailto:sage [2022/10/03(月) 08:38:45.27 .net]
>>367
詩は原則詩集単位で収載という基準の亜種ってところかね

369 名前:無名草子さん [2022/10/03(月) 14:21:32.01 .net]
一々、入力・校正w
そら、時間がかかる。

370 名前:無名草子さん mailto:sage [2022/10/03(月) 19:56:45.82 .net]
>>368
その基準をクリアするために例えば『藤野古白句集』は
一度同人誌として句集を編纂して刊行した後に、その刊行した同人誌を底本として、その同人誌を編纂した編集著作権者が著作権存続作品として青空文庫に収録する
という形を取ってるな



371 名前:無名草子さん mailto:sage [[ここ壊れてます] .net]
>>370
荒業!

372 名前:無名草子さん mailto:sage [[ここ壊れてます] .net]
同人誌を出す難易度が

373 名前:無名草子さん mailto:sage [2022/10/03(月) 22:48:37.13 .net]
ジャンルや利害が合致すれば載せてくれる既存の文藝同人サークルに出会えるかもしれない
やったことないから分からんけど

374 名前:無名草子さん mailto:sage [2022/10/04(火) 00:20:12.08 .net]
どんな程度の同人誌ならOKなんだろうな

底本よりも親本がしっかりしてないとダメそうだが

375 名前:無名草子さん mailto:sage [2022/10/04(火) 00:21:26.80 .net]
親本というか
初出情報がはっきりしているというか

376 名前:青空文庫アクセスランキング [2022/10/05(水) 22:45:03.13 .net]
2022年9月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_09_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_09_txt.html

377 名前:無名草子さん mailto:sage [2022/10/06(木) 01:08:06.08 .net]
めちゃくちゃ変則的な組版を前に途方に暮れたりしたことある?

いままでの公開作品のなかで一番変態な組版の作品ってどれなんだろ

378 名前:無名草子さん mailto:sage [2022/10/06(木) 09:00:07.60 .net]
ホワイトブレッド作品の図版入りの多さは異常
偉い!

379 名前:無名草子さん [2022/10/06(木) 23:46:49.03 .net]
>>286
『アイヌ神謡集』のXHTML版のアクセスランキング見てみたけど

1月 250位 748アクセス
2月 159位 924アクセス
3月 295位 585アクセス
4月 147位 983アクセス
5月 144位 1,075アクセス
6月 175位 948アクセス
7月 227位 869アクセス
8月 236位 767アクセス
9月 66位 2,240アクセス

確かに前月の3倍近いアクセス数だし今年の他の月で一番多い5月と比べてもダブルスコアだな

380 名前:無名草子さん mailto:sage [2022/10/08(土) 07:59:19.07 .net]
【「100分de名著」出演】「ゴールデンカムイ」アイヌ語監修者が教えるアイヌ文学「不朽の名著」その本当の魅力
https://news.yahoo.co.jp/articles/043c3976f03855aa32b0859f4a40f62e8f68483a

9月のNHK・Eテレ『100分de名著』では、4週にわたって、知里幸恵(ちりゆきえ)さんが遺した
『アイヌ神謡集』(岩波文庫)が取り上げられました。解説を担当されている中川裕さん
(千葉大学名誉教授)は、大人気漫画『ゴールデンカムイ』のアイヌ語監修を務め、
好評発売中のヤマケイ文庫『アイヌと神々の物語』『アイヌと神々の謡』(山と溪谷社)の
推薦者でもあります。あらためて、アイヌ文化の魅力と関連書籍の楽しみ方について聞きました。



381 名前:無名草子さん mailto:sage [2022/10/08(土) 14:44:43.40 .net]
アイヌの回全部見たけれどよくわからなかったな
若くして亡くなったアイヌ女性の話が少しとアイヌ神話の解説に終始したよ

382 名前:無名草子さん mailto:sage [2022/10/08(土) 17:45:59.42 .net]
めちゃくちゃ今更ながら曇天文庫が終わってたというかYahooが終わらせていたことを知ってめちゃくちゃ悲しい

383 名前:無名草子さん mailto:sage [2022/10/09(日) 20:29:06.94 .net]
今日偶然知ったけど芥川龍之介の『羅生門』の最後の一文って改稿されてるんだな

『羅生門』の「最後の一文」は一度改稿されていた! 名文が多い小説の“ラスト”を楽しむ方法 | ダ・ヴィンチWeb
https://ddnavi.com/review/585674/

>下人は、既に、雨《あめ》を冐《をか》して、京都の町へ強盗を働きに急いでゐた。
https://www.aozora.gr.jp/cards/000879/card128.html

>下人の行方《ゆくえ》は、誰も知らない。
https://www.aozora.gr.jp/cards/000879/card127.html

384 名前:無名草子さん mailto:sage [2022/10/09(日) 21:09:15.14 .net]
下しか知らんかった

385 名前:無名草子さん mailto:sage [2022/10/09(日) 22:05:27.05 .net]
昔、教科書で習ったのも下だった

386 名前:aozorablog [2022/10/09(日) 22:15:47.56 .net]
青空文庫’22/08月-’22/09月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5096

387 名前:無名草子さん mailto:sage [2022/10/09(日) 22:20:10.16 .net]
>>383
落として読むリストに入れてたけれど知らなかった
ありがとう

388 名前:無名草子さん mailto:sage [2022/10/09(日) 22:23:39.05 .net]
知里幸恵ってアイヌとして生まれて和人の教育を受けて
クリスチャンとして西欧文化にも馴染んで
そうした女性だったからこそ「アイヌ民謡」を
普遍的な文学作品として残せたんじゃないかって思う。

病身で若くして亡くなった薄幸の女性ではあるけど
家族に宛てた手紙とかには茶目っ気たっぷりの
愛らしい姿が見受けられる。

まさかプライベートな日記や手紙が後世
青空文庫で公開されるとは思ってなかったろうけど。

389 名前:無名草子さん mailto:sage [2022/10/09(日) 22:25:50.32 .net]
> まさかプライベートな日記や手紙が後世
> 青空文庫で公開されるとは思ってなかったろうけど。

凡人に生まれてよかったと今心から思ったw

390 名前:無名草子さん mailto:sage [2022/10/09(日) 22:32:38.67 .net]
山周、山周、雨、山周だよ
どうなっとんじゃワレ~



391 名前:無名草子さん mailto:sage [2022/10/09(日) 22:38:54.94 .net]
今月のアクセスランキングテキスト版
1位から14位まで山本周五郎独占かと思いけや
9位に「独居雑感」やるな、永井荷風、山周旋風を阻止するとは

392 名前:無名草子さん mailto:sage [2022/10/09(日) 22:44:06.06 .net]
死んだらそれで終わりだから
後世に残るというのはそれだけで凄い
ただNHKの特集は面白くなかった

393 名前:無名草子さん mailto:sage [2022/10/09(日) 23:16:26.30 .net]
>>389
油断するな「二十歳の原点」の高野悦子だって生前は一大学生だからな
若い時に読んで衝撃を受けて当時書き綴ってた日記のディスクを
フォーマットしたんだけど今になってみれば
一応残しとけば良かったなんて思ってもいる

394 名前:無名草子さん mailto:sage [2022/10/09(日) 23:42:53.21 .net]
芥川龍之介の遺書は「右の条件の実行せられたる後は火中することを忘るべからず。」と書いたのに
内容(本文)はちゃっかり後世に残されてる(青空文庫にも収録)上に更に遺書も普通に残存してる
そりゃ他人からすれば内容も原本も残ってたっていいし死人に口無しだけど本人的にはどうなんだろうな

395 名前:無名草子さん mailto:sage [2022/10/09(日) 23:49:13.26 .net]
死んでも死にきれないw

396 名前:無名草子さん mailto:sage [2022/10/10(月) 00:10:56.44 .net]
死んだら全て終わりだから関係するのは生きている間のみ
あの世あるとかは心のよりどころなだけ
だが弱ってるときは頼りにするし付きあいの潤滑剤にもなるので宗教ってすごいね

397 名前:無名草子さん mailto:sage [2022/10/10(月) 02:36:15.34 .net]
逆に日本画家の奥村土牛の子供が相続税を増やしたくないからとデッサンを焼却処分するなんてエピソードもあるし

398 名前:無名草子さん mailto:sage [2022/10/10(月) 07:06:28.96 .net]
>>394
芥川の場合はそれすらもポーズというか演出で
絶対に後世に残ることを意識して書いてる気がする。
自らの死に対しての演出という点では芥川とか太宰とかは特に
周到に準備していて生き様自体をひとつの作品として
残したかったのではなかろうか。

399 名前:無名草子さん mailto:sage [2022/10/10(月) 13:20:40.96 .net]
日記も人が読むことを前提に書いているものが多いな。
もっとも、元々家の覚というルーツを考えれば、それが本来なのかもしれないが。

400 名前:無名草子さん mailto:sage [2022/10/10(月) 14:49:14.54 .net]
日記を外部に見せる予定のない個人的な備忘録と考えても、本人すら忘れてる時に中身を確認することになるんだから、何も知らない赤の他人でも読めるような書き方になっててもおかしくないわな



401 名前:無名草子さん mailto:sage [2022/10/10(月) 14:55:50.50 .net]
去年田辺聖子の女学生時代の日記が出版されたけど、自分の友人に日記を読ませて感想を聞いたりしてるんだよね
まあ読ませても大丈夫なところだけと書いてるけど
作家を生業にしようというくらいの人って、いつも読者を意識してるんだなと思った
アンネの日記のアンネも後年出版するつもりで書いてた日記があった

402 名前:無名草子さん [2022/10/10(月) 15:07:31.04 .net]
石川啄木は、遊郭等での女遊びの詳細を妻に読まれたくなくてローマ字でこっそり日記に書いてたなぁ
(すさまじい内容だから、青空文庫に入れる猛者は現れるのか……?)

403 名前:無名草子さん mailto:sage [[ここ壊れてます] .net]
ローマ字日記が全集とかに普通の漢字かな混じり文で収録されてて、編集後記とかに「誰々が(または編集部が)日本語表記に改めました」とあったら編集者や翻訳者としての著作権が発生するんだろうか

404 名前:無名草子さん mailto:sage [[ここ壊れてます] .net]
>>403
耕作員のサガで草

405 名前:403 mailto:sage [2022/10/10(月) 16:49:35.59 .net]
近所の図書館に確認しに行ったけど『啄木全集 第六巻 日記(二)』(筑摩書房、1967年12月25日初版第1刷)にはローマ字の原文と漢字かな混じり文の両方が載ってた
解題に「本巻の校訂は石川政雄氏と筑摩書房編集部が主としてこれにあたり、……」と書いてあるが誰が漢字かな混じり文を担当したかは分からぬ
まぁ編集部名義だけなら公開後50年で通せたけど大人しくローマ字の原文だけ入力すりゃいい話か

まぁ今入力申請したらここ見てると思われちゃうな

406 名前:無名草子さん mailto:sage [2022/10/10(月) 18:31:48.23 .net]
ここみてると思われても問題なくない?
ここは紳士淑女のスレだし

407 名前:無名草子さん mailto:sage [2022/10/11(火) 09:59:36.75 .net]
左付きルビってXHTML非対応?

408 名前:無名草子さん mailto:sage [2022/10/11(火) 13:01:22.77 .net]
>>407
こんな感じらしい

>[#「開‐柘」の左に「ヒラキ」のルビ]
坂本龍馬 海援隊約規
https://www.aozora.gr.jp/cards/000908/files/51377_39744.html

>[#「天皇」の左に「オホキミ(?)」のルビ]
折口信夫 橘曙覧評伝
https://www.aozora.gr.jp/cards/000933/files/47550_51134.html

409 名前:無名草子さん mailto:sage [2022/10/11(火) 18:17:25.02 .net]
( ・∀・)へぇー

>スメラギ[#「天皇」の左に「オホキミ(?)」のルビ]

こういう注記(ハテナ注記)もはじめて見た。
古い(といっても8年前)テキストファイルのようだから注記も古いのかもしれないが
今だったら「判読不可」になるんじゃないかと思われるが

410 名前:無名草子さん mailto:sage [[ここ壊れてます] .net]
昔のように漢字にカタカナの原型の漢字ルビ付けてるのを青空文庫で見たいな
既にあるなら良いんだけど



411 名前:無名草子さん mailto:sage [2022/10/11(火) 19:24:32.71 .net]
>>409
国立国会図書館デジタルコレクションで公開されてるやつでも「天皇」の右に「スメラギ」、左に「オホキミ(?)」とあるから
引用文が書かれた当時の読み方が正確には分からないから2種類ルビ振りました的な話じゃないかな

橘曙覧評伝 - 国立国会図書館デジタルコレクション
https://dl.ndl.go.jp/info:ndljp/pid/1111722

412 名前:無名草子さん mailto:sage [2022/10/11(火) 19:56:15.47 .net]
なるほど、
元々のルビが「(?)」と表記されてるケースなんだね
そういうのもあるのか

自分だったらどうするだろう、
小心者だからファイル末に「(?)は底本通り」と書いてしまうかもしれん

413 名前:無名草子さん mailto:sage [2022/10/11(火) 19:56:37.81 .net]
>>411
ありがとう

414 名前:無名草子さん mailto:sage [2022/10/11(火) 20:01:19.21 .net]
>>412
そもそも仮に入力者、校正者、点検者が本文内に本文以外の文字を書き込む(打ち込む)なら

[#「○○」はママ]

みたいな注記スタイルになるはずだしな

415 名前:無名草子さん mailto:sage [2022/10/11(火) 20:46:39.11 .net]
>>410
多分だけどFAQの「Q:変体仮名(万葉仮名)が底本で使われていました。どうしたらよいでしょうか?」に引っかかってそのままでは載ってなさそう
青空文庫編 青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

416 名前:無名草子さん mailto:sage [2022/10/11(火) 21:07:51.92 .net]
>>415
もう一声!
へんたいする以前の漢字に漢字ルビのやつがデジタル画面で綺麗に見たいなという素朴なネタでした

417 名前:無名草子さん mailto:sage [2022/10/11(火) 21:32:27.95 .net]
大正時代に出た『変態性欲』って雑誌が青空文庫入りせんかな

418 名前:無名草子さん mailto:sage [2022/10/11(火) 21:55:02.98 .net]
稲垣足穂ネタ引きずってすまん
文庫本読むの面倒になって楽天koboで500円割引あったのでこっちで買って読んでる
スマホで読みやすい文字サイズで読むのほんま楽

419 名前:無名草子さん mailto:sage [2022/10/11(火) 22:00:38.75 .net]
スレ違い

420 名前:無名草子さん mailto:sage [2022/10/11(火) 22:21:41.66 .net]
ちなみに石川啄木「詩」に載ってる「一年ばかりの間、いや一と月でも」から始まる無題の詩は、『ローマ字日記』の明治42年4月10日の記述が初出らしく、初音ミクの楽曲にもなってるっぽい



421 名前:無名草子さん mailto:sage [2022/10/12(水) 00:00:28.87 .net]
>>417
復刻版を買って入力しよう!!

不二出版 : 変態性慾  〔大正11年~14年〕  全6巻・別冊1 〔復刻版〕
www.fujishuppan.co.jp/books/history/%E5%A4%89%E6%85%8B%E6%80%A7%E6%85%BE%E3%80%80%E3%80%80%E5%85%A86%E5%B7%BB%E3%83%BB%E5%88%A5%E5%86%8A1/

422 名前:無名草子さん mailto:sage [2022/10/12(水) 11:33:29.99 .net]
今月の「100分de名著」がちょうど折口信夫だけど
先月の知里幸恵よりちょっとかたい感じがする
アクセス増率的にはどうだろう

423 名前:無名草子さん mailto:sage [2022/10/14(金) 17:25:03.65 .net]
>>431
是非やってくれ

424 名前:無名草子さん [2022/10/14(金) 18:44:36.63 .net]
>>423
入力申請と底本画像送って、メール待ち
校正は8月辺りに全部送ったけど、まだ受け取りのメールが届いてない(いちおう届いてはいて確認中との事)

425 名前:無名草子さん mailto:sage [2022/10/14(金) 18:56:24.04 .net]
俺も送って1ヶ月以上経ってるな
まぁそれでなくても分量がそこそこあるので気長に待ってる

426 名前:無名草子さん mailto:sage [2022/10/14(金) 19:35:08.51 .net]
入力作品だけ送って校正作品は入力のが返事来てからでいいかと思ったけど公開のことも考えたら逆が良かったかな
今追加で送るのは流石に迷惑だろうけど

427 名前:無名草子さん mailto:sage [2022/10/14(金) 20:17:38.23 .net]
お忙しいのね……

428 名前:無名草子さん mailto:sage [2022/10/16(日) 13:49:04.51 .net]
OCR使っても校訂は苦行に近い
まるで写経しているかのようなご利益がありそう

429 名前:無名草子さん mailto:sage [2022/10/16(日) 18:04:39.51 .net]
それゆえに間違い見つけたとき、お宝見つけたような醍醐味を得られるんやで

430 名前:無名草子さん mailto:sage [2022/10/16(日) 18:08:51.62 .net]
最終的には目視が重要とはいえ、OCR校正がより効くのはやはり手入力ファイルなんだろうな。
OCR入力 VS OCR校正だと、校正用比較ファイル作る手間のほうが大きそうに思える。
特に近年のはOCR入力増えてるだろうし。



431 名前:無名草子さん mailto:sage [2022/10/16(日) 18:37:13.04 .net]
元の文章が手入力かOCRかに関わらず簡単な誤字は「校正ツール2.0化ひとりプロジェクト」で解決しそう

432 名前:無名草子さん mailto:sage [2022/10/17(月) 23:17:47.80 .net]
お前ら今日も校正してるか~?

433 名前:無名草子さん mailto:sage [2022/10/18(火) 01:14:04.83 .net]
新着に岡本綺堂が来てる
うれしー

434 名前:無名草子さん mailto:sage [2022/10/18(火) 07:30:45.92 .net]
今日公開の尾崎士郎の小説『風蕭々』、1889(明治22)年10月18日に来島恒喜が当時外務大臣だった大隈重信に爆弾を投げた事件が元ネタなのか
大隈重信は右足を切断することにはなったけど生き残って来島恒喜は殺害に成功したと思って自殺したんだよな

435 名前:437 mailto:sage [2022/10/18(火) 08:04:32.13 .net]
校正と校訂を間違えた
青空文庫の工作員に求められるのは校正ですね

【校正】
1. 文字、文章をくらべあわせ、誤りを正すこと。きょうせい。校合(きょうごう)。
2. 印刷物を印刷する前の過程で、校正刷りを原稿に照らし合わせて、誤りを正すこと。また、校正刷り。「校正が出る」

【校訂】
書物の文字、語句などの誤りをなおすこと。特に、古書の本文をいろいろの伝本と比べ合わせて誤りを訂正すること。校。

436 名前:無名草子さん mailto:sage [2022/10/18(火) 08:17:40.44 .net]
その辺は>>277あたりでも話してる

437 名前:無名草子さん mailto:sage [2022/10/18(火) 18:40:17.05 .net]
ネタバレか?

438 名前:無名草子さん mailto:sage [2022/10/18(火) 18:50:55.50 .net]
>>435
とはいってもやはりある程度、「この漢字遣いは今まで見たことないけど、正しいのだろうか?」っていうのは念のため確認しちゃわない?
(これは本来校閲、校訂にあたる作業)

439 名前:無名草子さん mailto:sage [2022/10/18(火) 18:52:15.99 .net]
必要によってはママ注記することになるし

440 名前:無名草子さん mailto:sage [2022/10/18(火) 19:17:04.51 .net]
ここでいう「校訂」って、記念館にあるような直筆原稿と見比べて初出誌以降の刊行物の誤植を指摘したり、品詞分解して文法的な誤りを訂正したりするような研究然とした話であって、
「底本通りだけど青空文庫の作業過程で誤植が発生したと思われるかもしれないから」とママ注記するのは青空文庫の校正作業の延長でしょ



441 名前:無名草子さん mailto:sage [2022/10/18(火) 19:49:24.30 .net]
うん、言わんとすることはわかる

ただ、前に出たコメントの流れで言うと
ママ注記は校正の範囲だけど
底本では○○注記になると校訂校閲に近くなるわけよね

そこの境目の見極めが難しいというか

ウィキソースがやってるようなむやみやたらなママ注記乱発は青空文庫ではやってないし
明らかな誤植を除いて、本当にママ注記の対象とするかっていうのは耕作員の匙加減みたいなところない?

442 名前:無名草子さん mailto:sage [2022/10/18(火) 19:51:49.67 .net]
入力も校正も、自分はわりとその点にに力と時間を割いてる感がある。

443 名前:無名草子さん mailto:sage [2022/10/18(火) 19:59:15.65 .net]
「これは誤字だ!」と思うか「これは誤字か?」と思うか「珍しい表記方使うねぇ」と思うか何も思わないかは各工作員の知識や教養や感受性次第だからなぁ

444 名前:無名草子さん mailto:sage [2022/10/18(火) 20:10:58.92 .net]
ママ注記って点検ではどれくらい修正されるんだろう

445 名前:無名草子さん mailto:sage [2022/10/18(火) 21:07:31.40 .net]
今日公開のやつにママ注記あるかなと思って検索したら

>貴様にはまた[#「また」は底本では「まだ」]別に命を捨てるに適当な時期がある、

>※誤植を疑った箇所を、底本の親本の表記にそって、あらためました。

とだけあった
入力者は底本の親本(旧字旧仮名のもの)も入力しているようだから気付けたのだろう


今月公開の他の作品だと『現代語訳 平家物語』には(どっちも尾崎士郎だな)

>与三左衛門|影康《かげやす》[#「与三左衛門影康」はママ]、

という注記もあった(※ググった限りだと一般的には「与三左衛門景康」か「与三左衛門景安」らしい)

446 名前:無名草子さん mailto:sage [2022/10/18(火) 21:22:54.16 .net]
なにそれかっこいい/////

447 名前:無名草子さん mailto:sage [2022/10/18(火) 21:57:50.95 .net]
僕とフリオと校訂で

448 名前:449 mailto:sage [2022/10/19(水) 00:12:56.40 .net]
>>441
確かにそれはそう


レアケースになるけど、例えば>>445の前者みたいに旧字旧仮名の本が新字新仮名で再刊されているような場合については
{新/旧}字{新/旧}仮名の別があれば同じ作品を収録できるというルールを使って、旧字旧仮名と新字新仮名を両方収録して
その中で差異があれば青空文庫内の整合性のために、間違ってそうな方に(これもあやふやだな)「○○は底本では××」注記を入れるということもできなくはないかな
対象となる作品(あるいは作家)は限られるだろうし、それでなくても本文が旧字旧仮名のままで再刊されるという可能性だって十分あるけど

結局は入力者(場合によっては校正者)次第なのかな

449 名前:449 mailto:sage [2022/10/19(水) 00:31:21.41 .net]
色々考えたけど色々考えた故に思考が取っ散らかって訳の分からない返事になってしまった気がする
すまぬ

450 名前:無名草子さん mailto:sage [2022/10/19(水) 06:24:51.03 .net]
今日も山周・・・



451 名前:無名草子さん mailto:sage [2022/10/19(水) 08:58:49.76 .net]
死ねよヤマシュウ

452 名前:無名草子さん mailto:sage [2022/10/19(水) 09:52:30.85 .net]
とっくに

453 名前:無名草子さん mailto:sage [2022/10/19(水) 12:46:57.02 .net]
何度も書き込んでるけど普通に入力校正作業した工作員に対する侮辱だよな

454 名前:無名草子さん mailto:sage [2022/10/19(水) 13:02:41.27 .net]
>>453
わかる
字面通りに読めばその通りだ

わかるが、
山周を敬愛していた富田さん、山周、それぞれへの一種の愛着や親しみを込めた、ここならではの山周ジョークとも言える

山周大杉→山周○ね→既に○んでますが
までがセットの

455 名前:無名草子さん mailto:sage [2022/10/19(水) 13:08:55.88 .net]
いわばイジリだな。

いじめじゃないよイジリだよ~が当事者に通用しないのとおなじで
言われて快く思わない耕作員がいるかもしれんのは否定しないよ

456 名前:無名草子さん mailto:sage [2022/10/19(水) 17:54:36.06 .net]
全く面白くない

457 名前:無名草子さん mailto:sage [2022/10/19(水) 18:10:13.76 .net]
へぇ

458 名前:無名草子さん mailto:sage [2022/10/19(水) 18:25:10.03 .net]
山本周五郎が公開されるまでは生きたいと言って闘病生活を送っていた富田氏に絡ませた上で死ねだの死んでるだのと言うのが愛着故の発言とは到底思えない

459 名前:無名草子さん mailto:sage [2022/10/19(水) 18:33:07.67 .net]
おーぷんのほうじゃフリーOCRに旧仮名学習させる話してるぜ

不毛な会話やめて有意義な話しよう

460 名前:無名草子さん mailto:sage [2022/10/19(水) 18:39:37.13 .net]
俺が最近思ってるのは、注記の実例集みたいなのできたらいいなって

もちろん点検グループさんにこれ以上負担はかけたくないから
公式に伺いをたてながら有志を募ったり何らかの形で

FAQや入力校正作業手引きで
「この場合こうする」っていう大まかなことはわかるけど
実際作業してみると、手引きで見たことないケースに遭遇することもある

前例をあたるのを楽にする実例集ね



461 名前:無名草子さん mailto:sage [2022/10/19(水) 18:45:46.37 .net]
人の作業に文句言ってる訳だから感心しないよな
何もせずに文句たれるくらいなら山周ラッシュは俺が終わらせてやるくらいの気概を見せてくれたほうがかっこいい
山周だって公開が続けばいつかは新着がなくなるわけだし、次期山周の座を狙うくらいにがんばってくれ

462 名前:無名草子さん mailto:sage [2022/10/19(水) 18:46:03.52 .net]
もちろん個人が外部サイトでやってもいいのだろうけど

「こういうケースで、こう注記した、こう注記するよう指導もらった」等の情報は個人だけで持っててももったいないな、
共有できたら良いなと思ったんだよね

そういう意味で有志で力と知恵、経験を合わせられればと思ったんだ

463 名前:無名草子さん mailto:sage [2022/10/19(水) 19:03:05.54 .net]
青空文庫入力校正攻略wiki

464 名前:無名草子さん mailto:sage [2022/10/19(水) 19:20:05.76 .net]
>>463
良いね

465 名前:無名草子さん mailto:sage [2022/10/19(水) 19:48:09.66 .net]
wiki記法も覚えなきゃだ

466 名前:無名草子さん mailto:sage [2022/10/19(水) 20:09:16.65 .net]
スレ違いだったらすまないのだが

くの字点と言いながら、横書きのテキストデータでは「く」の字と山が逆向きの/\が使われることにいつも違和感を覚えるんだ

なぜ\/が採用されなかったのかな
(これもこれで見慣れないぶん違和感あるが)

基本的に横書きでは用いられない文字なのだよね
それとも横書きで使われている底本ってあるのだろうか

467 名前:無名草子さん mailto:sage [2022/10/19(水) 20:34:46.57 .net]
文字コードでは、「/」(に似た形状の記号)を「くの字点上」、「\」(に似た形状の記号)を「くの字点下」としているからそれに順番を合わせているんだと思う
Wikipediaの「踊り字」のページ参照

468 名前:無名草子さん mailto:sage [2022/10/19(水) 21:16:09.86 .net]
そうかそういうことなのか

Unicode文字のくの字上と下は見たことあったがセットで並べる固定観念から横組みになるところしか想像してなかった

長いくの字を上下に分けたものを、順番どおり前後(左右?)に並べた結果、山が逆に見えるというわけだね

長いくの字が横になることしか考えてなかった
これからは、/\に対する見方がかわるなあ

どうもありがとう

469 名前:無名草子さん mailto:sage [2022/10/19(水) 21:17:19.19 .net]
横組みというか、横

説明へたでごめんなさい

470 名前:無名草子さん mailto:sage [2022/10/19(水) 21:19:19.85 .net]
表を底本のスキャン画像ですますか、ちゃんとエクセル等で入力し直すか迷う
せっかくだから綺麗にしたいけど、もし画像に力ミスがあったら校正の人の作業が大変になるよな



471 名前:無名草子さん mailto:sage [2022/10/19(水) 21:27:32.81 .net]
両方送ろう(無責任)

それはそれとしてページを跨いでる図表って扱いに困るよね

472 名前:無名草子さん mailto:sage [2022/10/19(水) 21:30:28.83 .net]
むしろ表の作り直しっていうのも有りなんですか。
表つきの作品を作業したことも読んだこともまだないので知りませんでした。
どんなふうか見てみたいです。

473 名前:無名草子さん mailto:sage [2022/10/19(水) 21:33:54.50 .net]
校正待ちの作品が3000件以上あって、古いもので2003年から待ち状態になってるみたいだけど、どういう作品が放置されがちなのかな?
2003年からほったらかしとか少し可哀そうなんだが、同情したらダメな感じ?

474 名前:無名草子さん mailto:sage [2022/10/19(水) 21:55:14.04 .net]
2005年以前から校正待ちの作品一覧

佐藤紅緑『あゝ玉杯に花うけて』…133,444バイト(※旧字旧仮名)
范曄『後漢書 皇后記』…11,782バイト(※なぜか底本情報がない)
范曄『後漢書 光武伝』…60,748バイト(※なぜか底本情報がない)
宮本百合子『書簡・書簡補遺』…350,117バイト
宮本百合子『婦人と文学(初出稿)』…113,002バイト
宮本百合子『湯浅芳子宛書簡』…341,209バイト
森本六爾『日本農耕文化の起原』…117,150バイト(※旧字旧仮名)
山路愛山『勝海舟』…152,519バイト(※唯一の点検済み)
※サイズは、zip圧縮をかけたテキスト版のもので、単位はバイト(byte)です。
 この値を1000で割ると、キロバイト(KB)に換算できます。
 解凍後はおよそ、倍の大きさになります。

みんなで校正待ちを解消しよう!!

475 名前:無名草子さん mailto:sage [2022/10/19(水) 22:13:33.17 .net]
点検前のものは申し込めなくない?
できちゃうの?

476 名前:無名草子さん mailto:sage [2022/10/19(水) 22:15:00.07 .net]
圧縮して半分になってるっぽいけど全角1文字で2バイトになるから書かれてるバイト数≒文字数になるのかな
書誌情報も込みのバイト数だろうけどまぁ誤差だろうし、となると後漢書以外は全部10万字以上の作品になるのか

文庫本は1ページあたり600字だから本文が10万字だとしても文庫本167ページ分くらいか

477 名前:無名草子さん mailto:sage [2022/10/19(水) 22:16:23.60 .net]
山路愛山のは点検済んでることだしずっと気になってた
しかしこれはスキル的にはもちろんボリューム的にも自分にはなかなかにハードルが高いと感じて手が出せないでいる

478 名前:無名草子さん mailto:sage [2022/10/19(水) 22:19:52.21 .net]
それに点検が昔すぎて注記形式とか変わってるはずだから、もしかして再点検されるのかな

479 名前:無名草子さん mailto:sage [2022/10/19(水) 22:24:04.46 .net]
>>475
点検前のものは点検作業が完了してから校正申請を受理する(「校正待ち」から「校正予約」の状態になる)というだけで校正申請が不可というわけではないはず

480 名前:無名草子さん mailto:sage [2022/10/19(水) 22:25:37.46 .net]
「ご注文内容によってお出しする順番が前後する場合がございます。」みたいなものか?



481 名前:無名草子さん mailto:sage [2022/10/19(水) 22:27:13.69 .net]
いつかは誰かが点検しなければならないとはいえ点検さん大変だな

482 名前:無名草子さん mailto:sage [2022/10/19(水) 22:32:59.21 .net]
校正の予約はないけどすぐ点検済みになるのと
校正申請されるまで点検前状態で待機になるのがあんのね。

483 名前:無名草子さん mailto:sage [2022/10/19(水) 22:35:05.65 .net]
>>480
これだね

484 名前:無名草子さん mailto:sage [2022/10/19(水) 22:46:47.21 .net]
インターネッツ時代になってかれこれ20数年余
著者だけではなく工作員が人知れず鬼籍に入っていてもおかしくない年月

485 名前:無名草子さん mailto:sage [2022/10/19(水) 23:11:50.99 .net]
自分はもし死んだときのために
うちの家族にその後の手続きを頼んである

死んだ旨を伝えること
未完成であっても作業ファイルの最新版を青空文庫に送ってもらうこと
どこまで作業したかがわかるメモ(たとえば何回目校正までやった、とか)も作品ごとに書いているのでその内容も伝えること

幸いまだそのときは来てない

486 名前:無名草子さん mailto:sage [2022/10/19(水) 23:13:17.05 .net]
じゃないと、誰かから引き継ぎ交替申請が来るまで
作業中作品が死蔵状態になっちゃうから

487 名前:無名草子さん mailto:sage [2022/10/19(水) 23:35:26.45 .net]
>>482
最近耕作員になっていくつか入力したけど、自分の入力作品は受領メールが来た翌日には校正待ちの点検済み扱いになってるから、恐らくある時期を境に(自分が耕作員を始める前に)原則として入力ファイルを受け取った時点で点検まで終わらせるように方向転換したんだと思う

それで次々に届く新しい入力ファイル(つまり点検前の作品)を点検してて、昔の点検前の作品は校正申請が来るまでは手を着ける余裕がないのかなと思う

488 名前:496 mailto:sage [2022/10/20(木) 00:04:43.29 .net]
作業状態を年別で見ると最近の点検前は何人かに絞られてるし、恐らく点検グループのメンバーとかが入力してる作品が中心なんだと思う
他のボランティアを優先しようぜ的な感じで

他の理由があるかもしれないけど

青空文庫の作業状況
https://yozora.main.jp/inp/index.html
※下の方に載ってる

489 名前:無名草子さん mailto:sage [2022/10/20(木) 10:38:04.27 .net]
>>460、471
自分も欲しいし、実例出しに協力したい
前例探すために青空文庫の全文検索をよくやるんだけど
底本がどうなっているかわからないから確信が持てないんだよね

490 名前:無名草子さん mailto:sage [2022/10/20(木) 22:15:49.81 .net]
いまいち使い方知らないから的外れなこと言ってるかもしれないけどGitHubにある青空文庫のデータ一式から注記の箇所だけ抜き取ったりできるんじゃないの?



491 名前:無名草子さん mailto:sage [2022/10/20(木) 22:52:33.41 .net]
500

492 名前:無名草子さん [2022/10/21(金) 06:40:35.36 .net]
問題は、その注記が為されたとき底本がどうなってるかなんだよね。

底本画像の部分切り取り画像とセットになってはじめて役に立つ感じかな。

493 名前:無名草子さん [2022/10/21(金) 06:41:26.80 .net]
>>489
うん、まさにそれ。

494 名前:無名草子さん mailto:sage [2022/10/21(金) 12:28:51.85 .net]
今日公開された作品の注記はこんな感じだな(※別にここでシリーズ化するつもりではない)


江戸川乱歩『暗黒星』

>できなかったが。[#「できなかったが。」はママ]
(句点ではなく読点が正しいのだと思う)


尾崎士郎『早稲田大学』

>高田早苗《たかださなえ》[#ルビの「たかださなえ」はママ]
(正しくは「たかたさなえ」らしい)

>民間に[#「民間に」は底本では「民間の」]
>自刃した[#「自刃した」は底本では「白刃した」]
(底本の親本に合わせたものらしい)

495 名前:無名草子さん mailto:sage [2022/10/21(金) 12:43:06.67 .net]
複製権や編集著作権で概ねカバーできるとはいえ出版物原版権(印刷物のレイアウトなどに関する著作権、いわゆる版面権)って法整備されてないんだよな

496 名前:無名草子さん [2022/10/21(金) 12:47:54.96 .net]
そうなのか
うーん、そうなると攻略wiki立ち上げは、たとえ青空文庫本体とは別運営するとしても難しいかな?

青空文庫のスタンスは、グレーは黒とみなす厳密さだからなぁ

497 名前:無名草子さん mailto:sage [2022/10/21(金) 15:40:11.38 .net]
底本画像そのものじゃなく底本を模して自分で作ったものだったり
NDLにある場合はそのリンクだったりでも駄目かなあ

498 名前:無名草子さん [2022/10/21(金) 17:23:03.47 .net]
国立国会図書館デジタルコレクションに所蔵された作品は青空文庫化の需要はないの?
底本の写真画像だけだと文字列検索できないから少しは需要あると思ったんだけどなあ

499 名前:無名草子さん mailto:sage [2022/10/21(金) 17:41:51.64 .net]
需要があるかは知らないけど、自分はデジコレで読める作品を中心に入力作業してるよ。
デジコレを底本にしてるのは古い本でも校正しやすそうだからだけど

現状デジコレは快適に読書できるUIではなく、
デジコレ本を高精度のocrでテキスト化した次世代デジタルライブラリーも、今のところ全文検索には役立っても読書のためのものではない
デジコレは無料で貴重な本を読めてたいへんありがたいサービスけど、実際あそこで読書するのは厳しい。デジコレでは読まなくても青空文庫化したら読む人はいるだろうね。

気軽に読むには青空文庫のようにもっとテキストを整形しないと難しい。だからどんどんやろう。

500 名前:507 mailto:sage [2022/10/21(金) 19:13:20.56 .net]
>>499
情報ありがとう
次世代デジタルライブラリーの存在、知らなかった



501 名前:無名草子さん mailto:sage [2022/10/21(金) 19:27:21.88 .net]
>>497
むしろ底本を模すのが駄目だからこそ著作権者が明確な文章の部分のみを電子テキスト化して公開してるんだが……

(逆に著者の死没も著書の刊行も1967年12月31日以前で著作権保護期間満了のものはうわづら文庫が画像で公開してる)

502 名前:無名草子さん mailto:sage [2022/10/22(土) 16:02:31.67 .net]
むしろデジコレ公開作品のテキスト化(単純なOCR化ではない)こそ積極的にやるべきだよな

503 名前:無名草子さん mailto:sage [2022/10/22(土) 16:04:54.11 .net]
>>502
正確にはテキスト化じゃなくて電子テキスト化だった

504 名前:無名草子さん mailto:sage [2022/10/22(土) 22:16:57.36 .net]
次世代デジタルライブラリーの文字起こしデータ、市販の読取革命よりはOCR精度が高いのかな、とは思うけど、
それでもやはり人間が読むためのデータじゃなくて計算機に検索されることに特化してる感じはする

505 名前:無名草子さん mailto:sage [2022/10/22(土) 22:24:39.53 .net]
Google booksとかも割と滅茶苦茶だからな
そりゃ調べものがあるのに検索しても手掛かりがゼロだった時代よりは十分ありがたいけど参考にしていい水準かというと……

506 名前:無名草子さん mailto:sage [2022/10/22(土) 22:36:19.22 .net]
google booksの本文検索は著作権保護期間内の作品も大量に扱ってるから意図的に文章をバラしてるはず
昨今のAIの進化見てると識字率も組版の再現もいい感じにしてくれる技術がそろそろ出てきていいんじゃないかと思っちゃう
入力校正まで完璧にやってくれる青空文庫ロボ来てくれ

507 名前:無名草子さん mailto:sage [2022/10/23(日) 08:50:40.81 .net]
日本語文献じゃないんだが『元朝秘史』という中世モンゴル語を明代初期の漢字音で転写した歴史書があるんだけど、読取革命にかけたらかなりの精度で文字起こしできていたので驚いたわ
読取革命の開発者がOCRのテスト用データに『元朝秘史』を使ったのではと思えるほどだった

508 名前:無名草子さん [2022/10/23(日) 08:59:22.87 .net]
出版物に牽引が添えられている作品は、積極的に青空文庫化してほしいよ
著作権者らが牽引の需要が高いと考えたからこそ牽引が出版物に含まれているわけで、
電子化されれば牽引を使うよりはるかに楽に検索できるようになるね
昔の人は、パソコンもないのに牽引を自力で作ったのはすごいと思う。ま、そんなこというと活版印刷した職人はもっとすごいけど。

509 名前:無名草子さん mailto:sage [2022/10/23(日) 17:36:21.99 .net]
アプリで読むと便利すぎる。種類もいっぱいあるから自分好みのが見つかるし

510 名前:無名草子さん mailto:sage [2022/10/23(日) 18:21:26.04 .net]
電子テキストの検索の弊害というほどでもないけど、昔の一般的表記と今の一般的表記が違うと検索しても引っ掛かるかどうか分からないという問題があるんだよね



511 名前:無名草子さん [2022/10/23(日) 18:49:21.24 .net]
通読ではなく拾い読みする使い方が多い歴史文書は人名や地名がどこに登場してくるかすぐに検索できるってのがかなり恩恵が大きい

512 名前:無名草子さん mailto:sage [2022/10/23(日) 18:50:27.26 .net]
そこは自分で検索を試行錯誤するしかないね。

513 名前:無名草子さん mailto:sage [2022/10/23(日) 22:43:36.36 .net]
TeX使えるようにならないかなぁ

514 名前:無名草子さん mailto:sage [2022/10/23(日) 23:33:21.51 .net]
>>508
牽引ってなんだろう……ってわからなくったけど
もしかして索引(さくいん)のこと?

515 名前:517 [2022/10/24(月) 07:28:51.45 .net]
>>514
素で間違えてたわ、指摘ありがとう
がっつりと索引を牽引と思い込んでたし読みもケンインと思い込んでた

516 名前:無名草子さん [2022/10/24(月) 07:34:23.45 .net]
例えだけど、徳川家康のルビのふり方を徳川と家康でわけると、ブラウザなどで文字列検索した時に徳川家康でヒットしないので困るね
多少ルビの原本再現性が悪くなっても徳川と家康をわけずに徳川家康でルビ振ったほうがよさそう

517 名前:無名草子さん mailto:sage [2022/10/24(月) 07:58:52.56 .net]
>姓と名のルビは「夏目漱石《なつめそうせき》」のように、分割しない。

>名前と肩書、敬称なども、「千田実画伯《せんだみのるがはく》」、「内海紀伊様《うつみきいさま》」のように原則としてまとめる。

入力ファイルを「テキスト版」に仕上げるために
https://www.aozora.gr.jp/KOSAKU/textfile_checklist/index.html

518 名前:無名草子さん mailto:sage [2022/10/24(月) 12:19:38.29 .net]
「徳川《とくがわ》家康」だと「徳川家康」で検索しても引っ掛からないから「徳川家康《とくがわ》」にしようという話では?

519 名前:無名草子さん mailto:sage [2022/10/24(月) 12:29:40.98 .net]
>>518
イエス、イエヤス。
工作員には、検索する人の需要を意識してルビを振るセンスが求められると思ふ

520 名前:無名草子さん mailto:sage [2022/10/24(月) 12:45:24.84 .net]
そもそも青空文庫は著作権の切れた作品を電子書籍として金銭や会員登録などの制約なく自由に読めるようにするのが主目的であって
検索機能を使って過去の言葉の用法の変遷を調べるとか、朗読や漫画などの原作にするとか、作品の舞台となる地域や主役となる人物の宣伝の1つにするとか、読書以外のそれ以外の利用は想定内ではあるけどあくまで副次的なんだよな
副次的な利用のために本来の目的に支障が出たら本末転倒
青空文庫のルビや注記の表記法が視覚障碍者読書支援協会の表記法を踏襲したことも踏まえて考えてみると良い



521 名前:無名草子さん mailto:sage [2022/10/24(月) 12:59:56.17 .net]
古い辞書データ使って形態素解析すると井伊直虎の読みがイイチョクトラになってしまうのよ

522 名前:無名草子さん mailto:sage [2022/10/24(月) 16:45:00.78 .net]
Firefoxはルビを文字列検索できない

523 名前:無名草子さん mailto:sage [2022/10/24(月) 17:22:19.84 .net]
あんこ臭えが来てた

524 名前:無名草子さん mailto:sage [2022/10/24(月) 23:28:49.77 .net]
ブラウザ版って試読版の延長みたいなもんだしルビや注記を無視したデータベースにしたいなら青空文庫のデータを元に自分で作らなきゃ

525 名前:無名草子さん [2022/10/25(火) 08:17:41.16 .net]
堅苦しい挨拶も何なので平易な文にて失礼しますね
青空文庫の発展に尽力されているみなさんお疲れ様です
益々のご活躍を

526 名前:無名草子さん mailto:sage [2022/10/25(火) 19:59:11.10 .net]
ルビ問題なら青空文庫対応のアプリを色々使ってみるのもあり
中には文章から文字を範囲選択してそのまま検索できるものもあったりする

527 名前:無名草子さん mailto:sage [2022/10/25(火) 20:57:58.82 .net]
山本有三(1887-1974)よろしく「近頃私はルビを見ると、黒い虫の行列のやうな気がしてたまりません。」的なノリで
青空文庫のデータからルビや注記を取っ払ったミラー風サイトを作れば良いんじゃなかろうか

528 名前:無名草子さん mailto:sage [2022/10/25(火) 21:11:17.75 .net]
そもそも徳川家康について調べたい人が「徳川家康」のワードだけで調べて見つからないからと諦めるかっていうとそうはならない気がするのよね

「徳川 家康」「徳川」「とくがわ」「とくかは」などなど表記の違いの可能性をあれこれあたるだろう

検索利用を想定して体裁を整えてあげたものを作るまでする必要あるのかなあ?って思った

529 名前:無名草子さん mailto:sage [2022/10/25(火) 21:12:45.80 .net]
スレチだったらごめん。

530 名前:無名草子さん mailto:sage [2022/10/25(火) 21:58:05.94 .net]
1つの単語のルビを集めてデータベースにしてるふりがな文庫みたいに
表記が違うけど同じ固有名詞を指してる単語のデータベースみたいなのは面白そうだな

ただこれはそれなりに知識のある人が全て目を通さないと作れないか……



531 名前:無名草子さん mailto:sage [2022/10/26(水) 22:15:07.35 .net]
これしか知らないから具体名出すけど「Wiki版『早稲田大学百年史』」みたいなのが理想的なのかもな
図表以外が全部テキスト化されており図表も画像で公開されているという青空文庫と同様のテキスト公開に加えて
原本の画像も公開されている(写真は著作権の都合で非公開)

あと上で出ていた要望に答えるという意味で(正直これは青空文庫にはそぐわないかもしれないが)
本文中の大学関係者の名前(本名・筆名不問)が大学の人名データベースとリンクしている機能もある
【参考】
早稲田大学百年史
https://chronicle100.waseda.jp/index.php

532 名前:無名草子さん mailto:sage [2022/10/26(水) 22:31:16.11 .net]
理想的とはどの意味において?

普通のhtmlサイトと何ら変わりないと思うが……
むしろ青空文庫みたいに表示を変えたりできないから読みづらいくらいに感じるのだが

533 名前:無名草子さん mailto:sage [2022/10/26(水) 22:40:14.32 .net]
話の流れとしては、電子テキストと底本画像の両方が公開されてる点と、表記の異なる固有名詞を一元管理してる点じゃない?
ここ最近ずっと読書的な視点の話とデータベース的な視点の話が混同してる気がする

534 名前:無名草子さん mailto:sage [2022/10/26(水) 22:42:03.78 .net]
なるほどその意味か

535 名前:無名草子さん mailto:sage [2022/10/27(木) 02:31:39.17 .net]
いいトコどりは難し
二兎を追う者は一兎をも得ず、とかいうやらん

536 名前:無名草子さん mailto:sage [2022/10/27(木) 02:39:04.05 .net]
まあでもどっちもあれば助かるから両方やればいいんだよほんとは
リソースさえあればね……

537 名前:無名草子さん mailto:sage [2022/10/27(木) 12:28:50.61 .net]
画像データは容量がね……

538 名前:無名草子さん mailto:sage [2022/10/27(木) 21:51:31.12 .net]
いつも気になっているけれど
わざわざ手を取ってまで訊くことでもない気がして訊けないでいるのは点検グループさんたちは底本画像をどう保管してるのだろうかということ

539 名前:無名草子さん mailto:sage [2022/10/27(木) 21:53:14.23 .net]
データベースよりテキストより、サーバのほとんどが画像保存に使われてしまいそうだが
どう捻出してるのかなと

540 名前:無名草子さん mailto:sage [2022/10/27(木) 22:03:39.37 .net]
>>538
手を取るなんて そっそんな恥ずかしい



541 名前:無名草子さん mailto:sage [2022/10/27(木) 22:30:14.34 .net]
画像データのサイズなんて大したことないと思うけど

542 名前:無名草子さん mailto:sage [2022/10/27(木) 23:06:57.75 .net]
Twitterで大長編を共同作業しよう的な動きが出てるな

543 名前:無名草子さん mailto:sage [2022/10/27(木) 23:39:13.24 .net]
テキストデータなら数十キロバイトで済むものでも画像データならPDFにせよPNGにせよ数メガバイト~数十メガバイトになるけど……

最低でもルビの濁点半濁点(つまり「ば」か「ぱ」か)が判別できる程度の解像度でな

544 名前:無名草子さん mailto:sage [2022/10/28(金) 00:09:58.94 .net]
じゃけんみんなはよ校了させましょうね~
校了したら底本画像は削除してるのかな

545 名前:無名草子さん mailto:sage [2022/10/28(金) 07:53:38.87 .net]
>>544
削除してないと思う
誤植指摘の問い合わせに備えて
だから心配なんだよ

546 名前:無名草子さん mailto:sage [2022/10/28(金) 12:11:37.18 .net]
青空文庫FAQの誤植の指摘に関する回答では

>「やはり入力時のミスである」と確認できたものだけを、底本の該当箇所のキャプチャ画像とともにご報告いただけると、助かります。

とあるから公開した後は消してるんじゃないかな

流石に全部をクラウドストレージで残してたら無料分では賄えなさそうだしコストがヤバそう
残してたとしてもデジタルコレクションになくて点検スタッフの家の近くの公立図書館にもない本とかだけじゃないかな

547 名前:無名草子さん mailto:sage [2022/10/28(金) 13:11:41.61 .net]
>>543
一冊につき画像データが50MBあったとして1TBで2万冊
実際には短編も多いから平均は50MBよりはるかに少ないだろうし
その程度ならなんとかなるんじゃね
ローカルで保存して必要な時だけクラウドにあげてもいいだろうし

548 名前:無名草子さん mailto:sage [2022/10/28(金) 13:15:17.42 .net]
>>546
まあそのへんが妥当だと思う
特に初期は入力も校正も紙の本からというケースがほとんどだったんじゃないかな

549 名前:無名草子さん mailto:sage [2022/10/28(金) 19:35:58.88 .net]
誰か訊いてみて……(オドオド

550 名前:無名草子さん [2022/10/28(金) 20:18:39.87 .net]
青空文庫の「最新」の外字フォント一覧を見たいんだけどどうすればいい
txt2xhtml(t2hs.rb)に付属された2012年当時から更新ありそうなもんだけど



551 名前:無名草子さん mailto:sage [2022/10/28(金) 21:32:11.63 .net]
GitHubに全データあるからそこからあれそれして抽出したらできそう(やり方は知らない)
十年くらい前にやってる人がいて記事にしてくれたりもしてたみたいだけど、最近はどうかな
https://github.com/cjkvi/cjkvi-data/blob/master/aozora_gaiji_chuki.txt

https://wakufactory.jp/densho/font/aozora/

552 名前:無名草子さん mailto:sage [2022/10/29(土) 12:05:29.89 .net]
なるほど、試しにやってみたけど、間違ってたらごめん

ttp://pansy.s1010.xrea.com/2022/10/29/%e5%a4%96%e5%ad%97%e9%9b%86%e8%a8%88/

553 名前:無名草子さん [2022/10/29(土) 17:33:39.66 .net]
>>552
さっそくallkanji.txtを拝見させてもらいました。
どうも青空文庫はいまもtxt2xhtmlに付属の外字ファイル群しか使ってないようですね。
唯一見つけたかと思った「鹵,U+9E75,1-83-35,1,1」は外字を使わなくても表示できる文字でした。

554 名前:無名草子さん mailto:sage [2022/10/29(土) 19:13:02.34 .net]
鹵獲の鹵(しお)は普通にJIS2だけど、それとは違う?

>>552
なるほど元がtsvになってるわけか。さらっとRuby書けるの凄いな

555 名前:無名草子さん mailto:sage [2022/10/30(日) 00:24:26.77 .net]
青空文庫見れるAppStoreアプリ10種ほどインストールしてみた
こういうのでパッと気軽に見れたり、連携辞書で熟語を調べられたりするのは隔世の感を感じる
・ソラリ (無料、課金で広告消。有料版も有)
・Yom!青空文庫 (有料プラン月額100円)
・読書尚友 (無料。課金で広告消)
・i読書   (無料。課金で広告消)
・青空本棚1・2 (2は広告枠だけ有)
・neo文庫  (有料。豊平文庫の後継版)
・bReader  (有料)
・名作小説  (無料だが広告有)
・巣ごもり青空文庫 (無料だが広告有)
・巻丸    (無料。基本は小説サイトビューアだが青空文庫対応)
性能に興味があるなら感想レスする

556 名前:無名草子さん mailto:sage [2022/10/30(日) 00:43:39.88 .net]
アプリに関しては、工作員的に関心があるのは「自作のファイルが読めるか否か」ぐらいかな
読めるなら自分の作業で使えるけど、できなかったら用は無い
で、表示できるアプリは基本的に少ない……

557 名前:無名草子さん mailto:sage [2022/10/30(日) 12:39:34.59 .net]
校正の際には読書尚友に読み込ませてるわ
[#縦中横]とか一部の注記が機能してないけどそこまで不便ではない

ちなみに、底本を再現して脱字や衍字を確認するのに、今は表示設定で1行あたりの文字数を調整してるのだけど、
フォントサイズや余白の広さによる間接的な設定じゃなくて、1行の文字数を直接設定できるアプリとかあったりする?

まぁ仮にこの設定機能を実装したアプリがあったとしても、
本によっては句読点や括弧が半角状態だったり、行頭に句読点が来ないように調整されてたりするから、
完璧に再現しようとするならテキストデータを改行して読み込むのが確実にはなるんだけど、流石に二度手間で面倒臭い

558 名前:無名草子さん mailto:sage [2022/10/30(日) 12:58:27.50 .net]
moon+ reader pro だと加工したテキストファイルも読み込めるし
読み上げさせることもできて便利なのでこれを推したい。
OCRソフトで読み込んで漢数字の〇と記号の○とが間違ってる場合でも
読み上げさせるとすぐに気がつけて音読お勧め。

559 名前:無名草子さん mailto:sage [2022/10/30(日) 13:02:21.32 .net]
行文字設定可能なアプリ↓
i読書 14文字〜38文字 (課金でも160円、課金なしでも気になる広告は出ない)
青空本棚2 9文字〜42文字(青空本棚ではなくて2の方です)
ソラリ 8文字〜62文字(ただしフリー版は不定期に動画広告出るので、校正不向きかも)

こんなところ

560 名前:無名草子さん mailto:sage [2022/10/30(日) 13:20:22.96 .net]
>>555
APPだけか
win11ユーザーならPC上でandroid動かせるで



561 名前:無名草子さん mailto:sage [2022/10/30(日) 13:31:01.71 .net]
Android専用も試したいけどWin10ユーザーなんでまだ無理す
青空文庫Ad、青空読書、読書家あたりは興味ある

562 名前:566 mailto:sage [2022/10/30(日) 15:41:37.24 .net]
>>559
Android勢だけど「読書尚友があるなら他のもあるのかな~」くらいで聞いたらどれも無かった……
折角教えてくれたのにごめん……

563 名前:無名草子さん mailto:sage [2022/10/30(日) 17:56:53.11 .net]
androidならファイル管理しやすいMHE novel viewerを長年愛用してるけど一般的には読書尚友が使いやすいと思う

564 名前:無名草子さん mailto:sage [2022/10/30(日) 23:36:54.36 .net]
iPhone/iPad限定だけど「縦式」ってエディタアプリが青空文庫形式に対応してて
1行当たりの文字数も指定できるから、校正で使ってる

565 名前:2022年11月公開予定作品一覧 mailto:sage [2022/10/31(月) 13:29:06.02 .net]
2022-11-01 萩原 朔太郎『室生犀星君の飛躍』※誕生日
2022-11-01 室生 犀星『純情小曲集 01 珍らしいものをかくしてゐる人への序文』※『純情小曲集』作者(萩原朔太郎)誕生日
2022-11-02 ホワイト フレッド・M『ドレントン・デン特派員の冒険 05 第五回 巨大純白蛾』
2022-11-03 山本 周五郎『霜柱』
2022-11-04 泉 鏡花『三人の盲の話』※誕生日
2022-11-04 大石 誠之助『太平洋食堂』※誕生日(旧暦)、作品初公開
2022-11-04 楠山 正雄『しっぺい太郎』※誕生日
2022-11-05 片山 敏彦『或る時の詩』『泉』※誕生日
2022-11-06 山本 周五郎『饒舌りすぎる』
2022-11-07 作者不詳『現代語訳 平家物語 11 第十一巻』
2022-11-08 山本 周五郎『十八条乙』
2022-11-09 岡本 かの子『食魔に贈る』※登場人物(エドワール・ニニョン)誕生日
2022-11-10 畑中 武夫『太陽を呑む赤い老星の秘密』※命日、作品初公開
2022-11-11 佐佐木 茂索『散歩』※誕生日
2022-11-12 山本 周五郎『醜聞』
2022-11-13 中谷 宇吉郎『日食記』
2022-11-14 山本 周五郎『滝口』
2022-11-15 大下 宇陀児『偽悪病患者』※誕生日
2022-11-15 原 民喜『もぐらとコスモス』※誕生日

566 名前:2022年11月公開予定作品一覧 mailto:sage [2022/10/31(月) 13:29:27.27 .net]
2022-11-16 大町 桂月『酒に死せる押川春浪』※押川春浪命日
2022-11-17 中野 鈴子『許南麒の詩のように』※許南麒命日
2022-11-18 徳田 秋声『背負揚』『復讐』※命日(秋声忌)
2022-11-19 吉井 勇『ゴンドラの唄』※命日
2022-11-20 大田 洋子『「屍の街」序』※誕生日、作品初公開
2022-11-21 山本 周五郎『超過勤務』
2022-11-22 ラヴクラフト ハワード・フィリップス『錬金術師』
2022-11-23 菊池 寛『神の如く弱し』※モデル(久米正雄)誕生日
2022-11-23 佐藤 春夫『若き日の久米正雄』※久米正雄誕生日
2022-11-24 山本 周五郎『燕(つばくろ)』
2022-11-25 柳田 国男『私生児を意味する方言』
2022-11-26 楠山 正雄『鉢かつぎ』※命日
2022-11-27 山本 周五郎『ばちあたり』
2022-11-28 寺田 寅彦『猫六題』※誕生日
2022-11-28 中谷 宇吉郎『実験室の思い出』
2022-11-29 大石 誠之助『文明の強売 (断じて不正なり)』※誕生日
2022-11-30 嘉村 礒多『故郷に帰りゆくこころ』※命日

567 名前:無名草子さん mailto:sage [2022/10/31(月) 14:17:10.35 .net]
大下宇陀児とラヴクラフトがあるな
たのしみ
あと朔太郎って言うとおぎやはぎ矢作の子供が一番に浮かぶようになってしまった俺

568 名前:無名草子さん mailto:sage [2022/10/31(月) 14:43:50.30 .net]
ちょうど最近読んだ「名前の話」(萩原朔太郎)からの引用

中には「朔太郎」といふのが本名か雅号かなどと問ふ人もあるが、紛れもなく、親のつけてくれた本名である。僕は十一月一日に生れた。長男で朔日ついたち生れの太郎であるから、簡単に朔太郎と命名されたので、まことに単純明白、二二ヶ四的に合理的で平凡の名前である。

569 名前:無名草子さん mailto:sage [2022/10/31(月) 23:14:55.45 .net]
青空文庫に触れてないしスレ違いな気もするけど面白かった

本を読んだことがない32歳が初めて「走れメロス」を読む日 | オモコロブロス!
https://omocoro.jp/bros/kiji/366606/

図書カード:走れメロス (太宰 治)
https://www.aozora.gr.jp/cards/000035/card1567.html

570 名前:無名草子さん mailto:sage [2022/11/01(火) 13:34:40.63 .net]
>>569
記事内に

>普通に「走れメロス」を読みたい方は、青空文庫で全文読めますので、そちらをどうぞ。

とあるから多分ギリギリセーフ



571 名前:無名草子さん mailto:sage [2022/11/01(火) 20:30:09.57 .net]
>>531
少し前の話を掘り起こして悪いが
渋沢栄一記念財団も「デジタル版『渋沢栄一伝記資料』」で電子テキストと画像の両方を公開してる
もっとも渋沢栄一や他の保護期間満了となった著作権者以外に著作権が及ぶ箇所については一部非公開となっているが……

TOP|デジタル版『渋沢栄一伝記資料』|渋沢栄一|公益財団法人渋沢栄一記念財団
https://eiichi.shibusawa.or.jp/denkishiryo/digital/main/index.php

ついでにいうと国立国会図書館の著作者情報公開調査みたいなこともしてる

著作権者に関する情報を捜しています|デジタル版『渋沢栄一伝記資料』|渋沢栄一|公益財団法人渋沢栄一記念財団
https://eiichi.shibusawa.or.jp/denkishiryo/digital/main/authors_request.html

572 名前:無名草子さん mailto:sage [2022/11/01(火) 21:00:52.48 .net]
渋沢栄一のゲシュタルト崩壊起こした

573 名前:無名草子さん mailto:sage [2022/11/01(火) 21:22:44.98 .net]
渋沢栄一は入力中2、校正中1、公開中0か……

574 名前:無名草子さん mailto:sage [2022/11/02(水) 20:52:02.12 .net]
OCR校正の話は何度も出てるけど
みんなはそれを「校正一回」に数えてる?

(うまく言えないけど)

比較用OCRテキストを作るにももちろん手間と時間がかかるけど
それにしたって目視で全文チェックする校正と比べると
あまりにあっけなくて

入力者のテキストが完璧であればあるほど
OCRを以て一回に数えるのが不安になっちゃうというパラドックスがあるんだ

そんなわけで結局は目視で最低限三回
それに加えてOCR
って感じだ、自分は

575 名前:無名草子さん mailto:sage [2022/11/02(水) 21:02:31.57 .net]
やったことないけどOCR校正って良いの?

576 名前:無名草子さん mailto:sage [2022/11/02(水) 21:06:40.19 .net]
二段組底本の例だと思って読んでくれ

自分の手順だが

見開きスキャン画像に黒い余白がある場合、フリーソフトで一括トリミングして純粋なページ部分だけの画像にする→
自分の使ってるOCRが段組を認識しないので、段ごとの画像にするため、画像を一括で四分割するフリーソフトにかける→
出力連番が望む順番と違うのでこれもフリーソフトで一括リネーム→
OCR→
コピーペーストして一つのテキストに→
比較作業

自分は全てフリーソフトで賄っているのでこんな感じ
段組を認識できるOCRを使えばもっと早いだろうね

二段組見開き18ページ程度の作品で全工程が40分満たないくらいだ
早すぎて不安なんだ

577 名前:無名草子さん mailto:sage [2022/11/02(水) 21:08:08.20 .net]
ちなみに
>>576=>>574です

578 名前:無名草子さん [2022/11/03(木) 00:20:34.90 .net]
>>574,576
ルビはどうしてるの?

579 名前:無名草子さん mailto:sage [2022/11/03(木) 08:31:41.76 .net]
今日も元気だ山周だ

580 名前:無名草子さん mailto:sage [2022/11/03(木) 11:37:23.36 .net]
人の目を通さない作業は事前準備で校正とは見做さないキリッ



581 名前:無名草子さん mailto:sage [2022/11/03(木) 12:24:24.74 .net]
>>578

比較ツールにかけるとき
OCRではつかないルビや注記は
どうしてるの?という話かな?

あくまでも自分の感覚ではだけど、
OCR校正では主に、入力者の変換ミスや助詞や助動詞の間違いを検出するのに秀でてる手法と思う

だからルビ、傍点、入力者注記はやはり底本画像を見て追うことになるね

それでもOCRが生んだテキストをツールに通すと、その追うべき部分がマークアップされて(もしくはマークアップされるはずなのにされなくて)明示的になるので分かりやすい

582 名前:無名草子さん mailto:sage [2022/11/03(木) 12:27:46.02 .net]
>>580
うん、
全く人の目を通さないわけではないのだけど
あくまでも補助的なものと思った方がいいのかなあって気がして
みんなどうしてるか訊いてみた。

583 名前:無名草子さん mailto:sage [2022/11/03(木) 12:30:00.91 .net]
>>581

自己レス

> それでもOCRが生んだテキストをツールに通すと、その追うべき部分がマークアップされて

OCRが生んだテキスト「と入力者テキストと」をツールに通すと



スマヌ

584 名前:無名草子さん mailto:sage [2022/11/03(木) 16:02:34.70 .net]
OCRを比較に使う人よりもOCRを文字起こしの始点として利用する人がむしろ多いんじゃないの?

585 名前:無名草子さん mailto:sage [2022/11/03(木) 18:15:36.20 .net]
いろいろなやり方試してて、もっと効率的な方法ないかなーって質問してるだけじゃないのかな?
俺のやり方はこうだ、お前らのは違うって言いに来たのではないと思うが

586 名前:583 mailto:sage [2022/11/03(木) 18:34:57.15 .net]
あー
もしなにか、書き方の感じ悪かったのならごめんね

昔だけど公式ブログ「そらもよう」でも
OCR校正の圧倒的な時間効率の良さについて記事になっていたこともあったから
参考にして校正に取り入れてる人たちいるだろうと思ってたけど
やっぱりOCRといえば入力補助であって、校正での利用はまだまだそうでもないのかな?


>>585
うん、ありがとう、そういう意味です

587 名前:無名草子さん mailto:sage [2022/11/03(木) 19:25:17.44 .net]
OCR校正補助に使ってるけど、マニアックな異体字は拾ってくれない
あと促音を大書きにしているような底本誤植が勝手に小書きに修正されちゃう場合とかもある
(底本の誤植を見落とす可能性がある)
目視が重要であることに変わりはない と思う

588 名前:無名草子さん mailto:sage [2022/11/03(木) 19:27:55.08 .net]
最近30年ほどのワープロソフトで書かれた印刷物ならOCRの信頼性は高いだろうけど、
青空文庫は活版印刷全盛の印刷物が対象だからOCRの信頼性低いので校正に使うという発想は到底出てこないと思うんだが

589 名前:無名草子さん mailto:sage [2022/11/03(木) 19:31:05.29 .net]
新字新仮名に改めて改版されたものが底本のパターンも少なくないけどね

590 名前:583 mailto:sage [2022/11/03(木) 19:34:45.01 .net]
>>588
そうでもないよ
これ見てみて

>校正を担う人が少ないために、青空文庫は公開に至れない入力済みファイルをたくさん抱えています。
こうした現状に風穴をあけたいと、点検グループの門田裕志さんは、OCRを校正に利用する実験を重ね、精度の向上と作業時間の短縮を同時に達成できるとの感触をつかまれたと言います。

「校正をやりやすくするために」
https://www.aozora.gr.jp/aozorablog/?p=565

2012年の記事だよ



591 名前:無名草子さん [2022/11/03(木) 19:45:13.86 .net]
>>590
10年前から進捗がないってことは、うまくいかなかったってことだよ
OCRを校正じゃなくて入力原点として使うのが最適解ってこと
何もないところから手入力で文字起こしするんじゃなくて、OCRの出力テキストに手を加えていく方式ね

592 名前:無名草子さん mailto:sage [2022/11/03(木) 19:48:18.97 .net]
OCRで校訂なんて主客顛倒もいいところだよ

593 名前:無名草子さん mailto:sage [2022/11/03(木) 20:30:08.04 .net]
OCRで出した文章と入力ファイルを比較して違いがあったら底本を確認するってこと?

そもそも入力者がOCR使ってたら入力者が一回通った道をまた歩いてるだけでしょ?
自分の使ってるOCRが特別高性能とか入力者が手入力したと分かってる状態じゃなきゃ二度手間過ぎない?

594 名前:無名草子さん mailto:sage [2022/11/03(木) 20:35:29.57 .net]
筆算の結果とエクセル計算の結果を照合します的な二度手間感を楽しみたい人もいるんだと思う
数独みたいな

595 名前:無名草子さん mailto:sage [2022/11/03(木) 20:39:07.61 .net]
ちなみにOCR校正の話が出てたのはおーぷんのほうだ。

596 名前:無名草子さん mailto:sage [2022/11/03(木) 20:50:13.15 .net]
おーぷんの1棚目で出ている。

入力テキストを作るほどのことまではせず
ただOCR通して比較にかけるだけで軽く下チェックができるわけね。

徹底突き合わせの前にひとつでもあらかじめ潰しておくくらいの気楽さでやるぶんにはいいと思う。
入力テキスト作るほどの手間ではないし。

「一回には数えない」ほうがいいね。

597 名前:無名草子さん mailto:sage [2022/11/03(木) 20:53:39.74 .net]
心血を注いでゼロから手入力文字起こししたこと無駄だったと受け入れたくない人にとっては、OCR校訂は意味があると思う
それ以外の人にとってはただの二度手間な宗教儀式

598 名前:無名草子さん mailto:sage [2022/11/03(木) 20:55:31.19 .net]
本人の手入力の正確性、速度もあるだろうね、そこは個人差あるかも

599 名前:無名草子さん mailto:sage [2022/11/03(木) 21:00:17.83 .net]
なんだろう、大根の皮を包丁でむいた後、ピーラーでむいた大根と、皮の厚さを比較する自己満足の世界

600 名前:無名草子さん mailto:sage [2022/11/03(木) 21:03:24.85 .net]
>>599
へんな喩え



601 名前:無名草子さん mailto:sage [2022/11/03(木) 21:10:21.64 .net]
戦いはこれからだ

602 名前:無名草子さん mailto:sage [2022/11/03(木) 21:29:18.07 .net]
>>599
喩えはよくわからないが、つまりやらなくていい自己満足だという意味だよね。

最終的には目視が絶対重要というところさえ揺るがなければ、
やってる人がメリット(誤字脱字検出)を得ている以上、
やらない人が全否定することでもないと思うよ。

みんなでやりやすいように、やろう!

603 名前:無名草子さん [2022/11/03(木) 21:47:26.84 .net]
皮をむいただけでは織田氏の浸みた美味しい大根になる道のりはまだまだ遠い田楽狭間よ

604 名前:583 mailto:sage [2022/11/03(木) 21:52:42.81 .net]
さいごに
みなさんどうもご意見ありがとう
いろんな意見聞けて良かった!

だけどもし私の書き込みきっかけで
傷ついたり不愉快になったりした人がいたらごめんなさい

入力も校正もがんばります。

605 名前:無名草子さん mailto:sage [2022/11/03(木) 21:55:37.73 .net]
>>603
織田氏っていうtypoがいかにも工作員ぽくてすき

606 名前:無名草子さん mailto:sage [2022/11/03(木) 22:02:41.01 .net]
今更だけど、上の流れ、
前提の誤解で話が食い違ってるんじゃない?

質問者は「入力者からもらったテキストを校正者として校正する」作業のことを言ってるが

回答者の何人か(?)は
「自分が入力者として入力したテキストを、入力者校正する」作業のことと考えてない?

そう考えると
「心血注いで~」の意味や大根の例えが解る

607 名前:無名草子さん mailto:sage [2022/11/03(木) 22:08:28.59 .net]
質問者などいない説

608 名前:無名草子さん mailto:sage [2022/11/03(木) 22:39:23.24 .net]
第三者から見てると不快に思えるレスする人が何人かいる

609 名前:無名草子さん mailto:sage [2022/11/03(木) 22:50:13.63 .net]
ごめん不快にさせたのなら
>>600は自分
悪気はなかったんだが
そぐわなく感じてぶっきらぼうになってしまった申し訳ない

でも感じた理由が前提の食い違いだと解ったいまは、喩えの意味もわかるが
なんにしてもすまなかった

610 名前:無名草子さん [2022/11/04(金) 01:06:45.73 .net]
手入力したファイルとOCRのファイルなら、手入力したファイルのほうがはるかに信頼できる。
OCRをべた褒めするのは初心者のダニングクルーガー効果だから、適当にからかっとけばいい。



611 名前:無名草子さん mailto:sage [2022/11/04(金) 03:34:34.57 .net]
長編の入力だとocrがあるといざ作業に取り掛かる心理的ハードルが低くなる

612 名前:無名草子さん mailto:sage [2022/11/04(金) 08:33:01.27 .net]
>>611
なんとなくわかる

OCRの出力テキストがお粗末だと、人間さまの出番なので俄然やる気が出る効果があるし、
OCRの出力テキストが立派だと、苦しい作業から解放されてやる気が出る効果がある

613 名前:無名草子さん mailto:sage [2022/11/04(金) 18:07:55.55 .net]
>>612
どっちに転んでもやる気が出てて草

えらい

614 名前:無名草子さん [2022/11/04(金) 18:49:17.14 .net]
OCR出力テキストを起点にすると、クロスワードパズルとか倉庫番とかテトリスやってるようなゲーム感を楽しめるよ

615 名前:無名草子さん [2022/11/04(金) 19:05:26.69 .net]
OCRの吐き出したひどいテキストを綺麗にせずにいられない心理効果があるので、パズル好きとか掃除好きな人はOCRと相性良いと思う

616 名前:無名草子さん mailto:sage [2022/11/04(金) 19:40:19.10 .net]
それはちょっと分かるかも

617 名前:無名草子さん mailto:sage [2022/11/04(金) 20:16:35.98 .net]
ペンシルパズル好き自分、校正好きな理由をここにて知る

618 名前:無名草子さん mailto:sage [2022/11/05(土) 11:42:59.20 .net]
サイゼリヤの間違い探しvs青空文庫の校正作業

619 名前:青空文庫アクセスランキング [2022/11/05(土) 15:26:07.18 .net]
2022年10月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_10_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_10_txt.html

620 名前:無名草子さん mailto:sage [2022/11/06(日) 00:08:17.88 .net]
来月は走れメロスが爆上がりだろうな
>>569のおかげで



621 名前:無名草子さん mailto:sage [2022/11/06(日) 14:40:27.09 .net]
ここ一二週間体調がすぐれなくて
PCの前にあまり座れないでいる

そのために校正が滞ってしまい
なんとかならないのか……
と悩んでる自分にビックリした

本来紙と紙と突き合わせるのが校正の原点なんだから
修正はともかく
チェック作業にはPC要らんやん

スキャン画像を必要に応じて拡大したりしながら作業するのが当然になってて
PCないとできないと思い込んでる自分に草

622 名前:無名草子さん mailto:sage [2022/11/06(日) 14:41:07.94 .net]
思考が機械に依存してそう、自分

623 名前:無名草子さん [2022/11/06(日) 14:55:36.73 .net]
それ以前に思考が活字に依存してるから安心しなよ
手書き文書の崩し文字の読みづらさに耐えて文字起こした先人に感謝しないと

624 名前:無名草子さん mailto:sage [2022/11/06(日) 15:04:39.23 .net]
ほんとだね
先人すごいよ

625 名前:無名草子さん mailto:sage [2022/11/06(日) 19:43:03.43 .net]
とは言っても、当時の手書き文字は当時の人からすれば書き手の癖はあっても概ね第三者も読める程度に一般認知されてた(草書体のように法則に従って崩されてた)文字だったわけで、
さらに和文タイプライターは大正時代からあったと言っても日本語ワープロが普及する昭和50年代までは日常生活では基本的に手書きだっただろうし、
まだ忍耐というレベルの労力が割かれる程に時代の断絶はなかったんじゃないかな

626 名前:無名草子さん mailto:sage [2022/11/06(日) 20:26:32.11 .net]
文豪の手書き生原稿みるとなかなかにエグいもんな

あれを活字に起こしていくのが当たり前のようにできてた先人
俺たちが退化しているのか

627 名前:無名草子さん [2022/11/06(日) 20:46:31.98 .net]
それ以上、原稿の手書きセリフ「ひでえ」を誤読して「ひでぶ」と文字起こしして新ワードが生まれたマンガ『北斗の拳』をディスらないで

628 名前:無名草子さん mailto:sage [2022/11/06(日) 20:47:24.59 .net]
戦前は義務教育だって旧字旧仮名がデフォルトだったしな

629 名前:無名草子さん mailto:sage [2022/11/06(日) 20:49:52.24 .net]
まぁ校訂という作業が存在する程度には手書き文字の読み間違いや書き間違いも存在するけどね

630 名前:無名草子さん mailto:sage [2022/11/06(日) 21:12:14.72 .net]
文豪の手書き原稿とかみてもクセが強くって何書いてか分かんなくって
かつての編集者とか作家を缶詰めにしてとにかく書かせてその後
解読作業してなんとか雑誌掲載に間に合わせてたのかって思うと
ものすごく大変そう
ひと癖ある坂口安吾の担当にされた半藤一利の苦労とか
想像すると忍びない



631 名前:無名草子さん mailto:sage [2022/11/06(日) 23:35:05.21 .net]
遺稿集とかだと稀に直筆原稿の写真が載ってたりするけど7~8割しか読めない
残りの半分は推測の域を出ないもの、もう半分はマジで何か分からないもの

あとお偉いさんに序文を書いてもらって恐らくお偉いさん故にそのまま直筆で載せられてることもあるけど楷書以外は本当に分からん

632 名前:無名草子さん mailto:sage [2022/11/06(日) 23:38:37.52 .net]
スレチだけど江戸時代のテキストを翻刻してるみん翻の人たちのことは同じ電子テキスト化ボランティアとして応援してるな

633 名前:無名草子さん mailto:sage [2022/11/07(月) 14:48:33.53 .net]
ちょっと時間できた
がんばってくる

634 名前:aozorablog [2022/11/07(月) 21:29:03.62 .net]
青空文庫’22/09月-’22/10月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5114

635 名前:無名草子さん mailto:sage [2022/11/08(火) 21:27:12.89 .net]
>>627
くお~!!ぶつかる~!!ここでアクセル全開、インド人を右に!

636 名前:無名草子さん mailto:sage [2022/11/09(水) 16:38:02.96 .net]
>>635
これすこ

637 名前:無名草子さん mailto:sage [2022/11/09(水) 23:37:05.11 .net]
みんな頑張れ

638 名前:無名草子さん mailto:sage [2022/11/10(木) 12:13:21.65 .net]
[第1話]漫古☆知新-バカでもわかる古典文学- - 漫☆画太郎 | 少年ジャンプ+
https://shonenjumpplus.com/episode/316190246946132654

図書カード:蟹工船 (小林 多喜二)
https://www.aozora.gr.jp/cards/000156/card1465.html

639 名前:無名草子さん mailto:sage [2022/11/10(木) 14:45:11.43 .net]
漫☆画太郎に普通を期待したアタシがバカでした

640 名前:無名草子さん mailto:sage [2022/11/10(木) 20:27:54.48 .net]
淡々と書かれてる解説が面白い



641 名前:無名草子さん mailto:sage [2022/11/11(金) 11:01:12.01 .net]
こんな投げ捨て漫画をいつまでもネタにする程度の低さに嘆く

642 名前:無名草子さん mailto:sage [2022/11/11(金) 12:13:25.74 .net]
早押しクイズで「オイジゴ」と読まれたら「蟹工船」と答える

643 名前:無名草子さん mailto:sage [2022/11/11(金) 19:55:57.12 .net]
じゃあ青空文庫冒頭4文字超イントロ
ここならわかる人いそう


「ではみな

石炭をば

ある日の

えたいの

私は、その

吾輩は

隴西の李

「こいさん

644 名前:無名草子さん mailto:sage [2022/11/11(金) 21:55:43.21 .net]
>>643
銀河鉄道の夜

舞姫

蜘蛛の糸

檸檬

人間失格

吾輩は猫である

山月記

細雪

で、あってるかな?
(人間失格と細雪は最初わからなかった)

645 名前:無名草子さん mailto:sage [2022/11/11(金) 21:56:17.52 .net]
割と一言だけでも続きを思い出せるな

646 名前:無名草子さん mailto:sage [2022/11/11(金) 23:48:50.92 .net]
「ある日の」
曲れる者(アーサー・コナン・ドイル)
羅生門(芥川龍之介)
蜘蛛の糸(芥川龍之介)
芸術統制是非(辰野隆)

「私は、その」
人間失格(太宰治)
婦人の過去と将来の予期(小川未明)

647 名前:無名草子さん mailto:sage [2022/11/12(土) 08:50:21.08 .net]
>>644
正解です、やっぱりすごいな。

似た文の指摘もありがとう。そう言えば蜘蛛の糸もある日始まりで結構有名な書き出しですよね。

648 名前:無名草子さん mailto:sage [2022/11/12(土) 13:55:48.50 .net]
クイズネタはクイズスレ立ててやってくれ
こういうのされるの困る

649 名前:無名草子さん mailto:sage [2022/11/12(土) 15:35:22.53 .net]
ごめん、ちょっとした出来心で。
もうやらないよ。

650 名前:無名草子さん mailto:sage [2022/11/12(土) 16:11:48.05 .net]
一回クイズやって答えただけで
別スレたててそこでやれ とは
657こそどこぞいけばいいのでは?



651 名前:無名草子さん mailto:sage [2022/11/12(土) 16:23:21.52 .net]
他の話題と同時進行とかでもないしな

652 名前:無名草子さん mailto:sage [2022/11/12(土) 18:30:13.26 .net]
自治厨どこにでも湧く

653 名前:無名草子さん mailto:sage [2022/11/13(日) 23:45:57.78 .net]
どこぞの音ゲーで夢野久作の『ドグラ・マグラ』をイメージした新曲が公表されたらしくTwitterのトレンドにドグラ・マグラが載ってた

654 名前:無名草子さん mailto:sage [2022/11/15(火) 19:22:57.78 .net]
周りに「中高のときに電子辞書に入ってる青空文庫の本を読んでた」みたいな人が結構いて、やっぱ意義ある取り組みなんだなとしみじみした

655 名前:無名草子さん mailto:sage [2022/11/15(火) 19:54:51.90 .net]
授業中電子辞書でドグラ・マグラ読んで俺カッケーしてたわwダセェ

656 名前:無名草子さん mailto:sage [2022/11/15(火) 20:00:29.65 .net]
「趣味は青空文庫の入力ボランティアです」みたいなこと言うと割と好反応が返ってくる
たまに「卒論書く時に活用しました」みたいなのも文理問わずある

657 名前:無名草子さん [2022/11/15(火) 20:12:45.15 .net]
意義はあるのかもしれないけど、出版社は文庫本で稼ぐ機会を失っている。
古典名著で出版社が稼いだお金が新人を支えるのに役立ってたのかもしれないと思うと、複雑じゃね?

658 名前:無名草子さん mailto:sage [2022/11/15(火) 20:18:08.62 .net]
青空文庫入りするみたいな古典文学って出版社にとってお荷物だったんじゃない?

659 名前:無名草子さん mailto:sage [2022/11/15(火) 20:30:59.51 .net]
青空文庫で無料で読める作品でも有名漫画家が表紙を描いたり文豪なんちゃらとコラボすればコレクターズアイテムとして売れるからね

660 名前:無名草子さん mailto:sage [2022/11/15(火) 20:44:25.44 .net]
むしろ営利企業なんだからこそ現在や将来の作家の育成をメインにしろよと思う
そもそも古典作品の出版だって校訂、現代語訳、解題、編集、翻案(漫画化)、裁定制度の利用とかで青空文庫との差別化は十分可能だからな



661 名前:無名草子さん mailto:sage [2022/11/15(火) 20:45:47.95 .net]
コレクターズアイテムって価値は数百円程度でも所有していることに意味があるからな

662 名前:無名草子さん mailto:sage [2022/11/15(火) 20:48:39.35 .net]
テレビに出て名を馳せた芸能人がYouTuber始めたら「ファンは嬉しいかもしれないけど、テレビ局は彼(女)を番組に出演させて稼ぐ機会を失っている」ってなる?

663 名前:無名草子さん [2022/11/15(火) 20:53:15.35 .net]
小中学生が学校から水洗されて読む古典文学なら収入は手堅いだろう。ポケモンみたいな位置づけ?

664 名前:無名草子さん [2022/11/15(火) 20:57:29.08 .net]
「私たち、日本の漫画を愛しているんです」といいながら著作権者に無断で中国語訳をつけた海賊版をネット公開する中国伝統の焼畑文化と差別化してかないと

665 名前:無名草子さん mailto:sage [2022/11/15(火) 21:15:30.56 .net]
そもそも文庫化や復刊すらされてない作品も沢山あるよね
しばらくして、どっかの文庫から文学アンソロジーが出て読んでみたら、出典に青空文庫と書いてあるという……

666 名前:無名草子さん mailto:sage [2022/11/15(火) 21:17:14.41 .net]
なんにせよ著作権は切れているのだから「出版社が稼ぐはずのお金」というのも変な話
出版社が出すならせっかくなら解説や挿絵で付加価値をつけてほしいよね

667 名前:無名草子さん [2022/11/15(火) 21:22:56.52 .net]
>>666
恩恵を得ていたのは出版社だけじゃないよ、卸売業者や書店もだよ
それを既得権とみなして破壊するか、紙の本の文化として守るかは、個々人の価値観次第

668 名前:無名草子さん mailto:sage [2022/11/15(火) 21:34:40.12 .net]
印刷や輸送や在庫管理や店頭陳列まで視野に入れるなら古典作品の商業流通は現役の文筆家が割を喰うことになるよな

669 名前:無名草子さん [2022/11/15(火) 21:40:15.47 .net]
打倒アンパンマンみたいな?

670 名前:無名草子さん mailto:sage [2022/11/15(火) 22:15:59.90 .net]
>>666
正しくは著作者の収益じゃないかな
出版社は代理販売業だよね
現実は力関係から権力入れ替わってるにせよ



671 名前:無名草子さん mailto:sage [2022/11/15(火) 22:18:01.79 .net]
20年前ライトノベルが1200円!!?
はっゴミのような読み捨て小説で1000円超え!!!?
と驚いてたけど
今は普通の文庫本ですら800円台で更にファッ!!?
となってる
漫画とかも全部凄く値上がりしてるし

きがつきゃう物価全部値上がりで
6畳用エアコンが12万円とか信じられないよ

672 名前:無名草子さん mailto:sage [2022/11/15(火) 22:31:52.03 .net]
定価1円と印字された戦前の本が古本屋で数万円

673 名前:無名草子さん mailto:sage [2022/11/15(火) 23:42:57.59 .net]
紙の本は字が小さくていけねえ
歳は取りたくないのう

674 名前:無名草子さん mailto:sage [2022/11/16(水) 09:05:57.54 .net]
>>666
紙の本の場合著作者に支払われるのは価格の一割に過ぎない
残りの九割は出版社、印刷、製本、運輸、卸、小売などの利益に

675 名前:無名草子さん mailto:sage [2022/11/16(水) 17:46:54.88 .net]
来年1月から電子書籍の国会図書館納本が始まるから、青空文庫で手入力しなくちゃならない本の数は将来的には減りそうだな。まだ電子書籍化してない本も沢山あるけど。

676 名前:無名草子さん mailto:sage [2022/11/16(水) 17:54:38.22 .net]
そうなんだよな。
ほぼ同時に電子書籍になるのがデフォになっていくと
デジタル化という概念自体がこれからは希薄になっていく。

そんな時代の流れの中で青空文庫の将来を思うと少し寂しいときもあるが、
それでも一時代の役割を果たしていることには変わりないと思いたい。

677 名前:無名草子さん mailto:sage [2022/11/16(水) 18:14:41.54 .net]
まあでもこのペースだとあと百年かかっても昭和時代の書籍の青空文庫入り作業も終わらないだろうけどね
ああでもそのうちAIイラストみたいにocrのブレイクスルーが起きて人の手作業なしで組版再現までできるようになるのかな。

678 名前:無名草子さん mailto:sage [2022/11/16(水) 18:34:17.70 .net]
>>676
電子化されてない本はまだまだあるんやで~

679 名前:無名草子さん mailto:sage [2022/11/16(水) 20:37:48.49 .net]
青空文庫は「自由に使えるように一番単純な(互換性の高い)テキストファイル形式で電子化する」という役割もあるのでそこが全部機械任せに出来るかどうかで変わってくる気がするな

半世紀以上先の話だけど国立国会図書館って電子書籍の著作権が切れたらどう公開するんだろうか

680 名前:無名草子さん mailto:sage [2022/11/16(水) 20:55:25.09 .net]
青空文庫読書アプリとFirefox、頼むからルビ検索できるようにしてクレメンス



681 名前:無名草子さん mailto:sage [2022/11/16(水) 21:00:31.10 .net]
>>679
デジコレでネット公開だと思うで

682 名前:無名草子さん mailto:sage [2022/11/16(水) 21:02:20.96 .net]
https://www.ndl.go.jp/jp/event/events/online_20221026.html
電書納本の説明会があったみたい
リフロー版電書よりPDFのほうが収集優先度高めなのは意外だった

683 名前:無名草子さん [2022/11/16(水) 21:02:30.26 .net]
少し脱線してWebブラウザの話するとSafari、Chrome、Edgeはルビ検索できるんだがFirefoxはいまだにルビ検索できない
文学作品などはくせのあるルビがその作品の作風の重要な要素だったりするから
例をあげると「強敵」と書いて「とも」とルビふる『北斗の拳』みたいな高い文学性

684 名前:無名草子さん mailto:sage [2022/11/16(水) 21:05:21.50 .net]
>>681
そりゃそうだろうけどフォーマットはどうなるのかって話

685 名前:無名草子さん mailto:sage [2022/11/17(木) 00:27:55.19 .net]
活字ファンの季節になった
銀杏の落ち葉集めて書棚の落ち葉と交換する時期だわ

686 名前:無名草子さん mailto:sage [2022/11/18(金) 12:37:04.31 .net]
食欲の秋、スポーツの秋、入力の秋、校正の秋

687 名前:無名草子さん mailto:sage [2022/11/18(金) 18:08:27.14 .net]
一年中校正中

688 名前:無名草子さん mailto:sage [2022/11/20(日) 12:28:23.43 .net]
校正ファイルを普段使いとは別のテキストエディタに移し替えて作業したり、違うビューワーで見てみたりすると誤字発見率が上がる気がする

689 名前:無名草子さん mailto:sage [2022/11/20(日) 13:01:42.84 .net]
同じエディタでもフォント変えるだけで変わリそう
○と〇とか紛らわしいけどフォントによっては区別つく

690 名前:無名草子さん mailto:sage [2022/11/20(日) 13:07:17.24 .net]




691 名前:無名草子さん [2022/11/20(日) 18:08:42.65 .net]
googleドライブのOCR
急に使いにくくなったような気がするのだけど
最近アップデートがあったのだろうか

今まではあたりまえに読み取れていた同じ底本がなぜか変なアウトプットに
同じ現象の人いる?

692 名前:無名草子さん mailto:sage [2022/11/20(日) 23:00:02.75 .net]
Twitterで「#青空文庫で一番好きな作品を教えて」というハッシュタグが生まれてる

693 名前:無名草子さん mailto:sage [2022/11/21(月) 13:33:15.23 .net]
一番は難しいな

694 名前:無名草子さん mailto:sage [2022/11/22(火) 08:34:36.14 .net]
かといって10番目に好きな作品と言われるともっと困る
読みたいときにそこにあるってのが青空文庫の良さじゃない?

695 名前:無名草子さん mailto:sage [2022/11/22(火) 09:04:47.16 .net]
選べないよ
優柔不断とかじゃなく

696 名前:無名草子さん mailto:sage [2022/11/22(火) 14:12:30.17 .net]
作家 なら選べるかな?

漱石

697 名前:無名草子さん mailto:sage [2022/11/24(木) 01:58:23.29 .net]
ハッシュタグでないけどTwitter繋がりということで。

Twitterで最近『青空文庫から抜粋するbot』っての見つけてフォローしてるけど、知らない作品を読むきっかけになっていい。

698 名前:無名草子さん mailto:sage [2022/11/25(金) 02:18:01.66 .net]
青空文庫等が詩集を除いて「単行本を一冊」単位ではなく短編なりの「文章を一冊」として収録してるのって単行本の編集著作権に配慮してのことかな

699 名前:無名草子さん mailto:sage [2022/11/25(金) 04:09:24.08 .net]
>>698
単行本の編集著作権と聞いて「ツェッペリン飛行船と黙想」を思い出した
ちなみに「ツェッペリン飛行船と黙想」は著者没後に出た未発表短編集

700 名前:無名草子さん mailto:sage [2022/11/25(金) 07:50:21.89 .net]
>>698
編集著作権については『青空文庫作業マニュアル』の「3.底本を選ぶ 2)出版社の許諾は必要か」で触れてる

青空文庫作業マニュアル【本という財産とどう向き合うか】
https://www.aozora.gr.jp/aozora-manual/



701 名前:無名草子さん mailto:sage [2022/11/25(金) 09:13:54.00 .net]
>>698
分かりやすい記事貼っておく

作者以外に認められる著作権「編集著作権」のこと
https://book.mynavi.jp/wdonline/detail_summary/id=46606

702 名前:無名草子さん mailto:sage [2022/11/25(金) 20:02:41.26 .net]
>>425
これまだ何の返事もないんだけど、やっぱ届いてないのかな?
ちなGmail

703 名前:無名草子さん mailto:sage [2022/11/25(金) 23:47:35.85 .net]
真実は点検さんに聞かないとなんとも
ちなみ私がgmailで7月に送ったある作品は届いていなかったらしく
その後gmailでないアドレスから送り直したよ。
同じく7月にgmailから送った他の作品はちゃんと届いていたんだけど。
gmailの不具合なのか点検作業が大変なのかこちらは判断がつかないから、青空文庫用のやり取りにgmail を使うこと自体をやめたな

704 名前:無名草子さん [2022/11/26(土) 12:13:09.37 .net]
システムから受け取り確認の自動返信をもらえるようになると安心なんだけど

705 名前:無名草子さん [2022/11/26(土) 15:07:24.68 .net]
申請メールが多すぎてスパムに埋もれてしまってるんだろうね、きっと

706 名前:無名草子さん mailto:sage [2022/11/27(日) 13:24:55.01 .net]
スパムに埋もれるとはつまりランチョンミートに埋もれるということか
なかなか羨ましい状況にも思える

707 名前:無名草子さん mailto:sage [2022/11/27(日) 22:01:52.11 .net]
最近校了のペースより作品公開のペースのほうが早そうなんだけど、ストックがゼロになったことって今まであるんかな

708 名前:無名草子さん mailto:sage [2022/11/27(日) 22:36:45.22 .net]
公開ペースを一定にする(毎日なにかしらが公開されるという魅力を持たせる)ためにストックするのは
なにか商業主義的駆け引きを感じて自分としてはあまり好ましく思っていない

そもそも毎日新作?を楽しみにしている層と
そんなこと関係なく必要に応じて検索して青空文庫に公開されてれば嬉しい!という層とでは
後者の方が多いんじゃないかって思うんだよね(個人の感想です)

誕生日や命日まで温存しておかなくたって
完成し次第公開してもらえたほうが
ボランティアも利用者もありがたいと思うのだけどな

709 名前:無名草子さん mailto:sage [2022/11/27(日) 22:47:44.52 .net]
むしろ定期(毎日)更新って公開するための締切を自ら課してるだけじゃないの

パブリックドメインをウェブ上で公開する仕組みも入力や校正のデータも独占・奪取してるわけでもないし
青空文庫での公開の作業を担ってるスタッフだって他の工作員と同様に飽くまでボランティアなんだから
究極的には1年間に1作品以下の頻度の公開でも文句言える立場の人って別に居ないわけで

710 名前:無名草子さん mailto:sage [2022/11/29(火) 22:23:27.41 .net]
公開日を誕生日や命日とかにするのは公平で良いと思う。



711 名前:無名草子さん mailto:sage [2022/11/30(水) 20:13:07.98 .net]
正月公開は何になるのかちょっと楽しみにしてる

712 名前:2022年12月公開予定作品一覧 mailto:sage [2022/11/30(水) 20:28:44.76 .net]
2022-12-01 山本 周五郎『だんまり伝九』
2022-12-02 ホワイト フレッド・M『トリガーセンの妻 コーンウォール物語』
2022-12-03 池田 勇人『政府を拘束しない』※誕生日
2022-12-03 佐藤 春夫『「珊瑚集」解説』※「珊瑚集」著者は永井荷風
2022-12-03 永井 荷風『歓楽』※誕生日
2022-12-03 室生 犀星『〈我が愛する詩人の伝記〉(補遺)』※佐藤惣之助誕生日
2022-12-04 山本 周五郎『伝四郎兄妹』
2022-12-05 作者不詳『現代語訳 平家物語 12 第十二巻』
2022-12-06 時枝 誠記『文学教育と言語教育』※誕生日
2022-12-07 坂口 安吾『光を覆うものなし ――競輪不正事件――』※競輪不正事件の不起訴処分決定が報道される
2022-12-08 山本 周五郎『峠の手毬唄』
2022-12-09 夏目 漱石『三四郎』※命日
2022-12-10 大田 洋子『いまだ癒えぬ傷あと ――放射線火傷で右手をうしなつた木挽きの妻と河原にうつ伏せて死んでいた幼女に――』※命日
2022-12-11 山本 周五郎『初午試合討ち』
2022-12-12 中谷 宇吉郎『日本の将来』
2022-12-13 田山 花袋『晩秋の頃』※誕生日(旧暦)
2022-12-14 尾崎 士郎『生きている忠臣蔵 ――忠臣蔵は何故流行するか――』※忠臣蔵の日
2022-12-15 山本 周五郎『春いくたび』

713 名前:2022年12月公開予定作品一覧 mailto:sage [2022/11/30(水) 20:29:06.29 .net]
2022-12-16 グリム兄弟『天国へいった仕立屋さん』※ヴィルヘルム・グリム(弟)命日
2022-12-17 山本 周五郎『梟谷物語』
2022-12-18 佐藤 春夫『愉快な教室』
2022-12-19 山本 周五郎『武道宵節句』
2022-12-20 小泉 八雲『お貞のはなし』※翻訳者(田部隆次)命日
2022-12-21 山本 周五郎『蒲生鶴千代』
2022-12-22 柳田 国男『私生児の方言』
2022-12-23 徳田 秋声『青い風』『閾』※誕生日(旧暦)
2022-12-24 ドストエフスキー フィヨードル・ミハイロヴィチ『クリスマスと結婚式 ――無名氏の手記より――』※クリスマスイブ
2022-12-25 矢内原 忠雄『イエス伝 マルコ伝による』※命日
2022-12-26 菊池 寛『たちあな姫』『世に出る前後』※誕生日
2022-12-27 山本 周五郎『半化け又平』
2022-12-28 作者不詳『現代語訳 平家物語 13 灌頂の巻』
2022-12-29 三木 露風『明治詩壇の回顧』※命日
2022-12-30 横光 利一『自慢山ほど』※命日
2022-12-31 寺田 寅彦『宇宙の二大星流』※命日
2022-12-31 中谷 宇吉郎『「寺田寅彦の追想」後書』

714 名前:無名草子さん mailto:sage [2022/11/30(水) 20:48:32.46 .net]
新年の挨拶とかお正月に関するエッセイとかを入力すると1月1日に公開されるかな?

715 名前:無名草子さん mailto:sage [2022/11/30(水) 22:01:41.61 .net]
尾崎士郎訳の平家物語は年内に全編公開か

716 名前:無名草子さん mailto:sage [2022/12/03(土) 20:06:34.95 .net]
山周率9/31

717 名前:無名草子さん mailto:sage [2022/12/03(土) 21:12:58.55 .net]
作家別校了作品の比率から妥当かどうか検討してみてよ

718 名前:無名草子さん mailto:sage [2022/12/03(土) 22:38:10.19 .net]
妥当じゃなかったとして別に問題ない

719 名前:無名草子さん mailto:sage [2022/12/03(土) 23:30:12.99 .net]
作業数多いがゆえに校了して結構経ってるのに公開されてない作品を見るとなんかこの「間」もったいねえなと思うこともあるからガンガン公開して言ってほしい
一時期同じ作家の公開が続いたって無限に作品があるわけじゃないからいずれなくんだしなる

720 名前:無名草子さん mailto:sage [2022/12/04(日) 03:37:45.27 .net]
ガンガン公開しろってガンガン公開準備しろってことになると思うけどそんな厚かましいこと言うほど何か貢献してんの?



721 名前:無名草子さん mailto:sage [2022/12/04(日) 08:46:28.56 .net]
少なくとも毎月毎月「山周ばかり」って文句いうよりはいいと思う

722 名前:無名草子さん mailto:sage [2022/12/04(日) 11:15:21.78 .net]
種類に文句言ってるか量に文句言ってるかという違いだけでどちらも人任せなのは結局同じ
ただし他人により重い負担と労力を課そうとしているのは後者

723 名前:無名草子さん mailto:sage [2022/12/04(日) 13:07:31.33 .net]
>>715
一応14番目の解説もあるけどね

724 名前:無名草子さん mailto:sage [2022/12/04(日) 13:15:21.77 .net]
>>718
割合に応じて案分した結果の数字なのか意図的に配分してるような数字なのか出せって話であって、どっちを選んだら問題あるかないかなんて話はしてないでしょ

725 名前:無名草子さん mailto:sage [2022/12/04(日) 13:25:29.36 .net]
>>719
校了した翌日でも公開は可能な仕組みならともかく校了後ファイルも点検してるって言ってるし、その「間」とやらは作品ごとに差があるとしても公開に必要な期間なのでは?

726 名前:無名草子さん mailto:sage [2022/12/04(日) 13:40:29.22 .net]
いまいち分かってないんですが公開のタイミングって
そもそも誰が決めてるんでしょうか?
校正者の意向なんでしょうか?
誕生日目指して公開できるように頑張るとかの
モチベーションになってるってことであれば意味はあると思うのですが。

727 名前:無名草子さん [2022/12/04(日) 14:13:43.59 .net]
質問させてください
割り注に最大長とかみたいな制約ありますか?

728 名前:無名草子さん mailto:sage [2022/12/04(日) 14:50:35.94 .net]
>>724
いやだから、どっちか数字を出せ!って言われるような潜在的問題はなにもないから、出せって言うなという話でしょ。

729 名前:無名草子さん mailto:sage [2022/12/04(日) 14:57:55.28 .net]
>>727
ここで質問するより点検さんに訊くのが良いと思うよ。
点検さんの手を煩わせるのは申し訳ないと思ってここで訊くのだろうけど、
点検さんとしても訊いてくれたほうが後々の点検が楽になるわけだから、丁寧に質問に答えてくれるよ。

730 名前:無名草子さん mailto:sage [2022/12/04(日) 15:06:44.26 .net]
たしかに電子図書の割注の表示って
結局はユーザの表示する環境次第だから、複数行にわたる長い割注の場合どう表示されるんだろうね

我々の作業ではそこは意識するところではないんだけど

最大長の件、点検さんから答えがあったら、ここで共有してくれると嬉しいが



731 名前:無名草子さん mailto:sage [2022/12/04(日) 15:13:54.09 .net]
>>725
ですね。

公開用XHTMLファイルに変換する作業も人手も必要ですし
出来たXHTMLも公開用サーバに上げるからには表示チェック(校正ほどの厳しい目ではないにしろ通読する)必要もあるんじゃないかと思います。

732 名前:無名草子さん mailto:sage [2022/12/04(日) 15:32:04.09 .net]
あくまで提示されてる情報からの推測だけど、
注記一覧のページを見た限りだと、ルビ、縦中横、行右(左)小書き、上(下)付き小文字、罫囲み、横組み、文字サイズの注記については、
>対象文字が長めの場合や、外字注記が用いられているとき、前方参照型では期待通りに変換されない場合は、始まりと終わりを特定する開始/終了型で、次のように注記してください。
という旨の説明があって、2種類の注記方式を用意してるから、
【[#割り注]○○[#割り注終わり]】だけで【○○[#「○○」は割り注]】みたいな注記を用意していない以上は割り注の注記に文字数の制約はないんじゃないでしょうか

注記一覧 その他 - 青空文庫
https://aozora.gr.jp/annotation/etc.html

733 名前:736 [2022/12/04(日) 15:55:26.44 .net]
まだ入力者登録してないので、点検の方に質問するのは後回しにします。

>>732
やはり制限はなさそうですね。
Windows用ビューワーであるPageOneやOyaziViewerでエラー発生するのは確認しているんですが、青空文庫と関係ない話なので厄介そうです

734 名前:無名草子さん mailto:sage [2022/12/04(日) 22:29:29.61 .net]
二段組に対応してるビューワーってあるんだろうか。
大して調べてるわけじゃないけど二段組は再現できない仕様が多いよね

735 名前:無名草子さん mailto:sage [2022/12/04(日) 23:10:45.47 .net]
>>726
作品の公開日については2020年01月01日のそらもようでちょっと触れてる
https://www.aozora.gr.jp/soramoyou/soramoyou2020.html#000512

736 名前:無名草子さん mailto:sage [2022/12/05(月) 12:45:58.85 .net]
>>735
記念日に公開したいって思惑は分かるんですがそれが校正者の意図なのか
公開者の一存なのかが知りたいです

737 名前:無名草子さん mailto:sage [2022/12/05(月) 16:34:38.57 .net]
>>736
校正者の意図か公開者の意図かという話になれば、それは概ね公開者の意図ということになると思う

ほとんどの作業ボランティアは点検グループの大変さや校正テキストファイルを提出してからその先の時間的長さと人的負担を理解していると思うので、いついつ公開してくれという希望は余程のことがなければ出さない(出せない)と思う

738 名前:無名草子さん mailto:sage [2022/12/05(月) 19:51:55.02 .net]
10校正したら1入稿というような何らかの制限つけたほういいと思う
そうしなきゃ自由気楽にきる入力ばかりやってしまう

739 名前:無名草子さん mailto:sage [2022/12/05(月) 20:01:43.56 .net]
発想面白いね

ただそこは作業者次第よ
だって自分は入力よりずっと校正してたいもん、達成感あるしね

だけど校正は点検グループの手を確実に煩わせるから
今は大量申請できないんだ

740 名前:無名草子さん mailto:sage [2022/12/05(月) 21:38:35.42 .net]
校正は自分の作業が確実に近い未来の公開につながるのが魅力よね



741 名前:青空文庫アクセスランキング [2022/12/05(月) 22:48:09.82 .net]
2022年11月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_11_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_11_txt.html

742 名前:無名草子さん mailto:sage [2022/12/06(火) 09:28:56.97 .net]
10校正したご褒美に1入力だと今の校正待ちが余ってる状態では成り立つけど最終的に校正待ちファイルが枯渇してさらに入力もできなるなるやで

743 名前:無名草子さん [2022/12/06(火) 09:51:09.57 .net]
だが待ってほしい
入力はOCRの仕事で、校正は人間の仕事になるのではないか

744 名前:無名草子さん mailto:sage [2022/12/06(火) 11:40:11.36 .net]
AI様が次世代デジタルライブラリーのocrと国会図書館デジタルコレクションの底本画像を組み合わせて、片っ端から自動で青空文庫注記をつけてくれた上で青空文庫のデータベース上に勝手に登録してくれて、あとは人が校正するだけになったら相当面白いかも

745 名前:無名草子さん mailto:sage [2022/12/06(火) 11:56:22.82 .net]
>>744
OCRの出力結果が正しいかどうか判断するAIが正しいかどうか判断するAIが正しいかどうか判断する人間のひと手間は避けられない

746 名前:無名草子さん mailto:sage [2022/12/06(火) 16:30:09.95 .net]
>>745
ワロタ

747 名前:無名草子さん [2022/12/06(火) 18:07:23.19 .net]
>>741
まさかの山川方夫短編が上位
おそるべしYouTube

748 名前:無名草子さん mailto:sage [2022/12/06(火) 18:28:03.19 .net]
>>747
YouTubeでなにかあったの?

749 名前:無名草子さん [2022/12/06(火) 20:01:42.27 .net]
>>748
YouTubeで、青空文庫の作品を要約してアニメにして紹介してる方が居て、おそらくその影響で上位になったと思われる
個人的に山川方夫さんは好きな作家だから嬉しい

750 名前:無名草子さん mailto:sage [2022/12/06(火) 20:34:11.53 .net]
なるほど、ありがとう
青空文庫をもとに制作しているYouTubeチャンネルも色々あるけど
それきっかけで青空文庫本家にユーザが来てくれるのは嬉しいね



751 名前:無名草子さん mailto:sage [2022/12/08(木) 08:25:05.66 .net]
[第2話]漫古☆知新-バカでも読める古典文学- - 漫☆画太郎 | 少年ジャンプ+
https://shonenjumpplus.com/episode/316190247017199335

図書カード:にんじん (ルナール ジュール)
https://www.aozora.gr.jp/cards/001156/card50658.html

752 名前:無名草子さん mailto:sage [2022/12/08(木) 21:12:39.09 .net]
また読んでしまった

753 名前:無名草子さん mailto:sage [2022/12/08(木) 21:40:46.21 .net]
文字通りオチが秀逸

754 名前:無名草子さん mailto:sage [2022/12/08(木) 21:55:53.15 .net]
解説の温度差よ

755 名前:無名草子さん mailto:sage [2022/12/08(木) 23:37:32.37 .net]
1話目でいつものパターンそのままでいらんと思ったので
今回はつられないぜ

756 名前:無名草子さん mailto:sage [2022/12/08(木) 23:52:03.13 .net]
教養が無いし翻訳作品はあまり読んでないから普通に知らんかった……

757 名前:無名草子さん mailto:sage [2022/12/11(日) 11:58:41.29 .net]
子どもの頃「少年少女世界の名作文学」で「にんじん」を読んで、これは何を伝えたいんだろうと真剣に悩んだ

758 名前:無名草子さん [2022/12/12(月) 00:57:59.07 .net]
あーおーぞーらーうーんーこー

759 名前:無名草子さん mailto:sage [2022/12/12(月) 19:50:19.76 .net]
みんな、今年の工作員ライフはどうだった?

760 名前:無名草子さん mailto:sage [2022/12/12(月) 20:09:45.32 .net]
青空文庫読者なので工作員の悲喜こもごもを楽しく見させていただいております



761 名前:無名草子さん mailto:sage [2022/12/12(月) 20:43:12.02 .net]
ごめん今週活動してないんだ……

762 名前:無名草子さん mailto:sage [2022/12/12(月) 21:02:00.00 .net]
4~5年放置してるやつをどうにかしないと……

763 名前:無名草子さん mailto:sage [2022/12/12(月) 22:59:38.94 .net]
作業申請するタイミングを逃し続けた

764 名前:aozorablog [2022/12/12(月) 23:29:35.92 .net]
青空文庫’22/10月-’22/11月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5121

765 名前:無名草子さん mailto:sage [2022/12/13(火) 06:59:19.63 .net]
「JIS X 0213にはないがUnicodeにある漢字」を左ルビに使えるかどうかはビューワーの実装次第?

766 名前:774 [2022/12/13(火) 07:17:10.22 .net]
Windows用アプリの左ルビ対応状況を調べてみた
[アプリ名(バージョン)] [JIS X 0213に規定された第3第4水準にある漢字] [JIS X 0213にないがUnicodeにある漢字]

えあ草紙(ver1.3.0) OK OK
PageOne(ver4.00) OK NG
OyaziViewer(ver2.6.5.0) NG NG

767 名前:774 mailto:sage [2022/12/13(火) 11:17:35.42 .net]
PageOneはU+1F130からU+1F189までの四角囲みアルファベットを表示できないっぽい

768 名前:無名草子さん mailto:sage [2022/12/13(火) 15:02:34.25 .net]
そらもようにあった25周年記念のイベント?ってまだ期待してでもいいのかな

769 名前:無名草子さん [2022/12/15(木) 08:55:50.81 .net]
UTF-8に移行すれば、難しい字句のWeb検索で青空文庫のhtmlファイルがヒットする確率があがるんだが

770 名前:無名草子さん mailto:sage [2022/12/15(木) 09:06:48.29 .net]
だからずっとutf-8に移行して欲しいってずっと言ってきてる訳ですが
逆にsjisにこだわってる理由があるなら教えて下さい



771 名前:無名草子さん [2022/12/15(木) 09:18:08.46 .net]
中途半端に漢字をJIS X 0213の異体字に置き換える行為って、善意のようにみえて実は作品を蹂躙してるのと同じなんだよなあ
怖いよ、善意の破壊者

772 名前:無名草子さん mailto:sage [2022/12/15(木) 09:30:25.20 .net]
>>771
萩原朔太郎が「ローマ字論者への質疑」で
蝶は「てふ」でなくしてはならないなんていってるけど
現在の日本で蝶と「てふ」として読む日本人が果たして何人いるのか?
言葉は時代とともに移り変わっていくものであり
より良いものが提示されてるのに、検討もされないで思考停止してるのは
残念としか思えない。

773 名前:無名草子さん mailto:sage [2022/12/15(木) 09:38:55.13 .net]
そもそも今のコメントで引っ張ってくる漢字がutf-8の文字なら
そこにひと手間かける意味は何なんでしょうかと小一時間問いただしたい

774 名前:無名草子さん [2022/12/15(木) 09:39:55.43 .net]
>>772
それだと、底本がどんな表現を使っていたかを知りたい、流行の変遷を知りたい、っていう需要に答えられないんだよね
電子化テキストのほうで勝手に情報を捨てたら、復元できないわけで

775 名前:無名草子さん [2022/12/15(木) 09:41:42.08 .net]
「言葉は時代とともに移り変わっていく」のなら、なおのこと勝手にその時代の情報を捨てたらダメでしょ
著作権が切れてるのを良いことに踏みにじりまくってるね
怖いよ、善意の破壊者

776 名前:無名草子さん [2022/12/15(木) 09:46:22.75 .net]
なまじ外字フォントやら注記で置き換えられているのは、がんばれば元のデータを復元できる
問題は、勝手にJIS X 0213に収まる異体字に置き換えてしまうケース
復元できないんだから、文化大革命も同然だよ

777 名前:無名草子さん [2022/12/15(木) 09:55:29.39 .net]
スペインでキリストのフレスコ画をムンクのような絵に変えた事件あったじゃん?もう10年経ってたね


世界中で話題になった「おばあちゃんによる最悪の芸術品修復」から10年、町とおばあちゃんに起こった変化とは? - GIGAZINE
https://gigazine.net/news/20220818-ecce-homo-worst-artistic-restoration/

778 名前:無名草子さん [2022/12/15(木) 09:59:14.96 .net]
さて思考停止しているのはどっちかな

779 名前:無名草子さん [2022/12/15(木) 10:22:13.21 .net]
「諭」(「言+兪」, U+2F9D0)はわりとよく見かけると思うんだが、包摂適用で「諭」にしていいか議論の余地がある。
ちなみにWindows環境だと、Meiryo UIフォントとか使わないと「諭」(「言+兪」, U+2F9D0)は表示できないので不便。

780 名前:無名草子さん mailto:sage [2022/12/15(木) 10:29:38.40 .net]
これと萩原朔太郎の言をを一緒にするのは流石におかしい。
その時代の異字体を大切にしたいなら、その方向での注釈をつけるべきで
utf-8の字体を全面的に拒む理由にはならない。
今後も機会あるごとに青空文庫のユニコード化は訴えっていこうと思います。



781 名前:無名草子さん [2022/12/15(木) 10:46:40.91 .net]
共産主義者が多いのかな、青空文庫の利用者って
賢いフリするのが好きなだけで頭悪そうな感じ

782 名前:無名草子さん [2022/12/15(木) 10:49:00.00 .net]
Google先生に拾ってもらえなくなったらおしまいだよ

783 名前:無名草子さん mailto:sage [2022/12/15(木) 10:49:52.06 .net]
頭悪いは否定しませんが頭悪くっちゃ青空文庫利用しちゃいけないんですか?
というかワッチョイつけて欲しい

784 名前:無名草子さん [2022/12/15(木) 11:04:49.43 .net]
>>769 以降の書き込みは、>>770,772,773,780,783 以外全部同じ人だよ
書いた本人が言うんだから間違いない

外字フォントや注記のままだと、いつまでたってもGoogle先生を始めとするWeb検索エンジンに拾ってもらえない。
Unicode化をぜひやってもらいたい。

785 名前:無名草子さん mailto:sage [2022/12/15(木) 11:36:23.23 .net]
>>770,772,773,780,783 は全部自分なんで、結局二人で言い合ってたわけかorz
この話題は広く議論してもらって、できるならutf-8化の方向で前に進めてもらいたいです。

786 名前:無名草子さん mailto:sage [2022/12/15(木) 12:02:59.56 .net]
突然始まって唐突に終わった気がする
とにかく何が言いたいかというと屁のツッパリはいらんですよ

787 名前:無名草子さん mailto:sage [2022/12/15(木) 12:30:53.15 .net]
普通に名前欄使えばいいのに

788 名前:796 mailto:sage [2022/12/15(木) 12:36:25.66 .net]
仮名遣いはともかく、漢字に関しては出版社や印刷所や編集者の都合なり意向なりでいくらでも変わるし変えざるを得ないので異体字の包括表記はそこまで重要ではないと思う
それでもなお必要と思うなら「自分でやれば?」って感じ
自分でサイト作らなくてもWikisourceとかがあるしね

789 名前:無名草子さん mailto:sage [2022/12/15(木) 12:53:07.17 .net]
包摂適用についてはまあその通りで実用に問題ないレベルだと思う
じゃないと今まで放置されてない

790 名前:無名草子さん mailto:sage [2022/12/15(木) 17:06:07.13 .net]
正直自分はUTF-8に対応してくれたほうが嬉しいけど
そもそも現状の青空文庫一強みたいな風潮も変だし、違うアーカイブがもっと増えてもいいんだよねぇ
自分も青空文庫用に作った作品ファイルを自サイトで公開してるけど、その時は極力字を底本通りに直してるわ



791 名前:無名草子さん mailto:sage [2022/12/15(木) 17:11:03.93 .net]
単に電子テキストをアーカイブ化したいって言うなら、青空文庫で入力校正の手続きを踏むより

電子テキストをepub形式にしてKDPやkoboで出版→国会図書館の電子書籍納本、とかのが一人で完結するし手っ取り早いかもしれない

792 名前:無名草子さん [2022/12/15(木) 17:40:59.57 .net]
青空文庫は今のSJIS仕様のままだと、鬼門・地雷原ともいうべき旧字の多い作品の入力校正を皆が避けるようになってしまうから、良くないんじゃないかな

793 名前:無名草子さん mailto:sage [2022/12/15(木) 22:43:06.96 .net]
字形や表記にこだわる人は編集行為を嫌悪していると思う。
しかし編集があるから本になるし青空文庫にも載る。
包摂適用も編集行為のうちで、問題があるとは思わない。

794 名前:無名草子さん mailto:sage [2022/12/15(木) 22:58:32.39 .net]
本当にこの件を議論したい(動かしたい)ならば
ここより、そらもようでコメントしたほうが現実的かもね。
別にここではその話するなって意味じゃないよ。
いろんな考え方聞けて面白い

795 名前:無名草子さん mailto:sage [2022/12/15(木) 23:15:37.47 .net]
極稀に直筆原稿複写版の本あるよね

796 名前:無名草子さん mailto:sage [2022/12/15(木) 23:44:46.92 .net]
包摂適用はやむを得ずそうしてるだけで
青空文庫の基本的なスタンスは底本の尊重にあると思ってるから
SJISよりUTF-8のほうがそのスタンスにかなうならそうした方がいいとは思う
でも結局UTF-8にしたところですべての漢字が表示できるわけではないから、どこかで妥協する必要があるのは同じなのよね

運営も割と長年このことは議論してるんじゃなかったっけ
今のところSJISで行くんだろうけど、そのうちUTF-8対応になっても驚きはしないかな

797 名前:無名草子さん mailto:sage [2022/12/15(木) 23:56:12.80 .net]
青空文庫とShift_JISとUnicodeの関係については前スレでもちょっと話してたね

https://mevius.5ch.net/test/read.cgi/books/1556609356/778
https://mevius.5ch.net/test/read.cgi/books/1556609356/779

798 名前:無名草子さん mailto:sage [2022/12/16(金) 00:07:35.72 .net]
https://forest.watch.impress.co.jp/docs/bookwatch/digipub/1090529.html

「質疑応答では、青空文庫のデータにはシフトJISコードが用いられているため、海外の方がファイルを開くと文字化けしてしまうなどの問題が指摘された。Unicodeを採用すると、旧字をどうするか? などのルール変更が必要なので、これからの青空文庫の課題として考えていきますという回答がなされた。」

2017年の講演でこういう話は出てるから、運営もSJISのままでいることが最善最適とは思っていないとは思う。だからって将来的に変わるかどうかまではわからないけど。

799 名前:無名草子さん [2022/12/16(金) 06:23:38.82 .net]
>>793
誰も編集を嫌悪してなどいない
工作員が無難に編集できる作品しか選べない現状の仕様が問題なんだよ
熟練の工作員ほど無意識のうちに避ける習慣ができてしまっている

800 名前:無名草子さん [2022/12/16(金) 06:40:18.78 .net]
底本のある文字を青空文庫で利用可能な異体字に変えた場合は、変えたことを認識できる仕組みがないと、情報を捨てる破壊行為に貢献する皮肉な結果になる
たとえそれが善意だったとしても



801 名前:無名草子さん [2022/12/16(金) 07:00:36.70 .net]
モリカケ問題からもわかるように、改ざんしたことではなく改ざん履歴が失われることが問題の本質

802 名前:794 mailto:sage [2022/12/16(金) 08:58:58.18 .net]
>>794
そらもようにコメントつけられるんですか?
青空文庫の将来について一番活発かつオープンに議論できる場って
ここだって思ってるんですが他にもアプローチの仕方があるなら
教えて欲しいです

803 名前:無名草子さん mailto:sage [2022/12/17(土) 13:57:35.88 .net]
包摂適用による字の改変が問題なら今まで包摂適用してた字も外字扱いにして注記でなんとかすれば文字コードのシステム変えなくても対応はできるな(工作員の作業量は増える)

804 名前:無名草子さん mailto:sage [2022/12/17(土) 17:47:57.67 .net]
そこまで厳格にしていくと「そもそも(複数ある場合に)その底本の選別は正しいのか」という問題にまで発展していく
少なくとも現時点で青空文庫に収録されてる作家のほとんどは直筆原稿がオリジナルであって、初出誌の時点で多かれ少なかれ出版用に改変されたものでしょ
それで活字状態のオリジナルとして初出誌に限定しようとしても誤植のリスクがあるし全ての作品で直筆原稿まで直接確認できるとは限らない

805 名前:無名草子さん mailto:sage [2022/12/19(月) 12:41:23.39 .net]
話題に上がりさえしない変体仮名

806 名前:無名草子さん mailto:sage [2022/12/19(月) 12:46:43.46 .net]
尾崎紅葉 鬼桃太郎

807 名前:無名草子さん [2022/12/21(水) 17:42:59.41 .net]
>>805
話題にすればいいじゃない

ついでなので関連質問させてください
青空文庫・外字注記辞書【第八版】にある、合字の「シテ(U+2CF00)」は、本来は「〆(U+3006)」とは別のものらしいんだけど、青空文庫では同じ?

808 名前:無名草子さん mailto:sage [2022/12/21(水) 19:40:33.38 .net]
確かに外字注記辞書では

※[#シテ]〆 入力可能

となってるけど
ウィキペディアでは混同されてるけど別物と説明されてるな

して - Wikipedia
https://ja.wikipedia.org/wiki/%E3%81%97%E3%81%A6

809 名前:無名草子さん mailto:sage [2022/12/21(水) 19:52:47.49 .net]
※「シテ」「トモ」の合字は、仮名にあらためました。

図書カード:蟻説 (高木 貞治)
ttps://www.aozora.gr.jp/cards/001398/card53028.html

※「シテ」の合字は、仮名にあらためました。

図書カード:北越雪譜 (鈴木 牧之 山東 京山)
ttps://www.aozora.gr.jp/cards/001930/card58401.html

合字を仮名に改めるパターンが少ないから〆で代用してるのかね
代用というか誤字だろうけど

810 名前:無名草子さん [2022/12/22(木) 12:54:41.67 .net]
2023年1月1日に1927年以降の著作物がアメリカのパブリックドメインに、「シャーロック・ホームズ」短編集・映画「メトロポリス」・ヒッチコック作品などなど - GIGAZINE
ttps://gigazine.net/news/20221221-public-domain-from-2023/

Public Domain Day 2023 | Duke University School of Law
ttps://web.law.duke.edu/cspd/publicdomainday/2023/



811 名前:そらもよう [2022/12/23(金) 07:38:46.52 .net]
2022年12月23日 青空文庫の新サーバーおよび新システムの導入に際しての充電期間の設定について
https://www.aozora.gr.jp/soramoyou/soramoyouindex.html

812 名前:無名草子さん [2022/12/23(金) 10:38:23.94 .net]
入力申請は今年中に、ということかな

813 名前:無名草子さん mailto:sage [2022/12/23(金) 12:30:33.73 .net]
いやもう送るなよ

814 名前:無名草子さん [2022/12/23(金) 13:06:41.82 .net]
別にいいんじゃないの、来年の1月1日からだからまだ間に合う
ダメだったらダメって書くだろうし

815 名前:無名草子さん [2022/12/23(金) 15:51:48.65 .net]
1月1日から新プロジェクトに本腰入れたいって話だろうから、
今から受付作業が来年へずれ込む程の大量申請が押し寄せたら意味がないよ

816 名前:無名草子さん mailto:sage [2022/12/23(金) 20:50:51.07 .net]
>>811
わらった。
事業は休んだら終わり。このまま無くなるだろうに1ユーロ。

817 名前:無名草子さん mailto:sage [2022/12/23(金) 21:13:50.45 .net]
休んでないわけだが

818 名前:無名草子さん mailto:sage [2022/12/23(金) 21:15:21.00 .net]
>>814
ダメだったらダメって書く
じゃなくて
申請は年内にお早めにって書いてない
って解釈しなよそこは

819 名前:無名草子さん mailto:sage [2022/12/23(金) 21:27:00.94 .net]
新たな特務チームってどんなんだろうな。
したっぱ新入り工作員だからノウハウ教えてもらえるならありがたい

820 名前:無名草子さん [2022/12/23(金) 21:28:38.48 .net]
出す・・・・・・!出すが・・・・・・今回まだその時と場所の指定まではしていない
そのことをどうか諸君らも思い出していただきたい つまり・・・・
我々がその気になれば金の受け渡しは10年20年後ということも可能だろう・・・ということ・・・・!



821 名前:無名草子さん mailto:sage [2022/12/24(土) 01:11:28.33 .net]
運営が「通常の作業ペースが保てなくなっている」って訴えるほどだから
もう申請しないほうがいいんじゃないの

822 名前:無名草子さん mailto:sage [2022/12/24(土) 01:47:55.36 .net]
>>814
1月1日に言えば済むことをわざわざ1週間前に色々と事情を説明して通告してる時点で気付けよ

823 名前:無名草子さん mailto:sage [2022/12/24(土) 02:13:21.27 .net]
>>822
1月1日直前までは受け付けるってことだよ

824 名前:無名草子さん mailto:sage [2022/12/24(土) 02:51:06.39 .net]
受け付ける(1年間放置)

825 名前:無名草子さん mailto:sage [2022/12/24(土) 03:18:01.92 .net]
そらもようで告知を出す前に届いた申請やファイルの処理の途中で今年が終わるだろうから、1日で点検と公開準備が終わるような短編の校了作品が駆け込みで届けば来年の公開作品が増やせてラッキー、くらいの猶予期間でしょ

それこそ現状では対応が間に合わないとちゃんと言ってるし、12月31日までに全部対応するとは言ってないんだから、他は放置でも全く問題ない

826 名前:無名草子さん [2022/12/24(土) 06:21:04.28 .net]
入力申請は他の人と被らないようにする宣言みたいなもんだから、ひとりで長編作品とかやるつもりならちゃんと入力申請しとけばいいと思うよ

827 名前:無名草子さん mailto:sage [2022/12/24(土) 13:06:04.92 .net]
今年工作員になったんやけど今思えば滑り込みでいろんな作業やれたんやなと思う
休止期間の特務チームって教育係みたいなのがつくのかな。年明けの詳細が気になる

828 名前:無名草子さん mailto:sage [2022/12/24(土) 13:06:13.13 .net]
>>819
自分の知識のためだけで
組織のために働けない冷やかしならやめて欲しい

829 名前:無名草子さん mailto:sage [2022/12/24(土) 13:29:48.34 .net]
工作員やってる時点で「自分の知識のためだけ」ではないやろ
青空文庫のノウハウとか青空文庫以外では使おうにも使えないし
なんでかここもギスギスしてるね。急な発表だったからかな

830 名前:無名草子さん mailto:sage [2022/12/24(土) 13:36:05.06 .net]
特務チームのことを読んで最初に思ったのがそれなんだよ

受付点検グループへの門戸はずっと開かれていたんだよ、今までも
でも叩くものが(多分ほとんど)いなかった

それを特務チーム結成と聞いてガヤガヤと集まる人々にどれだけの熱意と継続力があるのか
鍛えるだけ鍛えたチームメンバーがある日突然なしのつぶてじゃ、組織のためにならない

滅私奉公で名前も知られず継続的に仕事をしている点検グループ
興味は持ったけど内容を聞いてやっぱり自分には無理です、とはっきり辞退するならいいが
頭数だけ増えて幽霊メンバーじゃ意味ないから
加わるならしっかり責任もって加わりたい



831 名前:無名草子さん [2022/12/24(土) 13:36:37.87 .net]
【3回目】 追加接種 =⇒ 死者増加 【4回目】
//kizuna.5ch.net/test/read.cgi/hikky/1667019659/l50
https://o.5ch.net/204mv.png

832 名前:無名草子さん mailto:sage [2022/12/24(土) 13:38:31.87 .net]
>>829
自分の作業のしやすさだけ
と置き換えると解ると思う

833 名前:無名草子さん mailto:sage [2022/12/24(土) 13:42:31.60 .net]
第一現役工作員自体がそんなに居ないんだからガヤガヤ集まるというほど集まりはしないだろう
そこまでの熱意ある人だけじゃ先細るから裾野を開くためにこういうことしてるんじゃないかと思ったけどな。

834 名前:無名草子さん mailto:sage [2022/12/24(土) 13:45:12.97 .net]
むしろただ門を開いてるだけじゃ入らないからこそ改めて宣伝してるんでしょ

835 名前:無名草子さん mailto:sage [2022/12/24(土) 13:55:05.66 .net]
ギスギスも何も、「もう手が回らないので来年から休みます」って年末になってようやくNOやSOSを言えるようになった人に対して「今年はまだ残ってるな」で相手に負担をかけようとするのは、単純にブラック企業顔負けの発想過ぎるし、それに対して批難する奴が出るのは自然の流れだと思う

836 名前:無名草子さん mailto:sage [2022/12/24(土) 14:07:38.90 .net]
それなオブそれな

837 名前:無名草子さん mailto:sage [2022/12/24(土) 14:32:43.32 .net]
好きにすりゃいいさ
そもそも金は絡まず名前が付くという名誉しかないんだ

838 名前:無名草子さん mailto:sage [2022/12/24(土) 14:43:16.11 .net]
点検さんはそれ(名前がつく名誉)すらないのにやってくれてるのに

839 名前:無名草子さん mailto:sage [2022/12/24(土) 14:44:54.91 .net]
金が絡まなきゃ好きに振る舞っていいわけじゃない

840 名前:無名草子さん [2022/12/24(土) 14:49:15.02 .net]
>>835
一個人が運営してるわけじゃないので、そんな配慮は無用だよ
なんか勝手に青空文庫の管理グループを一個人に人格化してる人いるみたいだけど、
むしろそういう人は自身の心の病気を疑ったほうがいい。自己投影なのかもしれんが



841 名前:無名草子さん [2022/12/24(土) 14:52:00.41 .net]
マナー奉行みたいな書き込みしてる人、心病んでるんじゃないの?マジで

842 名前:無名草子さん mailto:sage [2022/12/24(土) 14:58:49.09 .net]
>>839
常識はずれがタマにこうして現れるから
電子レンジでネコを乾燥させないでくださいとか取説に書く必要があるんだな
日本人でもこうした程度が低いやつが現れると困る

843 名前:無名草子さん mailto:sage [2022/12/24(土) 15:01:14.13 .net]
>>838
客観的に見て作業の大変さは点検の方だから連名したらと思うが
どの程度点検してるのかわからないから難しそう
自己申告系はほんま難しいな

844 名前:無名草子さん [2022/12/24(土) 15:02:19.75 .net]
好きに振る舞っているのはむしろ青空文庫のほうなんだが
なんか教祖を擁護するM信者みたいな書き込みしてる人、マジでヤバい

845 名前:無名草子さん mailto:sage [2022/12/24(土) 15:04:14.59 .net]
>>844
暖簾に腕押し見たいな何言ってるのかわからん
ある意味白昼夢みたいな主語置いてきぼりな言葉はこのスレに合いませんよ

846 名前:無名草子さん [2022/12/24(土) 15:06:14.95 .net]
未着手タスクの山になっても平然としていられるような手合いが青空文庫の中の人たちなんだが、
なんかこのスレに忖度要求を書き込む人は、自分が繊細だから青空文庫の中の人も繊細なはず、と勝手に思い込んでてキモイ

847 名前:無名草子さん mailto:sage [2022/12/24(土) 15:31:06.11 .net]
青空文庫の中の人たちを直接的に知ってて言ってるのかイメージで言ってるのかが気になるところ

848 名前:無名草子さん mailto:sage [2022/12/24(土) 15:38:44.43 .net]
>>846
平然としてると思ってるのか……
それこそ自分の面の皮が厚いから
中の人も厚いはずと思ってるのね

849 名前:無名草子さん [2022/12/24(土) 15:47:23.15 .net]
>>848
入力者への影響が大きい「充電期間の設定」の告知をわずか1週間前に行うくらいだから、中の人はメンタル強者そのものだよ
中の人だけじゃなく入力者もボランティアなわけで、それをわかったうえでやるのだから

850 名前:無名草子さん mailto:sage [2022/12/24(土) 15:50:01.66 .net]
まぁ一般工作員にとっては点検作業や点検グループって謎な部分は大きかったから
休止期間の施策として点検について教えてくれるならありがたい話だな
点検グループにとって何が迷惑で迷惑じゃないのかとかは想像するしかない部分も多いし
点検グループに回らない工作員にとっても、点検グループがどんなふうに作業を回してるのか分かれば気を遣いやすくなると思う



851 名前:無名草子さん mailto:sage [2022/12/24(土) 15:51:48.88 .net]
>>840
むしろ集団が分担してやってるのに全然間に合ってないんだから個人でやってるより問題は深刻だろ

852 名前:無名草子さん [2022/12/24(土) 15:57:09.43 .net]
>>851
いきなり倒産を発表する企業とかはまさにそんな感じだね

853 名前:無名草子さん mailto:sage [2022/12/24(土) 16:00:08.00 .net]
そもそも「大量申請は控える」って公式に明文化されていますし
無視するわけにいかんでしょ

854 名前:無名草子さん mailto:sage [2022/12/24(土) 16:01:01.87 .net]
正直年単位で参加しててここ半年くらいにも連絡を取った工作員なら何となく運営チームが限界を迎えてそうという察しはついてたよな

855 名前:無名草子さん [2022/12/24(土) 16:09:17.33 .net]
突如夜逃げして債権者に迷惑かける人を面の皮が厚いとみなすかどうかだね
夜逃げした本人は面の皮が厚いとは思っておらずむしろ、自己憐憫してたりする

856 名前:無名草子さん [2022/12/24(土) 16:17:08.82 .net]
そもそも青空文庫は紙の出版物と違ってWebなのだから公開しながら適宜修正していけるはずなんだよ
点検グループはなにを点検しているのか、という話にもなるわけで

857 名前:無名草子さん [2022/12/24(土) 16:22:37.48 .net]
テキストファイルの管理はGithubでしてPR受け付ければよくね?、みたいな話は出てこないもんなのかな
中の人の思考様式が、時代遅れになってないか?

858 名前:無名草子さん mailto:sage [2022/12/24(土) 17:01:08.51 .net]
>>856
「とりあえず公開して、間違いや不備に気付いた段階で適宜修正すればいい」という手法の妥当性や有効性はWikipedia見てたら何となくは分かると思うけど

859 名前:無名草子さん [2022/12/24(土) 17:16:06.41 .net]
>>858
Wikipediaは誰でも彼でも書き換えできてしまうので論外
修正を受理するか確認できるGithubのPR(Pull Request)機能を使えばそういった問題は起きない

時代遅れな人は時代遅れであることに気づけない

860 名前:無名草子さん mailto:sage [2022/12/24(土) 17:21:16.03 .net]
どこかでgithub自体がもはや時代遅れって見て
一時は真面目に学んでみようかなんて思ってた気持ちが
一気に萎んだんですが実際のところはどうなんでしょうか?



861 名前:無名草子さん [2022/12/24(土) 17:25:42.33 .net]
Githubを使えば、一般ユーザーは管理者ユーザーから修正内容を却下されてもめげずに独自に修正作業しつづけることができる
このプログラミング業界のソース管理技術を青空文庫が応用しない手はないよ
バックアップや履歴管理の負担はかなり減るからね

たぶん充電期間に、そういう話されるはず、と思いたい

862 名前:無名草子さん [2022/12/24(土) 17:43:48.29 .net]
>>860
Githubが時代遅れという情報源はどこでしょうか
いまやマイクロソフト社までもがGithub使っています
個人的には、有力な代替手段が見つからないうちはGithubは時代遅れではないと思いますよ

863 名前:無名草子さん mailto:sage [2022/12/24(土) 17:47:58.58 .net]
どなたもメリークリスマス
来年は吉報があるよ

864 名前:無名草子さん mailto:sage [2022/12/24(土) 17:50:38.43 .net]
>>856
点検グループは情報や権利の正当性も合わせてチェックしている
ただ底本にそったテキストを作るだけのわれわれとは作業の性質が違うのだからそんな風に言わないで欲しい

865 名前:無名草子さん [2022/12/24(土) 18:07:45.21 .net]
>>864
点検グループへの同情や忖度なんて一切必要ない
点検グループが作業を可視化しければ、無能な貴族呼ばわりされる。それだけ

866 名前:無名草子さん mailto:sage [2022/12/24(土) 18:13:12.88 .net]
>>859
それを公開前に前倒しで全文を対象として1回やってるのが今の「公開前に入力者と点検者以外による校正作業を入れる」という手法だよね
それでも漏れがあるから誤植があったら底本の画像付きで連絡くれって言ってるんだし

867 名前:無名草子さん mailto:sage [2022/12/24(土) 18:44:43.17 .net]
>>865
点検作業で何をしているかについては既に可視化されてるけどね
相手が情報を公開しても確認しない調べもしない人は何て呼ばれるのかな?

青空文庫はこうやって運営され、こうやって活用されてます - 鷹野凌のデジタル出版最前線 - 窓の杜
ttps://forest.watch.impress.co.jp/docs/bookwatch/digipub/1090529.html

青空文庫20周年記念シンポジウム「青空文庫の今とこれから」:チュートリアルセッション 青空文庫の仕組みとボランティア入門 - YouTube
ttps://www.youtube.com/watch?v=0VW7HG-vQlY

青空文庫20周年記念シンポジウム「青空文庫の今とこれから」
ttps://www.aozora.gr.jp/houkokusyo/aozora20anniv.html

868 名前:無名草子さん [2022/12/24(土) 18:52:18.97 .net]
>>867
言葉遊びしたいの?
スローガンを見せることが可視化ではないよ
日々の点検の進捗を可視化しなければ意味がないでしょ

869 名前:無名草子さん mailto:sage [2022/12/24(土) 18:56:18.53 .net]
>>868
こっちの話?

青空文庫の作業状況
https://yozora.main.jp/inp/index.html

870 名前:無名草子さん mailto:sage [2022/12/24(土) 19:49:20.25 .net]
言うほどスローガンか?



871 名前:無名草子さん mailto:sage [2022/12/24(土) 19:49:43.59 .net]
アプリ開発できるような人が参加してくれると良いな
それか
青空文庫アプリ会社に向けて文字ミス通報機能追加してもらうとか
こういうのを読者にも頼めればずいぶん楽になると思う

872 名前:無名草子さん mailto:sage [2022/12/24(土) 19:50:25.73 .net]
ミス
青空文庫アプリ会社 → 青空文庫対応アプリ開発者

873 名前:無名草子さん mailto:sage [2022/12/24(土) 20:17:07.54 .net]
>>862
github でググった時に検索候補に危険性って出てきて
記事を読んでる中にそのようなことが書かれてたんです
便利そうで覚えたいと思っていたのですが

874 名前:無名草子さん [2022/12/24(土) 21:14:52.54 .net]
>>869
「入力予約」の状態ってどうなってんの?

入力予約 : 3件
2008年:1件
2003年:1件
2002年:1件

875 名前:無名草子さん mailto:sage [2022/12/24(土) 21:42:14.76 .net]
そうなってるんだよ

876 名前:無名草子さん mailto:sage [2022/12/24(土) 21:46:58.74 .net]
>>852
状況としてはこれに近いと思う
厳密に言うと青空文庫は本の未来基金とかもあって経済的には一応余裕があるけど運営の人手が圧倒的に足りないというのが根本的な問題だから倒産(≒サイト閉鎖)の危機はないんだが

877 名前:無名草子さん mailto:sage [2022/12/24(土) 21:47:04.84 .net]
校了後が長すぎる作品についてはどういう理由があるのか疑問視する意味はあるが
ほかのステイタス、それも著作権切れ延長に係るような作家作品でもないのなら、想像するだけ無駄

878 名前:無名草子さん mailto:sage [2022/12/24(土) 21:53:10.78 .net]
少なくとも2010年以前に校了状態になってる作品は公開前までに共著者や戦時加算の都合で著作権法保護期間中と判明されてるものだよ
それ以降は公開準備中のものと法改正で保護期間延長になったものが入り交じってる

879 名前:無名草子さん mailto:sage [2022/12/24(土) 21:58:41.09 .net]
>>878
だったよね。

ほかのステイタスについては個人か運営の都合としか言えない。

誰かが代打を申し出ることはできるし、長期放置が気になるなら代わってあげてもいいんじゃ?

二十年も前となると可能性としては本人さんが存命かどうかも疑わしい。
青空文庫の歴史が長くなればこれからこういうことは増えていくと思う。

880 名前:無名草子さん mailto:sage [2022/12/24(土) 22:09:42.59 .net]
冗談じゃなくてNPO法人化した方が良いともう



881 名前:無名草子さん [2022/12/24(土) 22:36:33.00 .net]
とりあえずマナー奉行と忖度強要奉行は全員氏んでくれ

882 名前:無名草子さん mailto:sage [2022/12/24(土) 22:39:47.34 .net]
>>881
とっくに引っ込んでるものを蒸し返すな

883 名前:無名草子さん mailto:sage [2022/12/24(土) 22:58:33.72 .net]
忖度したら死ぬのか
忖度に親を殺されたのか
ってくらいの憤怒

884 名前:無名草子さん mailto:sage [2022/12/24(土) 23:13:18.68 .net]
来年の公開頻度は毎週日曜日くらいになるのかな

885 名前:無名草子さん mailto:sage [2022/12/24(土) 23:20:13.77 .net]
お正月特別公開とかあんのかな

886 名前:無名草子さん mailto:sage [2022/12/24(土) 23:43:11.07 .net]
入力予約は昔の制度っぽいけどサイト内検索してもいまいち分からんな

887 名前:無名草子さん [2022/12/25(日) 00:18:57.77 .net]
質問です
なり、ナリの仮名、青空文庫・外字注記辞書(大八版)には見当たらないようなのですが、ご存じの方いませんか?

なり (仮名) - Wikipedia
https://ja.wikipedia.org/wiki/%E3%81%AA%E3%82%8A_(%E4%BB%AE%E5%90%8D)

888 名前:896 [2022/12/25(日) 00:20:50.03 .net]
URLが間違っていたみたいなので張り直し

なり (仮名) - Wikipedia
https://ja.wikipedia.org/wiki/%E3%81%AA%E3%82%8A_%28%E4%BB%AE%E5%90%8D%29

889 名前:無名草子さん mailto:sage [2022/12/25(日) 00:35:31.22 .net]
>>887

• 「コト」「より」以外の合字は現代平仮名、カタカナで入力して、ファイル末に下記のように注記してください。
※「シテ」「トモ」「トキ」「こと」「ごと」「まいらせそうろう」の合字は、仮名にあらためました。
• 仮名に書き換えるのではなく、外字注記したい合字は下記を参考にたとえば「※[#シテ、ページ数-行数]」のように本文中に注記してください。


……と外字注記辞書に書いてあるからそれに準ずる

890 名前:896 [2022/12/25(日) 00:53:21.16 .net]
>>889
回答、ありがとうございます



891 名前:無名草子さん mailto:sage [2022/12/25(日) 00:59:41.88 .net]
外字注記辞書の更新も点検グループの仕事のひとつ。

892 名前:無名草子さん mailto:sage [2022/12/25(日) 01:24:24.33 .net]
最新の外字注記辞書は第8版か

893 名前:無名草子さん mailto:sage [2022/12/25(日) 14:06:26.08 .net]
Unicodeへの移行とかも行われるのかね

894 名前:無名草子さん mailto:sage [2022/12/25(日) 14:20:22.00 .net]
かもね
積年の課題をやっつけるためにはいい機会だ
なにかできることがあったら加わりたい

895 名前:無名草子さん mailto:sage [2022/12/25(日) 14:37:38.07 .net]
入力中→校正待ち
校正中→校了

この間に、「点検はしていないが受領はした」というモードが欲しいなあ
「校正待ち(点検前)」というモードもあるけれど、これはほとんど機能していなくて
入力者自身が中の人の場合くらいしか使われてないんじゃないかな

耕作員としては自分の手を一旦離れたものなのに
ずっと自分のところで○○中のまま停滞しているように見えるのこそ悲しけれ

896 名前:無名草子さん [2022/12/25(日) 18:01:40.00 .net]
今はJIS X 0213以外の漢字を含む青空文庫の作品内キーワードはWeb上に存在しないも同然の扱いになってる
Unicode対応するとJIS X 0213以外の漢字を含む作品内キーワードの多くをGoogleなどの検索エンジンが認識できるようになる

897 名前:無名草子さん mailto:sage [2022/12/25(日) 18:14:29.25 .net]
Googleを引き合いに出してUnicodeを化が必要という話がたまに出るけど
むしろGoogleのほうが青空文庫形式に対応すべきじゃないの
と思う

898 名前:無名草子さん [2022/12/25(日) 18:20:01.95 .net]
>>897
それやると、かえって逆に青空文庫側が自由に仕様変更できなくなるよ
青空文庫がhtml外字の仕様変更するたびに検索エンジンから見えなくなるからね
そういう二度手間なくすためのUnicodeってこと

899 名前:無名草子さん [2022/12/25(日) 18:27:10.66 .net]
青空文庫が出版業界と共存できる差別化は、せっかく紙で再版しても旧字旧仮名だらけで一般読者にはとっつきにくくて採算とれそうにない旧作の電子化だからUnicode対応待ったなしなんよ

900 名前:無名草子さん mailto:sage [2022/12/25(日) 22:05:27.21 .net]
>>802
今さら亀レスですが
そらもようじゃなくてaozorablogの間違いでした
すみません充電してきます



901 名前:無名草子さん mailto:sage [2022/12/25(日) 23:20:37.34 .net]
ママ注記にUnicode文字注記含んでるとつまりPageOneでエラー扱いになるからさっさとUnicode対応してほしい

902 名前:aozorablog [2022/12/26(月) 20:41:32.07 .net]
『するりと鏡を――ぬけてみて、アリスの目に見えたもの』第2章
https://www.aozora.gr.jp/aozorablog/?p=5128

903 名前:無名草子さん mailto:sage [2022/12/26(月) 21:36:13.63 .net]
Unicodeとかもそうなんだけど作家・作品・底本(出版社や時代)を跨いだ全ての文章の一括検索という観点からすると
例えば「ほぼ」と「ほゞ」と「略」と「略々」と「略※[#二の字点、1-2-22]」みたいに表記揺れのある単語や言い回しをそれぞれの底本に準拠させる必要性がどこまであるのかみたいな問題にもなってくると思うんだよね
(他にも小書きかどうかだったり新字と旧字みたいな区別も出てくる)
それを検索サイトやシステム側で一緒にできるならいいんだけど

904 名前:無名草子さん mailto:sage [2022/12/26(月) 21:56:54.15 .net]
表記揺れはand検索でどうとでもなるからそのために本文を改変する必要はないと思うな

905 名前:無名草子さん mailto:sage [2022/12/26(月) 22:12:08.36 .net]
それがどこまで網羅できるのかって話だけどね
データベースでも作るなら別の話になるけど

906 名前:無名草子さん mailto:sage [2022/12/26(月) 22:42:57.71 .net]
当たり前だけどUnicode対応するといままで包摂適用してきた多くの文字をそのまま使えるようになるので外字注記辞書の更新も必須

907 名前:無名草子さん mailto:sage [2022/12/26(月) 22:57:50.51 .net]
>>903-905
今まで、それを比較検証することすらできなかったわけで、
「HD画質は皺が目立つから良くない」みたいな後ろ向きな現状維持は見苦しい

908 名前:無名草子さん mailto:sage [2022/12/27(火) 03:09:19.99 .net]
検索ツールの責をデーターに帰してどうすんだ。

909 名前:無名草子さん [2022/12/27(火) 03:38:57.56 .net]
>>908
誕生から25年経ったのに、青空文庫の書式に対応した検索ツールが皆無という現実がすべてを物語ってるでしょ

910 名前:無名草子さん mailto:sage [2022/12/27(火) 03:49:22.35 .net]
データーの責を検索ツールに帰してどうすんだ。



911 名前:無名草子さん mailto:sage [2022/12/27(火) 10:17:59.51 .net]
https://csd.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9/%A1%D8%C0%C4%B6%F5%CA%B8%B8%CB%A1%D9%A5%D1%A5%C3%A5%B1%A1%BC%A5%B8
既に青空文庫の全文検索コーパスは存在しますよ

912 名前:無名草子さん mailto:sage [2022/12/28(水) 01:12:10.34 .net]
「大岡政談」は、テキストファイルのサイズが青空文庫唯一の2MB越えで、ルビが75892個もあるんだね
今、未申請ながら入力してる作品もルビ35000個を超えているんだけど、上には上がいるってことでちょっと安心した

913 名前:無名草子さん [2022/12/28(水) 12:10:04.65 .net]
画像生成AI「Stable Diffusion」で青空文庫の名作小説に挿絵をつけてみた!【特集・集中企画】 - 窓の杜
https://forest.watch.impress.co.jp/docs/special/1466561.html

914 名前:無名草子さん mailto:sage [2022/12/28(水) 12:40:06.43 .net]
>>913
タイトルは面白いと思ったが本文くっさ
漫画☆太郎の100%パターンマンガとどちらが下だろうと悩むほどに

915 名前:無名草子さん mailto:sage [2022/12/29(木) 18:44:44.53 .net]
底本のページ番号に特化した注記があればいいなあ
外部プログラムに底本のページ番号を渡すことで該当する画像ファイルなりPDFなりをすぐに開けると校正が楽になると思うんだが

916 名前:無名草子さん mailto:sage [2022/12/30(金) 16:52:31.43 .net]
来年は溜めてる作業を消化しような

917 名前:925 mailto:sage [2022/12/30(金) 16:57:45.24 .net]
「来年は」というか「来年こそは」だわ

918 名前:無名草子さん mailto:sage [2022/12/30(金) 17:11:21.75 .net]
来年は一体どうなるんだろうねぇ
まだ新年の公開作品の情報も出てないから完全に更新止まっちゃうのかな……

919 名前:無名草子さん mailto:sage [2022/12/30(金) 19:22:38.00 .net]
未申請のまま入力に取りかかろうかと考えている
もしも他の人と作業がダブってしまってふいになったとしても
自己責任、自業自得ってことで

Unicode化や注記の仕方など
大きな仕様変更があるかもしれないが
それでも一年間なにもせずにいられそうもない

920 名前:無名草子さん [2022/12/30(金) 20:19:48.47 .net]
2022年12月23日に出された充電期間の通知よりも前に申請したんだが、未だに連絡メールが来ない
まだ4週間経ってないから待ってるけど、どうなるのかな

>>919
重複を回避できる仕組みがあればいいんだけど、やたら申請だけしてほったらかしにされると困るので、
青空文庫の中の人による集中管理によらない、入力者間のゆるい情報交換の仕組みがあればいいと思う。
Githubのissue機能(メール通知や状態管理できる2chスレッドみたいなもの)を使えば作品ごとに重複回避や作業分担できそう。



921 名前:無名草子さん mailto:sage [2022/12/30(金) 20:25:16.14 .net]
ググルのような工程表を用意し
この通りにやらないと優先度が落ちて行って最終的には申し込み自体消滅でいんちゃうの

922 名前:無名草子さん mailto:sage [2022/12/30(金) 20:32:17.11 .net]
>>921
言いたいことはなんとなくわかるよ
けど、ガントチャートはスケジュールを中央で一元管理する人がいて始めて成り立つものなので、
ガントチャートの逐次更新にこだわると青空文庫の中の人の仕事が逆に増えてしまう恐れがある
毎日のようにたくさんの作品が放り込まれてくる青空文庫には、なじまないかもしれない

923 名前:無名草子さん mailto:sage [2022/12/30(金) 20:36:46.66 .net]
参加者皆で確認して行く方向が大事だと思う
管理者は10名ほど横繋がりでやり取りできる状態になると良いな

924 名前:無名草子さん mailto:sage [2022/12/31(土) 08:52:43.28 .net]
2023年も山周祭りか?

925 名前:無名草子さん mailto:sage [2022/12/31(土) 12:19:09.33 .net]
その話題は荒れるもとだからやめよう

926 名前:無名草子さん mailto:sage [2022/12/31(土) 13:35:20.67 .net]
中の人もここ見てくれてるのだろうか?
だとすればここでブレインストーミング的にたくさん意見を出しておくと何かに活かされるかもしれんという希望が

927 名前:無名草子さん mailto:sage [2022/12/31(土) 16:05:03.93 .net]
工作員のみんな今年もお疲れ様
来年は色々変化があるのだろうけどぼちぼちよろしく

928 名前:無名草子さん mailto:sage [2022/12/31(土) 20:10:48.61 .net]
皆の活動が名作を支えてる
読者として楽しんでます

青空読んでたら何でか文庫本も買うようになって
変な逆転現象も出てる

929 名前:無名草子さん mailto:sage [2023/01/01(日) 05:18:51.35 .net]
みんなあけおめ

2023年01月01日 『電子アーカイヴ』はしばし電気をためて夢を見る
https://www.aozora.gr.jp/soramoyou/soramoyouindex.html#000527

930 名前:無名草子さん mailto:sage [2023/01/01(日) 17:38:48.70 .net]
>>928
うれしいよ、ありがとう!



931 名前:無名草子さん mailto:sage [2023/01/01(日) 20:06:27.66 .net]
昨年で校了になっている作品は、今「校了」になってるので全部なのだろうか
いま点検グループさんの手元にある作品は、いったん作業中止って扱いになるのだろうか
(入力校正の新規受付がストップするのは分かったけど……)

932 名前:無名草子さん mailto:sage [2023/01/01(日) 20:13:25.98 .net]
>受領後点検と「校了」ステータスの完全再開は、新データベースシステムの本運用開始と高品質ファイル作成に目処がついてから

そういうことだろうね。
運用システムが万全になるまでは、「校了」に移行することはないということ。

なぜなら高品質ファイルにするために何らかの仕様変更をする可能性があるし、
そうなれば、すでに送ったファイルでも、校正者に再度返す必要がある。

933 名前:無名草子さん mailto:sage [2023/01/01(日) 20:16:11.34 .net]
校了したら、点検グループは必ず当日中に校正者にお疲れメールをくれる。
それがないということは
昨年中の校了作品は、今データベースで「校了」になったものがすべてで、あとは作業停止と思ってよいはず

934 名前:無名草子さん mailto:sage [2023/01/01(日) 20:18:21.64 .net]
自己レスごめん

>>933
>それがないということは

上の質問者さんが心配しているのは
「昨年中に自分の送った校正ファイルはどうなっている(どうなる)のか?」
ということだろうと想像して答えた。

935 名前:無名草子さん mailto:sage [2023/01/01(日) 21:34:25.53 .net]
>>931です。
ありがとうございます。
私は特に自分の担当している作業中作品はありませんが、
(いちおう一作品だけ入力申請していましたが未回答)
昨年の内に校正中になった自分の担当作品が多く、
それらが今後どうなるのか気になってました。

初心者の方が校正している様子も見受けられるので、
混乱が生じないことを祈りたいです……

936 名前:無名草子さん mailto:sage [2023/01/01(日) 21:43:45.15 .net]
今月の予定は?

937 名前:無名草子さん mailto:sage [2023/01/01(日) 21:57:33.56 .net]
>>935
あまり新人を敬遠する発言はしないでほしい
新人でも精力的な人は精力的だし
点検Gもサポートしてる

938 名前:無名草子さん mailto:sage [2023/01/01(日) 21:59:23.15 .net]
十年以上校正者がいない作品もあるのに
手を上げて校正してもらえる人が現れただけ幸運だよ

939 名前:無名草子さん [2023/01/01(日) 22:08:27.84 .net]
厳格にやるべきは著作権など権利の確認で、校正はそれほど厳格にしなくても良いと思うんだが、
「ウォーリーを探せ」よろしく、入力間違いを沢山見つけた強者を月間・年間ランキング表示するゲーム感覚でいいんじゃないの。
ま、暴論だけどさ

940 名前:無名草子さん mailto:sage [2023/01/01(日) 22:39:28.25 .net]
>>937
そうですね。
申し訳ございません。
私も参加したのは近年からですので、どちらかと申せば初心者です。

今回のリニューアルを機に、
いまだ校正されていない作品に光が当たりますように。
長文作品は「ドグラ・マグラ」のように交流しながらグループで行えるのが理想ですね。



941 名前:無名草子さん mailto:sage [2023/01/01(日) 23:14:39.93 .net]
>>939
「歴史的仮名遣いを現代仮名遣いに改めた」とか「明らかな誤植を修正した」とか「使用する文字コードに存在しない文字を画像で挿入にした」みたいに
やむを得ない理由がないのに内容を変えて公開したら同一性保持権の侵害になるんだから内容の正確性はそのまま著作権の論点になるよ
同一性保持権などの著作者人格権は保護期間みたいな制限がないからね(著作権法60条参照)

942 名前:無名草子さん [2023/01/01(日) 23:36:35.04 .net]
>>941
読者の視点でざっと読んで、違和感なかったらOKってことでいいんでないかな。
より細かい間違いを見つける作業は、一般人に委ねたらいいと思う。
参加型や逐次更新というWebの強みを活かさない手はない。

943 名前:無名草子さん mailto:sage [2023/01/01(日) 23:49:06.92 .net]
古いファイルを見てると、工作員の独断で勝手に校閲したらしき部分を見つけることが時々ある
(底本通りではなく、別な本を見て直したように見えるが誤記注記がない、とか)
あと底本だか親本だかの版が存在しない版(発行日も刷数もでたらめ)だったこともあったな
あんまりゆるくするとそういうのが増えかねないから、校正はそれなりにちゃんとした方がいい、と思う

944 名前:無名草子さん mailto:sage [2023/01/01(日) 23:53:58.96 .net]
>>942
OKなわけないじゃん
むしろ悪質だろ

調べに調べた上での誤りは致し方無い部分もあるかもしれないが
他人の書いた文章をお前の怠慢で改竄して公開する権利は無い

945 名前:無名草子さん mailto:sage [2023/01/01(日) 23:56:48.77 .net]
逐次更新と簡単に言うけど
少なくとも従来のシステムでは
技術的にも人手的にも簡単なことではなかった

それに青空文庫は出鱈目で信頼性が低いと酷く叩かれた過去だってある

新システムでファイル差し替えがどの程度容易になるかは分からないが、
それに甘んじず校正はきちんとやって信頼度の高いものを提供した方がいい

946 名前:無名草子さん [2023/01/01(日) 23:58:02.24 .net]
>>944
え?
すでに次世代デジタルライブラリーでOCRによって改竄(いわゆる誤検出)された作品が大量に公開されてるよ
「悪質」かどうか誰が決めるの?

947 名前:無名草子さん mailto:sage [2023/01/02(月) 00:00:25.46 .net]
というか951は工作員なのか読者なのかどういう立場で言ってるのか気になる

工作員だったら自分の作業には責任も誇りも持って受け持ってると思うので、なかなかこの発想にはならんと思うんだな

948 名前:無名草子さん mailto:sage [2023/01/02(月) 00:03:05.72 .net]
>>946
次世代デジタルライブラリーはそれ自体が研究検証目的の実験的取り組みだ

同列には語れん

949 名前:無名草子さん mailto:sage [2023/01/02(月) 00:05:00.38 .net]
>>942
底本をもたずに無料で読みに来る読者に細かい間違いを指摘させるってどんな無謀な期待よ

950 名前:無名草子さん [2023/01/02(月) 00:06:36.71 .net]
>>947
誇りを持つのは自己満足で勝手にどうぞって感じだけど、責任はなんにも背負ってないでしょ。
それとも賠償責任とか負うの?
学術論文で引用された作品が間違ってたら署名つきで謝罪するとか?
あまり言葉遊びしないほうがいいと思うよ



951 名前:無名草子さん mailto:sage [2023/01/02(月) 00:07:54.97 .net]
小並感

952 名前:無名草子さん mailto:sage [2023/01/02(月) 00:19:35.24 .net]
>>946
次世代デジタルライブラリーは「実験的な検索サービス」と謳ってるように青空文庫みたいな読むためのものではないし
OCRテキストと資料の画像を紐付けることによって内容の正確性を担保(補完)してる

それに公開時点で誤字・脱字・衍字があった時点で単純に悪質なのよ

953 名前:無名草子さん mailto:sage [2023/01/02(月) 00:28:34.68 .net]
そのへんの感覚が希薄な耕作員がいるとしたら恐ろしい

954 名前:無名草子さん [2023/01/02(月) 00:31:27.81 .net]
>>952
紙書籍の考えを引きずらなくていいと思うよ
間違ってたら更新すればいいだけ

紙書籍はハードウェアなので配布してしまったものを簡単に修正できないけど、
Web書籍はソフトウェアなので簡単に修正できる

青空文庫はなんの社会的責任も負っていないし、
ましてや君主でもないので「綸言汗の如し」のことわざはまったく当てはまらない

955 名前:無名草子さん mailto:sage [2023/01/02(月) 00:39:36.93 .net]
君子は豹変す

956 名前:無名草子さん mailto:sage [2023/01/02(月) 00:40:19.52 .net]
>>954
で、その更新(修正)前に読んだ人にはどう対応するつもりなの?
その誤字部分のせいで駄作だと思われたら確認にも来ないよね?

957 名前:無名草子さん mailto:sage [2023/01/02(月) 00:43:01.62 .net]
間違ってたらデータを更新すればいいだけだからこそ公開までに何人もの目を通して修正を施してるんでしょ

958 名前:無名草子さん [2023/01/02(月) 01:00:08.06 .net]
>>956
今も対応してないでしょ
てへぺろで十分

959 名前:無名草子さん mailto:sage [2023/01/02(月) 02:06:09.13 .net]
ocrの認識率が99%だとして、百字に一字も誤字がある文章なんて読めたもんじゃないから、そのまま公開しても「ざっと読める」クオリティには到底ならないと思う
現状は「ざっと読める」ようになるまで結局誰かの校正が必要。だとすると今とそんなに手間は変わらないんじゃないか。
ocrの認識率が今後伸びればまた違うのかもしれないが。

ただ、みん翻みたいな感じでみんなで校正できたらそれはそれで楽しそうだとは思う
けどそのシステムの実装のために式年遷宮が5年くらい伸びそうな気もするな。

960 名前:無名草子さん mailto:sage [2023/01/02(月) 07:32:01.37 .net]
>>945
の言う通り従来のシステムでは逐次更新そのものが面倒というのもそうだが、
青空文庫本体を更新したとしても、そこから作られて別なサーバに置かれてるファイル、
たとえばKindleで無料でダウンロードできる(赤と黄色の表紙の)ファイルなんかは
古いままだから、そっちを利用してる人は古いファイルを使い続けることになる
という問題もある(実際、青空の方は直ってるのにKindleの方だけ見て誤字がーって
愚痴ってる人を見たことがある)
よく知らんけど、公共図書館の電子図書館とかにあるファイルもそんな感じなんじゃない
だとしたらやはり現時点では公開の前に十分なチェックが必要かと思う



961 名前:無名草子さん [2023/01/02(月) 07:58:35.68 .net]
>>960
青空文庫の最新版と同期を取る仕組みが必要って話でしょ
いつまでたっても古いままってのはどのみち問題なわけで。
公開前の十分なチェックとかやってるといつまで経っても10~20年物の待ち状態の作品をさばけないと思う

962 名前:無名草子さん mailto:sage [2023/01/02(月) 10:24:56.27 .net]
複数の工作員が校正を共同で作業してるのはたまにあるよね

963 名前:無名草子さん mailto:sage [2023/01/02(月) 12:09:56.37 .net]
>>958
十分じゃないから最初の公開までに点検なり校正なりしてるんだけどそれが分からないの?

964 名前:無名草子さん mailto:sage [2023/01/02(月) 12:13:37.34 .net]
適当でおk派はウィキソースに行ったほうが幸せになれるぞ

965 名前:無名草子さん mailto:sage [2023/01/02(月) 12:38:50.63 .net]
公開してからバグがあると問題であるとするなら

非公開サイト内で一般人に近い環境でファイルを読む、
テスターあるいはデバッガーとしての耕作員活動を募るというのはどうだろう

いずれにしてもボランティアだから
読みやすいものに査読者が偏るだろうけど

966 名前:無名草子さん mailto:sage [2023/01/02(月) 12:54:11.23 .net]
OCRから読み取るのと電子ブックからコピペしたのを貼り付けるのと何が違うんだろう
文章が全く同一の場合は何も変わらないのだろうか?

967 名前:無名草子さん mailto:sage [2023/01/02(月) 13:06:45.25 .net]
そりゃそうだ
同一なら同一

968 名前:無名草子さん mailto:sage [2023/01/02(月) 13:13:07.19 .net]
漢数字の「二」がカタカナの「ニ」になってたりすると
ocrに読み込ませて失敗したななんてことは思います

969 名前:無名草子さん mailto:sage [2023/01/02(月) 13:31:26.32 .net]
一般人から、書写者(早口で三度言えたらお前の勝ち)へ誤字をフィードバックする仕組みを作れよ。

970 名前:無名草子さん mailto:sage [2023/01/02(月) 13:55:56.90 .net]
>>969
それはホントに思う
kindleとかは誤字を簡単に報告する仕組みが出来てるけど
そんな感じで「これ、おかしいんじゃない?」って思うのを
気軽に送信してチェックしてもらえると嬉しい。

ちゃんと底本確認してから報告しろと言われるとハードルが
とてつもなく上がる。



971 名前:無名草子さん mailto:sage [2023/01/02(月) 13:56:54.35 .net]
たださ、青空文庫ではウィキソースと違ってママ注記を乱発しないんだよ

現代の用法と照らして間違ってるというだけでは、青空文庫ではママ注記しない

誤字通報フォームには、「□利用規約に同意します」よろしく
その旨(青空文庫の公式な「誤字、誤用」に対する考え方)理解を求めないとならんだろう

972 名前:無名草子さん mailto:sage [2023/01/02(月) 13:57:29.56 .net]
>>970
殺到の予感

973 名前:無名草子さん mailto:sage [2023/01/02(月) 14:02:14.26 .net]
その仕組みがないために誤字だらけの作品を公開し続けるのも
不味いのではないかなんて思うのですが
その辺は皆さんどうお考えでしょうか?

974 名前:無名草子さん mailto:sage [2023/01/02(月) 14:03:24.64 .net]
自分がその気軽な連絡を受けてチェックする側にいても同じこと言えるの?

975 名前:無名草子さん mailto:sage [2023/01/02(月) 14:04:06.96 .net]
>>974
言えると思いますがなにか?

976 名前:無名草子さん mailto:sage [2023/01/02(月) 14:04:40.30 .net]
すげえな
俺は言えない

977 名前:無名草子さん mailto:sage [2023/01/02(月) 14:10:35.10 .net]
一般読者は>>971を理解してない

だから同じ件や類似の件に何度でも報告してくる可能性がある

同じだからといってテンプレ対応はできない
報告が本当に単なる誤植なのかどうか、ママなのか、注記なしなのか、底本や親本を探してくるのもこちら、
該当箇所にあたって判断しなくちゃならないのはこちらだ

これを一件ずつな

978 名前:無名草子さん mailto:sage [2023/01/02(月) 14:12:59.85 .net]
次スレ建てときました
青空文庫 12棚目
https://mevius.5ch.net/test/read.cgi/books/1672636336/

979 名前:無名草子さん mailto:sage [2023/01/02(月) 14:13:27.14 .net]
>>978
乙です
どうもありがとう感謝します

980 名前:無名草子さん mailto:sage [2023/01/02(月) 14:47:19.75 .net]
>>977

こちらってのは青空文庫側ってことか?
もちろん厖大な誤字報告に対応できるくらいの人手があればできるだろうけど、ないんだから現実的に無理じゃん。
そもそも底本確認することがハードルになるほど難しい事とは思えないから
報告者が底本まで確認して連絡するのが妥当だと思う。

どんな事だって間違いするときは客観的な根拠を示すのがフェアなんだから。



981 名前:無名草子さん mailto:sage [2023/01/02(月) 14:48:52.99 .net]
>>980
間違いする→間違いを指摘する

982 名前:無名草子さん mailto:sage [2023/01/02(月) 15:32:42.06 .net]
>>980
それほどハードルが高くないって思われるなら
そういう方にその役割を担っていただきたい。

読んで誤字を見つけるのが得意な人もいれば
底本を入手しやすい立場でチェックを得意とする方もいるだろうし
うまく得意分野を合わせて問題解決してほしいです。

誤字だらけの作品を公開されているのは
いくら著作権が切れてるといえ
作者は不本意だとおもうのですが。

983 名前:無名草子さん mailto:sage [2023/01/02(月) 16:00:26.64 .net]
「作者は不本意」も何も遺族は訴えられるからね
著作者人格権の侵害は500万円以下の罰金だし

984 名前:無名草子さん [2023/01/02(月) 16:00:42.10 .net]
おお、ここはOCRを校正に使えると思っている幸せな人をたしなめるスレですね

985 名前:無名草子さん mailto:sage [2023/01/02(月) 16:04:42.70 .net]
誤植確認申請フォーム的なのを作るとしたら図書カードのURLや本文の該当箇所をテキストで入力する以外に
底本画像の該当ページと奥付の添付も必須にすればだいぶマシになるとは思う
(出版後70年経過してない場合の対応に困るんだけど)

流石に捏造する愉快犯は出てこないでしょ

986 名前:989 mailto:sage [2023/01/02(月) 16:10:39.13 .net]
>>982
そもそも自分でチェックせずになぜ誤字と判断できるのかわからんな。

「誤字かも」「誤字な気がする」とかそんなレベルの連絡に対応するのは人手があればやれるのは確かだが
だとしても本来、やる筋合いはない。

987 名前:無名草子さん mailto:sage [2023/01/02(月) 16:14:54.20 .net]
遺族から「ここがおかしい」と言われたら直せばいいだけでしょ、
回収せずに改修できるのがWeb書籍の強み
回収が容易でない紙書籍とは違うのだよ、紙書籍とは

988 名前:無名草子さん mailto:sage [2023/01/02(月) 16:17:58.47 .net]
工作員としてやることがなくなるととなんかみんな変な感じになっちゃうな

989 名前:無名草子さん mailto:sage [2023/01/02(月) 16:18:11.20 .net]
>>984
なにいてんの?
使えるのに使えないと誘導しようとしてるのかね
悪質だねぇ

990 名前:無名草子さん mailto:sage [2023/01/02(月) 16:23:16.21 .net]
>>987
その杜撰さで運営したら誰も見向きもしなくなるって想像つかないの?



991 名前:無名草子さん mailto:sage [2023/01/02(月) 16:23:23.38 .net]
1000

992 名前:1001 [Over 1000 Thread.net]
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 243日 19時間 9分 5秒

993 名前:無名草子さん [2023/08/01(火) 18:56:54.43 ID:CbaCMKFv6]
都心まて゛数珠つなぎて゛航空騷音まみれにして勉強まて゛妨害する最惡の現状をスルーしながら、未来ヘの投資(大爆笑)た゛のと主張して
孑どもではなく子を持つ親に赤の他人から強盜した血税くれてやれだの私権侵害甚た゛しいバ力ほざく腐敗主義のキチカ゛ヰがいるけど,
Gоtоなにか゛し同様,地球破壊するテロリストとともにてめえのクソ利権を増大させて私腹を肥やしたいた゛けなのか゛ハ゛レハ゛レた゛ろ
税の公平性すらカ゛ン無視だし、貧乏だけど孑を産んでいいのかしらとか勘違いさせて不幸な孑を量産させる史上最惡の税金泥棒だわな
介入するなら.親ガチャ失敗を緩和するために.孑を産んだら親にひとりあたり5千万は課税して物品やらを直接,子に給付させるのか゛限度
もちろん払える見込みか゛なけれは゛遺棄罪で逮捕懲役,日当5千圓で塀の中から孑に送金させろや寄生虫,てめえの孑の保育すら放棄して
保育園がと゛うたら学童がと゛うたら虐待がどうたら他人が払った税金くれだの恥知らずもいい加減にしとけ寄生虫ババァ
北朝鮮にウクラヰナに子と゛もまて゛ネタに地球に社会にと破壞してて゛も私腹を肥やしたい外道に騙されないようにな

創価学會員は、何百万人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まで出てる世界最悪の殺人腐敗組織公明党を
池田センセ−か゛ロをきけて容認するとか本気で思ってるとしたら侮辱にもほどがあるそ゛!
htтps://i、imgur.сom/hnli1ga.jpeg






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<249KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef