最強の圧縮アルゴリズムを語ろう

最強の圧縮アルゴリズムを語ろう at TECH

1:デフォルトの名無しさん
06/04/26 11:57:53
2bit , 3bit , 5bit ずつに頻度を取る。
2bitがいい成績だったら2bitをひとかたまりにして
2ブロック、3ブロック、5ブロックで頻度をとる。
これを繰り返す。

2:デフォルトの名無しさん
06/04/26 11:59:11

　　　　ラ　　ン　　レ　　ン　　グ　　ス　　圧　　縮　　法　　最　　強

　VB厨にもマジ簡単だからおすすめ

3:デフォルトの名無しさん
06/04/26 12:00:33
アカデミックにでおｋ

4:デフォルトの名無しさん
06/04/26 12:07:19
圧縮率が最強なのを語ろう

5:>>1 ハフマン・LZ77から勉強してこい
06/04/26 12:10:20
>>1
　　　　　　r;ｧ'N;:::::::::::::,ｨ／　　　　　 >::::::::::ヽ
.　　　　〃　　ヽﾙ1'´　　　　　 ∠:::::::::::::::::i
　　　　 i′　　___,　-　,. = -一　￣ｌ:::::::::::::::ｌ
.　　　　　 ! , -＝=､´r'　　　　　　　　 l::::::/,ﾆ.ヽ
　　　　　　ｌ　　　　　　　　_,, -‐''二ゝ　ｌ::::l fﾞヽ |、ここはお前の日記帳じゃねえんだ
　　　　　ﾚー-- ､ヽヾﾆ-ｧ,ﾆ;＝、_　　 !:::l ） } ト
　　　　　　ヾ¨'７"ry､｀　ｰﾞ='ニ,,,｀　　 }::ヽ(ノ　「ハレ晴レユカイ」でも聞いてろ
:ｰゝヽ､　　 !´ "￣ 'l,;;;;,,,.、　　　　　　　,i:::::::ﾐ
::::::::::::::::ヽ.-‐ ﾄ、　r'_{　　 __)｀ニゝ、　 ,,iﾘ::::::::ﾐ　　　
::::::::::::::::::::Vi／l:::V'´;ｯ`ﾆ´ｰ-ｯ-,､:::::`"::::::::::::::;ﾞ　, 　な！
:::::::::::::::::::::::::N. ﾞ､::::ヾ,.｀二ﾆ´∠,,.i::::::::::::::::::::/／／
:::::::::::::::::::::::::::::l　ヽ;:::::::::::::::::::::::::::::::::::::::::::／　／
::::::::::::::::::::::::::::::!　:|.＼;::::::::::::::::::::::::::::::／　／

■5/10発売　涼宮ハルヒの憂鬱ED　「ハレ晴レユカイ」
URLﾘﾝｸ(www.youtube.com)

6:デフォルトの名無しさん
06/04/26 12:14:58
ハフマン、LZぐらい知ってるよ
俺が考えたのは2ビット(1ビットずらしも考える)、
3ビット(1ビット、2ビットずらしも考える)単位で出現頻度を調べて
頻度の高い単語を一纏めにしようというわけだ。

7:デフォルトの名無しさん
06/04/26 12:21:39
無理だって
プログラム作ってからこい

8:デフォルトの名無しさん
06/04/26 12:30:55
TeXでペーパー作成してから来い

9:デフォルトの名無しさん
06/04/26 12:36:55
4bit , 6bit , 8bitは統計をとらなくてよい。
2×2　,　2×3　,　2×2×2で実現されるからだ。
たとえば英語(ASCIIコード)ならば
2ビット→2ブロック→2ブロックがいい頻度を出すだろう。

10:デフォルトの名無しさん
06/04/26 12:38:20
ひとまとめって、どこに纏めるつもり？
纏めたはいいけど、複合化するときはどうするの。

11:デフォルトの名無しさん
06/04/26 12:39:35
頻度の高いブロックが出続ける間は
2,3,5,7ブロックずつで統計を取る。
最後は、既存の圧縮プログラムで圧縮するんだ。

12:デフォルトの名無しさん
06/04/26 12:41:35
>>10
単語辞書を圧縮したもののはじめに記録する。

13:デフォルトの名無しさん
06/04/26 12:43:04
おーい早くキンタマーセマティカ君出て来いよ！
単なる糞コテなのかよ！それは

14:デフォルトの名無しさん
06/04/26 12:47:57
たとえば110101111011101011101が与えられたとしよう。
a=1101と置換すれば

(1101)011(1101)(1101)01(1101) = a011aa01aとなり簡単になる。
こういう事をやりたいんだ。

15:デフォルトの名無しさん
06/04/26 12:49:02
中学生だろお前

16:デフォルトの名無しさん
06/04/26 12:50:10
どの区切りで一単語と見なすかで全体の文字列長が変わってしまうが
その辺はなんとか考えよう。

17:デフォルトの名無しさん
06/04/26 12:51:43
ハフマンもLZも名前だけしか知らん様子ですね。

18:デフォルトの名無しさん
06/04/26 12:58:15
一般的にはword extraction(wx法)というやつなのだがな。
しかし単語の抽出法は工夫の余地があるはずだ！

19:デフォルトの名無しさん
06/04/26 12:59:38
また数学的に無理だと証明されている事をこねくり回す基地外か

20:デフォルトの名無しさん
06/04/26 13:02:33
どこに無理だと証明されているんだよ。
頻出単語を少ないbitで表現できれば文字列長が小さくなるだろが！

21:デフォルトの名無しさん
06/04/26 13:03:48
動くプログラムを実際に作ってうｐしてからこいや>>1

22:デフォルトの名無しさん
06/04/26 13:11:50
「考える」だけなら誰でも出来るんだよ。「考える」だけならな。

しかし、他人を納得させるには、「実物」を見せないとだめだ。
それをしない限り、オナニーと呼ばれても仕方ないぞ。

23:デフォルトの名無しさん
06/04/26 13:36:57
この場合おもに単語抽出方法を考えればいいわけだ。辞書を使わずに。
一般的にはどのようなアルゴリズムがあるんだ。知ってるか？

24:デフォルトの名無しさん
06/04/26 13:56:40
人こないな～

25:デフォルトの名無しさん
06/04/26 14:03:26
高圧縮な単語抽出アルゴリズムが開発できれば
検索エンジンとか宇宙人語とか暗号解読とかに役立ちそうだな。

26:デフォルトの名無しさん
06/04/26 17:27:16
1101010111001010101
が与えられたときに
a=1101010111001010101
とすれば
1101010111001010101　→　a
と簡略化される

27:デフォルトの名無しさん
06/04/26 19:22:23
bzip2最強

28:デフォルトの名無しさん
06/04/26 20:22:37
いまのところ、量子圧縮がいちばん有望じゃない？
bit単位の(汎用的な)圧縮アルゴリズムに限界があるのは明らかなんだから。

29:デフォルトの名無しさん
06/04/26 20:25:16
>>26
そしたら辞書に本体が必要じゃないか。あまりに大きくしすぎても駄目だと言うことだな。
最低2回は繰り返さないと。

30:デフォルトの名無しさん
06/04/26 20:28:06
算術圧縮

31:デフォルトの名無しさん
06/04/26 20:38:41
>>28
パソコンが2進数にもとずくんだからそれは無理だ。
現在での最強は？

32:デフォルトの名無しさん
06/04/26 20:46:39
何でも量子と言えば何とかなると思ったら大間違いだ！

33:デフォルトの名無しさん
06/04/26 20:48:04
漁師コンピューティング

34:デフォルトの名無しさん
06/04/26 20:52:13
圧縮しなくても武豊より身長低いのに。

35:デフォルトの名無しさん
06/04/26 20:54:46
>>14
じゃぁその文字列aそのものはどうやって保存するんだい？

36:デフォルトの名無しさん
06/04/26 20:59:43
>>35
初に単語数を16bitで記録する。次に単語長を16bitで記録する。
次に単語を記録する。以下、単語数になるまで繰り返し。

37:デフォルトの名無しさん
06/04/26 21:03:15
単語数　z=3
単語長　x=5 単語　y=11000
単語長　x'=2 単語　y'=01
単語長　x"=6 単語　y"=101011

zxyx'y'x"y"(圧縮データ)

38:37
06/04/26 21:08:04
この様に文字列長を縮めてから通常の圧縮ルーチンを起動するんだ。

39:デフォルトの名無しさん
06/04/26 21:08:23
>>37
それって最初のデータ13bit（2バイト以下）だよね。
明らかに増えてない？

40:37
06/04/26 21:10:17
元のデータが1ギガとかだと辞書はたいしたサイズではない

41:デフォルトの名無しさん
06/04/26 21:11:26
元のデータがギガ単位にならなければ圧縮率が高まらないアルゴリズムってどうなんだろ。

42:37
06/04/26 21:11:54
あとどの単語に何ビット割り当てるという情報もいるな。

43:37
06/04/26 21:12:40
>>41
没に10メガとかでもいいけど。

44:デフォルトの名無しさん
06/04/26 21:14:28
>>14,>>35-42
それ以前に最適な辞書を作るアルゴリズムをどうやって作るのかと。

45:デフォルトの名無しさん
06/04/26 21:23:24
talk:>>44
「最適な辞書を作るアルゴリズム」を作るアルゴリズムを作れば？

46:デフォルトの名無しさん
06/04/26 21:30:39
>>45
頑張って！
影から応援するから

47:デフォルトの名無しさん
06/04/26 21:46:24
同じ単語でもどこで切り出すかで長さが変わるんだよな。
少なくとも単語は2bit以上だから2bitから調査しようぜ。
それで00がかなり多いとなったら次に0がくる確率がかなり多いとかなって。

48:デフォルトの名無しさん
06/04/26 21:48:37
0001001110000だと単語00の出現回数はいくつにしたらいいんだ？

49:デフォルトの名無しさん
06/04/26 22:01:47
>>48
途中の01や111をどう扱うかによって変わるかと。

50:デフォルトの名無しさん
06/04/26 22:03:58
talk:>>45
どうやって作るの？

まさかとは思うが、それを作るために作るためのアルゴリズムをつくろうとか言い出す始末じゃ困るぞ。

51:デフォルトの名無しさん
06/04/26 22:18:22
ちょっと前の話だが、いわゆるITバブルだったころ、
「どんなサイズのファイルでも50%に圧縮するアルゴリズムを考え付いた」といって
投資を集めていたやつがいたそうだ。しかもそのアルゴリズムは可逆なのだそうだ。

この詐欺師の事件の顛末、誰か知らないか？

52:デフォルトの名無しさん
06/04/26 22:58:37
>>1
まず、詳しい圧縮・伸張方法を説明して、且つその方法が圧縮率や処理速度の点で良い結果を出せそうだ、ということをきっちり説明してくれ。

53:デフォルトの名無しさん
06/04/27 00:30:17
>>51
10%じゃなかったっけ?
そういえばどうなったんだろうな。

54:デフォルトの名無しさん
06/04/27 01:12:42
どんなビット列、文字列に対しても
辞書部分 + 圧縮部分のサイズがもっとも小さくなるような
アルゴリズムをおまいらが開発するすれ。

55:デフォルトの名無しさん
06/04/27 01:47:10
圧縮ファイルをﾃｷｽﾄにしてそれを圧縮するを繰り返せばすげぇ圧縮できる。

そう思ってた時期が僕にもありました

56:デフォルトの名無しさん
06/04/27 01:53:48
ブロックソート＋BPEでいいんじゃね？

57:デフォルトの名無しさん
06/04/27 02:01:05
最強は非可逆だって

58:デフォルトの名無しさん
06/04/27 02:14:25
それハッシュ

59:デフォルトの名無しさん
06/04/27 02:16:40
>>51
物理ノイズも50%に圧縮するってか。
そりゃ騙されたほうが阿呆ですなあ。

60:デフォルトの名無しさん
06/04/27 02:40:56
BPE（Byte Pair Encoding；バイト対符号化）なんていうのがあるのか。
2ブロック限定で辞書作るアルゴリズムだな。
任意のブロックで単語を見つけ出せればいいんだが。

61:デフォルトの名無しさん
06/04/27 06:27:03
あんまり関係ない質問で恐縮なんですが、ZIPファイルとかLZHファイル等を
扱う方法などについて詳しく載っているサイトってありますか？

ググろうとしても「zip 仕様」とか「zip ソース」だとかで検索してもぜんぜんわからんとです・・・

62:デフォルトの名無しさん
06/04/27 06:39:13
>>61
ＤＬＬをつかう。
URLﾘﾝｸ(www.csdinc.co.jp)

63:デフォルトの名無しさん
06/04/27 06:42:35
>>62 ｽﾏﾝｽ、さすがにそれは知ってるけど、それと同じようなことを（自前で）実現するような
手法について調べたいんだけど俺のぐぐりかたがヘタクソでみつからない、ていうお話です

64:デフォルトの名無しさん
06/04/27 06:47:37
>>63
DLL作成をぐぐる。

65:デフォルトの名無しさん
06/04/27 06:49:28
標準の形式をしりたいということか。

66:デフォルトの名無しさん
06/04/27 06:54:47
>>64 うう・・・ぐぐってみたですがよくわからんですorz
>>65 ええ、そんなかんじです

67:デフォルトの名無しさん
06/04/27 07:10:39
URLﾘﾝｸ(www.iecapc.jp)

68:デフォルトの名無しさん
06/04/27 14:06:11
夢を語り合うスレはここですか？

69:デフォルトの名無しさん
06/04/27 15:42:59
>37は単語と置き換える記号aを既存の記号と
かぶらせない方策を考えてない中学生。(発想力が)

>>61
pkzipとかで日本語以外もぐぐりゃいいんじゃないかな。

70:デフォルトの名無しさん
06/04/27 16:14:04
>>69
なんだと。そんなことは簡単なことだ。
算術圧縮とか、ハフマンのやり方にならえばいいんだ。
ようするに2とおりの表し方がないようにすればいい。

71:デフォルトの名無しさん
06/04/27 16:49:24
>>1-70
君らこの辺とかちゃんと読んでる？
　　↓
URLﾘﾝｸ(homepage3.nifty.com)　の人のWX法。

ビット単位でやるとかなりコストかかりそうだけど、速度的なチューニングを
考えなければほぼそのまま適用できるでそ。

72:デフォルトの名無しさん
06/04/27 19:29:34
>>71
>>18でちゃんと触れられてるぞ。
おまえこそちゃんと読めよｗ

73:デフォルトの名無しさん
06/04/27 20:06:17
いやだから一般的なwx法の話じゃなくて、
ipa でやってた↑のアルゴリズムとか読んでるのって話だよ。

誰一人読んでるようには見えないぞ。

74:デフォルトの名無しさん
06/04/27 20:39:00
>>73
> 誰一人読んでるようには見えないぞ。
人が読んでいる間にそういうこと言うかね

75:デフォルトの名無しさん
06/04/28 10:39:43
11001110の場合。

(1) 一語ずつ削る
11001110
1001110
001110
01110
1110
110
10
(2)ソートする
001110
01110
(10)
(10)01110
(110)
(110)01110
1110

単語(10)(110)(11)が出現していることが判明する。

76:デフォルトの名無しさん
06/04/28 10:41:32
a=110を単語として扱うのがいいな。

77:デフォルトの名無しさん
06/04/28 10:43:39
あまりに長い単語は出現しないだろうからソート対象にのは
16bit(16語)まででいいか。

78:デフォルトの名無しさん
06/04/28 10:50:08
>>71を読んでみたところこんな感じでやっている。
しかし今おもったんだがソートする必要はない気がする。
なぜならば11001110が与えられたとき
(単語は2から4bitのまでだと仮定する)
配列を用意して3=(11)番目、7=(110)番目、12=(1100)番目の配列に1を足す。
次に2=(10)番目、4=(100)番目、5=(1001)番目の配列に1を足す
とやればいいんだ。

79:デフォルトの名無しさん
06/04/28 10:51:35
これならソートは必要なくデータ長×最大単語長くらいの時間で頻度が調べられる。

80:デフォルトの名無しさん
06/04/28 10:54:19
しかし問題はより長い単語は少ない単語を含むという点だ。
単語が長いほど出現比率は下がるが。
長い方を採用するか、短くて量で勝負かだ。

81:デフォルトの名無しさん
06/04/28 10:57:32
まずった。
0001と001と01が同じ配列に収められてしまう。
空を0、0を1、1を2に変換して記録しよう。

82:デフォルトの名無しさん
06/04/28 11:04:01
2バイト長の配列を2^27個用意すると256Ｍバイト必要だ。
3の17乗は約2^27だから17bitまでの単語は登録できるな。

83:デフォルトの名無しさん
06/04/28 11:08:39
やってみろよｗｗ

到底zipやrarに太刀打ちできないからｗ

84:デフォルトの名無しさん
06/04/28 12:24:28
>>80
71 のURLの人は、単語の前後の文字のエントロピを見て単語候補を絞り込んでる。
( 0110110 の中の "11" のように)前後が何時も同じときには「単語らしさ」を下げる、と。

85:デフォルトの名無しさん
06/04/28 13:49:06
しかし実用的には単語長はいくつくらいになるんだろうか？
テキストならば8bit×5語=40bit、16bit×5語=80bitくらいだろう。
バイナリなら20bit程度なんだろうか。
この程度なら82の様にハッシュが使える。

86:デフォルトの名無しさん
06/04/28 14:06:04
そもそも対象のデータによって最適なアルゴリズムは異なるのに、
前提条件を明確にせず、延々と馬鹿を晒し続ける奴ばっかりなのは何故なんだ？

87:デフォルトの名無しさん
06/04/28 14:15:13
飛べない豚はただの豚。

戦う前から尻尾を振るのが負け犬。
戦って負けてキャンと鳴いてからが勝負さ

88:デフォルトの名無しさん
06/04/28 14:35:41
内容も理解せずにんなこと言われてもｗ

89:デフォルトの名無しさん
06/04/28 14:48:03
画像圧縮で振幅＋矩形ブロックで、そこそこの圧縮率と高速度のもの作って使ってる。
発表する場もないし、ひとりでひっそりと使ってる。時間軸圧縮も作って、やっぱり動画プログラムでこっそり使ってる。

90:デフォルトの名無しさん
06/04/28 15:10:24
>>86
最強の称号を手に出来るのは
汎用性のある可逆圧縮だ！
データ種類なんて関係ない。

91: ◆Dango91bHA
06/04/28 15:44:57 BE:286659247-
机上の空論はいいから誰かGCA/DGCAよりイイの作って見たら？

どうせZIPやLHAより小さくなるって言ってもたかが知れてるんだし
互換性・普及度が大事だと思うけどな

92:デフォルトの名無しさん
06/04/28 15:53:47
THcompが最強だな。
URLﾘﾝｸ(thcomp.org)

93:デフォルトの名無しさん
06/04/28 16:01:43
>>92
出た！THcomp！この手のスレには必ず出てくるな。

94:デフォルトの名無しさん
06/04/28 16:06:58
現在世界最強はどのアルゴリズム?

95:デフォルトの名無しさん
06/04/28 16:12:39
>>94 URLだろ
たとえば
URLﾘﾝｸ(www.google.co.jp)

96:デフォルトの名無しさん
06/04/28 16:16:25
>>94
だからTHcompだってば。
そろそろ8バイトくらい行ってるかなw

97:デフォルトの名無しさん
06/04/28 17:45:25
どんな計算機でも圧縮出来ない数がある。
その数は、有限だが計算機により計算する事が出来ない。
しかし、私達はその数を単に一文字で表現する事が出来る。　Ω　と

98:デフォルトの名無しさん
06/04/28 18:45:58
URLﾘﾝｸ(www.ice.nuie.nagoya-u.ac.jp)

99:デフォルトの名無しさん
06/04/28 23:51:38
>>77
16bitだと16語どころか半角で2語しか入らないような。

100:デフォルトの名無しさん
06/04/29 03:39:31
バイナリならそんなに16bitもあれば十分。

101:デフォルトの名無しさん
06/04/29 03:41:03
バイナリならそんなに16bitもあれば十分。

102:デフォルトの名無しさん
06/04/29 03:42:56
ぱくろな！

103:デフォルトの名無しさん
06/04/29 13:46:40
ぱくった　というより「引っ張った」という表現の方があってるｷｶﾞｽ。

104:デフォルトの名無しさん
06/04/29 17:31:22
希ガスと言えばヘリウム

105:デフォルトの名無しさん
06/04/29 17:53:06
ヘリウムは潤沢にある。尤も、太陽と言う名前で宇宙に転がっているので熱と質量をどうするかが問題だが。

106:デフォルトの名無しさん
06/04/29 18:05:16
俺はネオン派。

107:デフォルトの名無しさん
06/04/29 20:46:38
僕はキセノン派

108:デフォルトの名無しさん
06/04/29 20:47:28
>>107
キセノンって何

109:デフォルトの名無しさん
06/04/29 20:50:40
アルゴリズムを発見した。
2進数で16bitまでの単語の頻度を調べる。
5bitの単語が100回現れるとする。その単語を1bitに変換出来たとすると
500bitを100bitに縮められる。400bit分小さくできた。
同じようにすべての単語についてなんbit縮められるか調べる。
もっとも縮められる単語を2とおく。
すると10121102221021などとなる。

今度は3進数で頻度を調べる。縮められなくなるまで繰り返す。
誰が実装してくれるﾔｼいない?

110:デフォルトの名無しさん
06/04/29 20:52:29
>>109
それは2進数に直した時にファイルサイズが膨れそう。

111:デフォルトの名無しさん
06/04/29 21:01:51
>>110
それ以前に最初同一データに対して13万通り以上も調べるとなると相当時間がかかる。
あと、縮められなくなるって言うのは同一パターンがまったく含まれない時だけで、
n進数のnにあたる部分が随分大きい時になると思うのだが。

縮める前の文字列を格納するとなると色々附属情報が着いて来てややこしくなるので、
2進数→3進数→4進数→4進数を展開して2進数
という手順を一セットにしてファイルに書き出すのが妥当かと。

・・・と書いているうちに作りたくなったり。

112:デフォルトの名無しさん
06/04/29 21:10:08
>>111
78-82を参考にしてくだされ。ハッシュを使うと簡単かと。

113:111
06/04/29 22:08:10
とりあえず2進数を圧縮して3進数にするアルゴリズムは書けた。
あとは3進数を圧縮して4進数にするのと、4進数を2進数に展開して、そいつを8こ組み合わせてファイルに書き出す。
思ったより面倒＾＾；

114:・∀・）っ-○●◎
06/04/29 22:10:26
2進数→4進数のほうが圧倒的に簡単なのになんでわざわざ3進数にすんだよｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ

115:111
06/04/29 22:15:53
>>114
そういう仕様。>>109のアイデアを実装しやすいように脳内変換して>>111（自身）が書いた通り。

116:デフラグさん ◆WaDYW8eWxU
06/04/29 22:16:02
　 [ﾟдﾟ]　ﾃﾞﾌﾗｸﾞｶﾞｶﾝﾘｮｳｼﾏｼﾀ
　/[＿]ヽ
　　|　|
234→うがざざすだでななにににののほよわわんん倒単圧数数数的簡進進進
ｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ

117:111
06/04/29 22:19:27
talk:>>109
2進数の検索をテストしているのだが、とてもじゃないが16ビットまで調べると時間食いすぎで効率悪い。
コードが悪いのかとも思うが。

備考
8ビットまで→約3分
16ビットまで→約42分

CPU:ペンティアム4 3.0GHz

118:111
06/04/29 22:24:39
因みに検索のテスト対象はソースファイル(10139Byte)です。

119:復号してミナー(1/2) ◆fBLOhapji6
06/04/29 23:01:10
9:q9)Foe0D~W4|IHgpAe7k^&EzD9x20~xa}e4QXf~}Ce_I$d^Ra#uz#px*A{}`3#
m~}]:rtwdycl|EIJkDByL>EQ={Bu~B<j7CzVX&b%3RO6#t*\HQZqzC)Z3B,7R!!p
l`]xx]f~4\FwfyD\:mr];Ne=m2081?ERp0`TLwYHpzH):yKRhrrs\V%N|h'IV3Do
S|'!%Q'Z!S`q458DrvG5&PLds<9Ml9pxdejH|-\wuFD~SK?`\P~=ep+ij^aNgT7v
woYyYZ+R^\_k&7~<$HEDe?O>Fd~ey:nw{J>|M-f}:T>I@{ZK^O`f:5+\Rlu5~U?\
~Swl#^m?8cmvx2t@{3ldz6D|w#yqn=[pwY&}~UC}3Iu~6bS\31kz%*z#o:?dsJqi
u{Yr=/}){uXu`xiYd>L\Wo3}45fKF]mNP9"u?^sD|`Xq2hyv*Q7\{Zk~xeegkd}c
>~[yN,#fj=*`@5m9yel?b|^Gh/fuO1d}5~~SpWp"+w*VDS@n<ib@:~;}h[VQW0Bd
;yaGS7\^4<qkkx|e.@kloEd-lC@D9fvakkAucOt558+x~L:rkdSs\8\}nPS{sn_b
_]l@~y_J-3>#X({^1[9ox<"3u<|eL/(j&dRl^2~ixGwz#O|?m.d5fz\`uZ1\4q=)
c25My|[f7y1{]>FUF9R=~]Kv..rO~TYt3Dw]Zc},}zZm|x{_$=Feo55(D}61Wm-s
FYQp`E^]b~~to.IObF.QQC~A3xZEsDb;|x^]&y=i.~`JVx/xI~rathp|&xnLw@:0
u:LR*f/6_7^E/L5paC}uyJoUM"i7~VbWwFGN]gKJcWyCH!K}vt}/39Lm.ysW}LNN
q[w+4]j[*o`eU!j:2h[0|zF}k^_~r|/W/"}N(YUvnA{_vPj[V\W3:z~YMk;]X]~:
{=HW+g~f5TVmhd,mIjbk\ZP`u~ik{e^ZaQdog}l8~Us%?<T~cm|nJk'@dE!ot_XK
}vz#l\~U[X{EkUkM~xEb(v{>KY'0VHen\a8~Poz~q~^^w&nGr?-<\gx0kIX&5%~R
TC(\f<<ADM]TucX%C*h~u]g^u\bY6iip|`h[qVKVs|TuCD^SN(kFn[%?{]Wwkp6^
[~Hsua3A1Uuen|-;7n,~p<&HF_vy;+x.D:8'ouudz~9;9df5+qw},Agv<]f36]ZZ
N2Yrhmv?6|L1x^&x'mtTk|2J%tyh_b@#uvW`'P~P~A}+N8#Fx~2QxHVj3lP\|JnT
xgj^i[6{0`=Z4vwWitY&k\bKaN^UL1}/o~2StK?sG~)zjX5g;8fy7(RT`UtxU`Y|

120:復号してミナー(2/2) ◆fBLOhapji6
06/04/29 23:02:34
L8dTnQ.^vMK=wTSg3LLb~{$BMv85+tu+Q}N8?ViG@fBA\,S97!oYjistPx@7K*~`
Tu~@53t6"k:OK&zQTFgLPqZnNhL[G@dKIRzw-1"k~!uw8u9J!\k~~RCG%mcHb1cy
g2J}Vq;nVn=yU|2WOOQz}L*8@n5+9pfWGYr-\lNOF|8IEqe>~o\pz5-|f|c+:C2&
D3Fw|ty]D\]Fc~(lSV}Q$8@|2@]*V_H~P|M=mdS|#A'5)QAdE#B*^~k]%'p[fvu3
N+"jr+}l]G8Ss?n<5!}tuI=uhhnf|6#{M7|k6^N=V?T7<{,"(s;'Sw+iD3Cd/ms8
(3~NO~yvwamsveg_[-^yr=8?URHIsc]Ri8.tYj`q.}`'|<zaM~d[0b3>o-I{{bc]
G9}te,Tqwe*xr-VBKlPv]Y%N}JDD'//J`3_tf~Hv3]q;~qjJ!>u~zc$tt7ZdyE\V
A}R~UyThXw^g~u2t#X,%>b}Pm[sB+N{r>*RE2|_cv,xA1Zs?8v_=0*{'R9v<[fII
.43~[?vZRUX`d;YSz0'y}}q9bx?2st`44`-*{0+Ur&rkb3oU}*\(,xyM={cZ$~$a
VwL*ahfhGe/s}1EwrtjW3"|g*[^0S):iu[;^Q1L;ka?[vY^J};*hIM5x$MO-pAj^
@AEr6BR**<=,Cz}n&<v~bWQARQ{h@[ljUht-lk~y}Q9qmSu~zSPC/>6yBggo(1:~
~4XsRGnf:h:Ka.R|fVx{zpWiq@eV~d2h^x,ZV|fJW^TGm7q|Ua{%*Pz6{NoY7\-L
[n21;r0G&UMxgFs.-mPd.g|<O<wRv+9OhfDAR`9lS*|o~BI{1N={3miyj~lAweiE
7BX%Zshu8Z2=7t;#`:kuTI-zS,Dahyv_gDy=Ke?QBy?mK-<kx>jfVJ}mkd~mxJu~
VL9Tv^j~C|a@sg!!!

121:ヒント ◆fBLOhapji6
06/04/29 23:04:54
・Range Coder
・元はbzip2で圧縮したファイル
・圧縮と言うよりは符号化だな
・デフラグさん上等

122:デフォルトの名無しさん
06/04/29 23:06:53
>>119-120
ここは最強の圧縮のアルゴリズムについて話し合う場であり、少なくとも私は暗号化のアルゴリズムについて話し合うつもりはありません。

123:デフラグさん ◆mRgSYalFkQ
06/04/30 00:01:14
>>121

　 [ ﾟдﾟ]y-一~~~~　ﾃﾞﾌﾗｸﾞ?　ﾊｧ?　ﾔﾙｷﾃﾞﾈｪﾖ
　ﾉ[ ﾍﾍ

124:デフォルトの名無しさん
06/04/30 00:17:44
bit単位でファイル全部なめるとしゃれにならん時間かかりそうだし
2進→3進変換でさらにしゃれにならん時間かかりそうだし
2進用の辞書、3進用の辞書、4進用の辞書て具合に辞書だらけになって
あまり縮まなそうだな

ところでこのスレの圧縮アルゴリズムってユニバーサル符号化の方だよな?

125:111
06/04/30 01:18:58
>>124
えぇ。もう16bitまで調べてたらしゃれにもならない時間がかかりましたよ。
10キロバイト引っ掻き回して1時間半くらいでしたかねぇ。

126:124
06/04/30 01:55:39
違うだろエントロピー符号化だよ、よく見ろ俺。
ていうか2進だけ考えれば可変語長のHuffman符号化じゃんか
となると3進以上に変換するのは無意味だな。
たぶん2進→3進の時点で符号表の分だけサイズ増える
おとなしく算術符号なりRange Coderなり使え

127:124
06/04/30 02:07:30
風呂入ってる間にレスついてたか
上にも書いたが>>111のやってることは可変語長のHuffman符号化と変わらん
2進の時点でエントロピー程度まで縮まるので3進以降は全く意味がない

可変語長だからユニバーサル符号化+エントロピー符号化と同程度まで
縮まる可能性はあるが時間がかかりすぎる上に動的符号化に対応できそうにないから
bzip2とか7zipより縮まるとは思えない

128:デフォルトの名無しさん
06/04/30 03:49:38
バイト対符号化より縮まるはずだ！

Wikipedia項目ﾘﾝｸ

129:デフォルトの名無しさん
06/04/30 03:52:48
>>124
一回目の圧縮で辞書に登録するのは最も縮まる2進数1語のみだよ。

130:デフォルトの名無しさん
06/04/30 04:01:57
はじめに最も縮まる単語が1101だったとして
次に3進数のビット列で最も縮まる単語が10101(2が出てこない!)
だっとするとこれを3進数として辞書に登録しなければならず
回数を重ねるごとに辞書長は長くなる。

n　:　繰り返した回数。

n　|　(n+1)進数の単語　|　n進数の単語　|　・・　|　2進数の単語　|　(n+2)進数による圧縮データ

131:デフォルトの名無しさん
06/04/30 04:59:14
単語の統計の取り方と単語の切り出し方などによって縮まる単語は変わってくる。
例えば、00000だと統計的には単語00が4回出てくるが、実際圧縮してみると
220や022になる。重複している部分があるため2つしか出てこない。

132:デフォルトの名無しさん
06/04/30 06:02:12
>>125
16bitなのはハッシュテーブルにそのまま登録できるからという理由なんです。
10Kバイト=80000語だとその16倍(単語長)くらいの繰り返しで回数求められないですか。

2バイトの配列を(3の16乗)個用意しておけばbit列をそのままハッシュとして登録できる。

133:デフォルトの名無しさん
06/04/30 12:40:08
　　2バイトの配列を(3の16乗)個用意しておけばbit列をそのままハッシュとして登録できる。
って軽く30MB超えるんだけど

134:デフォルトの名無しさん
06/04/30 15:15:28
>>133
41メガくらいか。

135:111
06/04/30 17:29:16
データサイズが圧縮前より増えた＾＾；

開発停止しまつ。

136:デフォルトの名無しさん
06/04/30 17:52:31
減ることはあっても増えることはないんだよ。
減るまで繰り返すんだから。

137:デフォルトの名無しさん
06/04/30 17:57:43
んなこたーない。
どんなに続けようが増えるだけのこともある。

138:デフォルトの名無しさん
06/04/30 18:01:05
一回目の圧縮で縮めなかったらそのままなんだよ。
圧縮の定義から。

139:デフォルトの名無しさん
06/04/30 18:19:00
全く縮まない完全にランダムなデータはヘッダやらテーブルやらがつく分増える罠。
非圧縮にした所でやはりヘッダをつけざるを得ないし。

140:デフォルトの名無しさん
06/05/01 04:30:23
>>139
圧縮ファイルの書式のことではないんだよ。>>109で縮まらなくなるまで
続けるといってるだろ。一回目で縮まらなければ何もしないんだよ。

141:デフォルトの名無しさん
06/05/02 00:15:04
辞書は外部に持てばいいんじゃないの？
解凍ソフトと圧縮ソフトで同じテーブルを参照してればよい希ガス

と、暗号素人の俺が言ってみる。

142:111
06/05/02 01:38:47
>>141
辞書を外部に持ったらデータファイル1バイトにでも圧縮できるさ。
じゃぁその外部辞書ファイルはどうやって圧縮するのかって言う話。

そして、同じテーブルを参照する必要があるなら別なテーブルも勿論あるわけで。
そのアドレスを圧縮後のデータファイルの内容にするとしたら、勿論アドレスが重なってはいけない（同じアドレスで違うデータが取り出せてはいけない）為、
ファイルの内容と同じになってしまう。
と言う事はヘッダとかが付く分重くなって終了。

とファイル暗号化ソフトを作った事がある俺が言ってみる。

143:デフォルトの名無しさん
06/05/02 03:53:16
>>141
そういうコンセプトの圧縮アルゴリズムはすでにある。
辞書が固定でしかも巨大になってしまうので汎用的ではないが、かなりの高圧縮率を期待できる。

144:デフォルトの名無しさん
06/05/02 16:57:10
あらゆる文章は 13 バイトに圧縮可能ってやつ?w

145:デフォルトの名無しさん
06/05/02 18:59:10
声自演も

146:デフォルトの名無しさん
06/05/02 19:23:43
符号化の基礎は別の所で勉強することを勧める

147:デフォルトの名無しさん
06/05/02 22:26:53
ここはDOSもばあああああああああああああああああ

148:デフォルトの名無しさん
06/05/02 23:19:47
>>142
>辞書を外部に持ったらデータファイル1バイトにでも圧縮できるさ。
うん？汎用性なくしてどうすんの？
>じゃぁその外部辞書ファイルはどうやって圧縮するのかって言う話。
する必要ないんじゃないの？

ちょっと思いつきで言いますよ。
例えば8bitで区切って見ていったときに、一度も出てこない数があったらそれを記録。
1ビットずつ2個書いて16ビットにして一致する部分を探し、見つけたら8bitに置換する。
複数あったらそれの分圧縮になる。

とかどうですか？

149:デフォルトの名無しさん
06/05/02 23:25:39
＞1ビットずつ2個書いて16ビットにして一致する部分を探し、見つけたら8bitに置換する。

これじゃあ漏れには理解できない。1ビットずつ2個書いたら普通2ビット。

150:デフォルトの名無しさん
06/05/03 00:55:18
1010を
11001100にするってことですよ。

151:デフォルトの名無しさん
06/05/03 02:24:18
>>148
それって劣化BPEじゃね？

152:デフォルトの名無しさん
06/05/03 16:51:46
素人考えだが、画像を圧縮するときの手法を思いついたので聞いてくらさい。
1.輝度の情報を、基色と、それとの誤差に分解。
2.基色をランレングスとかで記録。

手動でシミュレートしてみましたが、どうやってみても圧縮前より容量が大きくなります。
本当にありがとうございました。

153:デフォルトの名無しさん
06/05/03 17:34:17
画像データは1KB当り1円が相場。
そのツールを公開すれば神になれる。

154:152
06/05/03 17:44:25
な、なんだってー！
じゃあ拡張子をjpgにすれば金がワンサカ・・・。

155:デフォルトの名無しさん
06/05/03 17:58:16
ただし名画級だとな。

156:デフォルトの名無しさん
06/05/03 19:02:22
ファイルサイズを一定にするツールは
セキュリティ上のニーズがあるかも知れんな。
大きいものは小さく、小さいものは大きく。
すべてのファイルを10MBにするとか。

157:デフォルトの名無しさん
06/05/03 19:33:47
ファイル分割で十分な気もするが。

158:デフォルトの名無しさん
06/05/03 21:38:52
そういやあの頃はフロッピーサイズに分割するツール、重宝してたな。

159:デフォルトの名無しさん
06/05/03 22:24:48
今はDVDサイズに分割するツールが重宝してるお。

160:デフォルトの名無しさん
06/05/03 22:58:26
>>148
俺が言った「辞書」って言うのは、元ファイルとまったく同等の物。
だから辞書一つにつき2つのファイルを1バイトに圧縮する事ができるが、辞書そのものがなければ復元不可。

161:デフォルトの名無しさん
06/05/03 23:26:37
>>160
つまりTHCompもどきだな

162:デフォルトの名無しさん
06/05/04 00:02:13
148だけど
>>160
だから、汎用性なくしてどうすんの？
分かってて聞いてるのよ。

163:デフォルトの名無しさん
06/05/04 09:08:37
>>161
thcompって、確か圧縮する（そもそも圧縮しないが）ファイルを削除→そのファイルを復元するとかいうネタがあったよね。

164:デフォルトの名無しさん
06/05/04 11:43:57
>>163
・DOSの隠しファイルとして、
・WindowsNT系に存在するストリーム機能を利用して、
・数十～250バイトのファイル内容を、ファイル名にすることで、

見た目のファイルサイズを0にするジョークプログラムがあったと思う

thcompは、アルカイックレコードを参照する >>142 みたいな話
だが、アルカイックレコードを参照するためのポインタが、
結局は元のファイルサイズ（あるいはエントロピーやレート）と同程度になるのは明らか

165:デフォルトの名無しさん
06/05/04 11:52:34
408kbのデータをたった60バイトに圧縮することに成功しました！
そのデータを以下に示します。デコードはマウスでクリックするだけ！

"URLﾘﾝｸ(www.digitalpad.co.jp)"

166:デフォルトの名無しさん
06/05/04 12:20:51
課題：　
１、どんなプログラムを使っても圧縮出来ない１0Ｍバイトのデータを作成する　それより短いコードのプログラムを作成せよ

167:デフォルトの名無しさん
06/05/04 12:22:54
課題の補足：
　入力は行ってはいけない。　たとえば外部から乱数等の入力を行ってはいけない。
　擬似乱数を発生させてもかまわまい。

168:デフォルトの名無しさん
06/05/04 16:08:54
かまわまい

169:デフォルトの名無しさん
06/05/04 16:29:42
【かまわ - まい】
『構う』の受動態『かまわ』に、否定『まい』を付けた語句。

170:デフォルトの名無しさん
06/05/04 16:36:28
手順：

後方分岐しか出来ないシンプルな命令体系のCPUをエミュレートするプログラムを作る
そのメモリ空間を擬似乱数により埋めておき、先頭より実行、
未定義命令を実行すれば終了とする。

ランダムに生成したプログラムは時々無限ループに陥り、永遠に未定義命令を実行しない事がありえるだろう。

後方分岐しか出来ないので、停止が判ったコードはそれ以後のメモリは何でもよい
よって、先頭より順に全ての組み合わせを生成するコードを書き
順に停止するかどうか調べてゆけば、停止するかどうあの確率を求める事が出来る。

確率は当然0より大きく１より小さいので
小数点以下をバイナリで順に出力させる。

このバイナリは圧縮出来るか？

171:デフォルトの名無しさん
06/05/04 16:47:09
brainfuckでjpeg並のやつ作ったら称えてやるよ。
だからってC++のコードをbfに変換するヤツなんか作るなよ。

172:デフォルトの名無しさん
06/05/04 19:04:58
>97=>166,167,170
読んだ雑誌の受け売りしかできんバカは黙ってろよ。

173:デフォルトの名無しさん
06/05/11 13:57:04
agg

174:デフォルトの名無しさん
06/05/11 19:56:59
>>173
aggｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ
ﾜﾛﾀｗｗｗｗ

175:デフラグさん ◆WaDYW8eWxU
06/05/11 21:15:39
　 [ﾟдﾟ]ゝ　ﾃﾞﾌﾗｸﾞﾂｲﾃﾞﾆｱｯｼｭｸｼﾏｼﾀ
　/[＿]
　　|　|
aggｗ{31}ﾀﾛ

176:デフォルトの名無しさん
06/05/11 21:28:45
寧ろegg

177:デフォルトの名無しさん
06/05/11 21:31:59
>>175
ﾜが消えてるよ

178:デフォルトの名無しさん
06/05/11 21:41:30
不可逆圧縮なんで。

179:デフォルトの名無しさん
06/05/11 21:45:55
あれ？非可逆圧縮？不可逆圧縮？

180:デフォルトの名無しさん
06/05/11 23:47:58
文法的には非可逆圧縮が正しいけど、不可逆圧縮という言葉も割と使われているのでどちらもいいと思う。

181:デフォルトの名無しさん
06/05/12 21:44:43
非｛可逆圧縮｝
不可｛逆圧縮｝
このように、装飾する区切りが違います。

182:デフォルトの名無しさん
06/05/12 21:45:13
修飾だﾊﾞｶﾎﾞﾝﾄﾞ

183:デフォルトの名無しさん
06/05/13 00:35:00
「（非（可逆））圧縮」だろバカ。

184:デフォルトの名無しさん
06/05/13 20:05:44
>>181
逆に不可はつかんよ。

185:デフォルトの名無しさん
06/05/13 23:44:27
>>184
じゃぁ所謂「出来なくはない」の類の[否定＋逆]の文って一体？

186:185
06/05/13 23:46:01
[可能＋否定＋逆]　に訂

187:デフォルトの名無しさん
06/05/14 00:04:09
>>181
逆圧縮
ってナニ？

188:デフォルトの名無しさん
06/05/14 00:33:43
>>185
そっちじゃなくて、
　不可罰　罰する
　不可能　能う
　不可解　解する
　不可侵　侵す
　不可逆　逆?
という話。つまり言葉としておかしい。

189:デフォルトの名無しさん
06/05/14 03:53:49
不可は圧縮にかかる、逆も圧縮にかかる

190:デフォルトの名無しさん
06/05/14 04:00:03
可逆は熟語。

191:デフォルトの名無しさん
06/05/14 04:04:07
不可は熟語。

192:デフォルトの名無しさん
06/05/14 09:41:05
gooに聞いてみた。

> かぎゃく 0 【可逆】
>
> 元に戻り得ること。
> ⇔不可逆

> 可逆圧縮【かぎゃくあっしゅく】
>
> 〔lossless（data）compression〕
> 完全復元を前提とした手順で，データを圧縮する方式。アーカイバーなどで用いられる。ロスレス圧縮。
> →圧縮
> →非可逆圧縮
> →アーカイバー

どうしろと

193:デフォルトの名無しさん
06/05/14 16:50:09
何だこいつら
頭悪すぎ

194:デフォルトの名無しさん
06/05/15 09:09:01
不可逆・非可逆で一単語だろ。
「可逆」というのが熟女

195:デフォルトの名無しさん
06/05/15 09:41:02
>>193
おまえはどうなの？

196:デフォルトの名無しさん
06/05/15 09:43:53
そろそろ最弱の圧縮アルゴリズムでも語ろうか。

197:デフォルトの名無しさん
06/05/15 09:48:26
つ BASE64

198:デフォルトの名無しさん
06/05/15 12:51:30
それが圧縮アルゴリズムである限り、最弱は只のアーカイバだろ。

199:デフォルトの名無しさん
06/05/15 12:58:31
>>111,135
のが最強だろ。

200:デフォルトの名無しさん
06/05/15 22:18:13
萌え

201:デフォルトの名無しさん
06/05/16 05:47:32
>>1-200 は圧縮すると 0 bit になりました

202:デフォルトの名無しさん
06/05/16 20:39:55
>>201
それじゃ「圧縮」ではなく「消滅」か「無視」の類。

203:デフラグさん ◆mRgSYalFkQ
06/05/16 21:55:27
>>1-202

　 [ﾟдﾟ]ゝ　ﾃﾞﾌﾗｸﾞﾂｲﾃﾞﾆｱｯｼｭｸｼﾏｼﾀ
　/[＿]
　　|　|
"{2}({53}){53}+{2},{5}-{2}.{6}/{112}0{252}1{179}2{123}3{63}4{72}5{116}6{94}7{36}8{39}9{37}:{107}=>{47}?AB{4}C{3}D{4}E{
2}HKMNOP{2}S{2}T{2}U{2}VW{4}Y[{57}]{57}a{59}b{10}c{7}d{4}e{56}f{2}g{60}h{6}i{14}j{3}k{3}l{4}m{4}n{4}o{10}p{9}r{3}s{57}t
{13}u{2}vw{4}xz{|{2}}~ｭｯｱｲｶｸ{2}ｼ{3}ﾀ{3}ﾂﾃ{2}ﾄﾆﾊﾌﾎﾏﾗﾛ{2}ﾜ{2}ﾝﾞ{6}ﾟ{2}、{33}。{53}，・{7}：{109}？{9}！{3}＿ゝ々ー{31}
～（{5}）{5}〔〕｛{2}｝{2}「{7}」{7}『{3}』{3}【{3}】{3}＋{3}◆→{4}⇔１{3}Ｍｗ{32}ぁあ{12}い{43}う{20}え{7}お{4}か{34}が{28}き{11}
ぎ{3}く{13}け{9}こ{7}ごさ{57}ざし{77}じ{5}す{39}ずせ{4}そ{17}た{25}だ{20}ち{2}っ{24}つ{11}て{36}で{22}と{28}ど{12}な{32}
に{37}ね{2}の{103}は{31}ば{6}ひべ{2}ま{20}み{5}め{3}も{16}ゃ{7}や{5}ゅゆよ{18}ら{11}り{21}る{52}れ{16}ろ{11}わ{6}を{
40}ん{60}ァ{12}ア{7}ィイ{29}ウエ{2}ォ{50}カ{8}キク{8}グ{7}コ{7}ゴ{2}サ{6}シ{2}ジス{5}ズ{8}セタ{7}ダッ{7}ツ{5}テデ{57}ト{5
9}ド{7}ナ{3}ニ{2}ネバ{11}ピ{2}フ{64}ブ{3}プ{7}ポマミ{2}ム{9}メ{2}モ{2}ヤュ{3}ョラ{8}リ{9}ル{72}レ{7}ロ{11}ワン{7}д悪圧{
28}以{3}謂違一{4}隠永円遠俺下{2}化何{2}可{26}火{2}課{2}画{3}解{3}開外拡確{3}割{4}完換間陥基{2}岐{2}機気記輝
擬{2}義{2}逆{23}求級強局金{3}句区空繰系{2}結月{7}見元{6}言{4}限{2}後{3}語{5}誤公功構稿{53}考行{5}合頃今差
最{3}在作{5}削雑参{2}使{2}子思{3}止{3}視誌事{3}似{2}時示辞{3}式実{3}弱{2}取手{4}受{2}修終十{2}重{2}縮{28}熟{3}
出{7}順{5}所書{4}女除小{4}消{2}照{2}称上場情飾{2}色{2}侵{2}神人水{12}数{5}性成{6}正生{3}績切先{2}前{55}然全{2
}素組相装像{2}足存体{2}態大{4}題{2}只単短知張調停{3}定{6}提程訂的点度{4}土{4}投{53}当{3}等{2}頭{3}動{2}同{2}
得読内日{60}入{2}寧能{4}売発罰{2}判汎否{3}非{6}頻{2}不{15}付部復{3}物分{8}文{2}聞{3}並変返補報宝{2}方{3}法{2
}萌本埋未{2}無{52}名{105}命{3}明滅木{19}黙目戻容{2}用{3}葉{2}来{6}乱{3}利率{2}了量力{3}類{2}令{3}劣録話{2}

204:デフォルトの名無しさん
06/05/16 22:27:26
>>203
実はかなり適当？

205:デフォルトの名無しさん
06/05/17 03:44:22
テキストの非可逆圧縮というか、情報縮約というか、
単に出現回数を数えただけじゃないか？しかも、不正確に

206:デフォルトの名無しさん
06/05/17 21:43:01
不可逆でいいんならいくらでも可能

207:デフォルトの名無しさん
06/05/18 18:55:19
非可逆でいいならどんなデータでも1バイトに圧縮（縮小）できるが。

208:デフォルトの名無しさん
06/05/18 19:06:33
>>205
「曖昧」と言うものはなかなか難しい。

209:デフォルトの名無しさん
06/05/19 14:10:01
>>207
じゃあ漏れは0バイトに。

210:デフォルトの名無しさん
06/05/19 14:19:59
>>208
不正確なら簡単だ

211:デフォルトの名無しさん
06/05/19 18:09:23
>>210
ところが、情報理論的に不正確さも決められているので、
闇雲に情報を削除していけばよいということでもない。

212:デフォルトの名無しさん
06/05/19 18:52:01
>>209
消去じゃん。

213:デフォルトの名無しさん
06/05/22 02:22:26
昔いろんな圧縮形式の圧縮率比べまくったなぁ。
画像の可逆圧縮とか、個人で作ってる形式多くて楽しかった。
ＰＮＧしょぼいよ！！とか、ＰＩＣ２つえええとか、ＴＬＧ６すげえなにこれ！とか

214:デフォルトの名無しさん
06/05/22 14:05:38
文章を圧縮するに当たって、文字情報を記録するんじゃなくて意味を記録すればよくね？
文字を書いた人間の、その文に対応したニューラルネットワークの結びを記録、されば読む人間にとっても、その結びから一瞬で意味を理解する事が出来る。
150年ぐらい後の話だけどね。なんじゃこれは、SFか。

215:デフォルトの名無しさん
06/05/22 17:58:53
意味を解釈するプログラムのサイズが馬鹿でかくなる

216:デフォルトの名無しさん
06/05/22 19:07:35
プログラムが意味を解釈する必要は無い。
記録する情報は、記録者の脳内ニューロンの繋がり（語句）を集めたもの（文章）だからだ。

217:デフォルトの名無しさん
06/05/22 19:11:35
暗号化の対象がASCII文章のみなら、考えたアルゴリズムあるよ。
ASCII文字のうち有効文字は7750文字ちょっとで、12ビットあれば十分保存可能だから
保存に16ビット使う全角文字は4ビット落ちるし、保存に8ビットしか使わない半角文字の場合は
特殊な開始コードとかを使って無圧縮にする。

誰か作ってくれ。

218:デフォルトの名無しさん
06/05/22 19:12:06
age

219:デフォルトの名無しさん
06/05/22 21:07:26
>>217
その「特殊な開始コード」に必要なビットが、バカにならんのよ。
無圧縮部分に圧縮されていない印を付けると言うことは、その部分で
データが膨らんでいると言うことだから。

220:デフォルトの名無しさん
06/05/22 21:25:38
>>217
ASCII文書で有効文字が7750とか、もう言ってる事がめちゃくちゃ。
人格も発言内容も否定したくは無いが、会話の土台を築くために
まずは "ASCII CODE"とかの意味を調べてくれ。

221:デフォルトの名無しさん
06/05/22 22:29:46
まあアルファベットと空白だけの文章なら一文字7bitでいけるけど、
ってそういうことを言いたかったんじゃないのか。

222:デフォルトの名無しさん
06/05/22 22:38:31
6bitでいけるわボケ
アホは黙ってろ

223:デフォルトの名無しさん
06/05/22 22:54:01
>>220
言いたいことの意味はわかるが「会話」じゃなくて「対話」な、
この場合。

224:デフォルトの名無しさん
06/05/22 23:26:02
>>223
脳内定義持ち出してまで
なにを必死になってるんだろう。
とりあえず辞書引け。

225:デフォルトの名無しさん
06/05/23 00:22:40
俺が実践している最強の画像圧縮アルゴリズム

画像を眺めながらオナニーをしてデータによって握りの圧力や刺激点を変える。
解凍するときは目を閉じて暗号化時と同じ手法でチンコをこすると画像がまぶたの裏に！

226:デフォルトの名無しさん
06/05/23 00:41:59
抜けない画像は削除
これで5%くらいまで非可逆圧縮できますよ

227:デフォルトの名無しさん
06/05/26 07:18:06
>>225
それ、すこしでも「つぼ」間違えたらぜんぜん違うファイルにならないか？

つか保守&アゲ

228:デフォルトの名無しさん
06/05/26 09:35:52
なんでも全部0xffに縮めて、相手が怒ってきたら謝ればいいんだよ。

229:デフォルトの名無しさん
06/05/26 16:59:36
【IT】米Microsoft、新画像フォーマット「Windows Media Photo」発表
ｽﾚﾘﾝｸ(bizplus板)

230:デフォルトの名無しさん
06/05/26 20:07:33
>>152
写真とかだとさ、大体色の同じような場所は固まってるよね。
だからこの圧縮方法結構使えるんじゃね？

231:デフォルトの名無しさん
06/05/26 20:43:17
１ドット単位のチェック柄の画像（ディザとか）で死亡

232:デフォルトの名無しさん
06/05/27 00:40:30
画像で圧縮率がいいのはTLG6かな。
場合によってはERIやJPEG2000が上の場合もあるけど。

233: ◆NEVADAi.iI
06/05/27 09:13:17
例えば、下の2行を圧縮するとき

画像で圧縮率がいいのはTLG6かな。
場合によってはERIやJPEG2000が上の場合もあるけど。

89 E6 91 9C 82 C5 88 B3 8F 6B 97 A6 82 AA 82 A2
82 A2 82 CC 82 CD 54 4C 47 36 82 A9 82 C8 81 42
0D 0A 8F EA 8D 87 82 C9 82 E6 82 C1 82 C4 82 CD
45 52 49 82 E2 4A 50 45 47 32 30 30 30 82 AA 8F
E3 82 CC 8F EA 8D 87 82 E0 82 A0 82 E9 82 AF 82
C7 81 42 0D 0A

というバイト列を 16(任意だけど固定) づつまとめて

234:デフォルトの名無しさん
06/05/27 09:14:27
89 10001001
E6 11100110
91 10010001
9C 10011100
82 10000010
C5 11000101
88 10001000
B3 10110011

8F 10001111
6B 01101011
97 10010111
A6 10100110
82 10000010
AA 10101010
82 10000010
A2 10100010

縦と横を並べ替えて

11111111 10111111
01000100 01000000
01000001 01010101
00110001 00100000
10010010 11000100
01010100 10110000
01001001 11111111
10100101 11100000

としてから圧縮を始めると圧縮率が上がるような気がするけど気のせい？

235:デフォルトの名無しさん
06/05/27 14:49:20
>>233-234
文字が全部全角文字なら圧縮率が上がる可能性は十分考えられる。
半角文字列ならあんまり変わんないと思う。

236:デフォルトの名無しさん
06/05/27 15:06:21
>>235
最上位ビットに規則性が生まれることに違いはないから改善するんでね?

次ページ