- 1 名前:nobodyさん [2007/01/11(木) 02:40:43 ID:uW7xEbZY]
- 【正規表現道場の掟】
・言語不問 ・質問も大歓迎。使用言語を書くのを忘れずに。 正規表現と関係ない話・質問は他スレへどうぞ。
- 622 名前:nobodyさん mailto:sage [2010/05/02(日) 11:44:31 ID:???]
- >>619-621
そうか、未来の拡張を考えて緩くしたけど、 2バイト文字以外のブログじゃ広くマッチしすぎるって事か。。。 それじゃスマイリーコードの方に厳格なルールを... なんって考えるのもユーザーに優しくないし。 折り合いつけるの難しいね :|
- 623 名前:nobodyさん mailto:sage [2010/05/02(日) 19:52:37 ID:???]
- >>622
厳格さが必要でない処理が行われるというのがイメージできんのだけど、 マッチさせてどうしたいんだ?
- 624 名前:nobodyさん mailto:sage [2010/05/02(日) 20:21:19 ID:???]
- >>623
とあるCMSで、 引用表示の時は、リンクとか画像とか取っ払う追加プログラム書いてるから。
- 625 名前:nobodyさん mailto:sage [2010/05/02(日) 22:35:26 ID:???]
- >>624
文から推測すると、前提として普通の記事の場合はスマイリーコードとやらが画像に変換されるということがあって、 その記事が引用されてる場合はそれらを除去したいということか? 前提が正しいならスマイリーコードを画像に変換する時に使ってるルールを厳格に使うべきだし、 正しくないならリンクでも画像でもないスマイリーコードを除去する必要がないと思うんだが
- 626 名前:nobodyさん mailto:sage [2010/05/02(日) 23:09:45 ID:???]
- >>625
正解です。 通常記事ではスマイリーコードが画像に変換されます。 で、引用時には、それら(改行,スペース,タブ,画像,リンク等)を除去して コンパクトにしたいのです。 引用文にスマイリーが入ってもいいんですが、 記事を丸める過程で<img>タグが邪魔したので、除去するを仕様としました。
- 627 名前:nobodyさん mailto:sage [2010/05/03(月) 00:05:08 ID:???]
- >>626
一度img要素に置換したものをベースにするというのがそもそもおかしいのでは? もしかして表示する直前に置換してるんじゃなくて、DBに突っ込む段階で置換しちゃってるとか? それだったら設計を見直したほうがいいと思うんだけど
- 628 名前:nobodyさん mailto:sage [2010/05/03(月) 00:07:04 ID:???]
- >>626
じゃあやっぱり >スマイリーコードを画像に変換する時に使ってるルールを厳格に使う が一番スマートなんじゃないか それができないなら一旦引用されていない記事として処理して、そこからimgタグを除去するとか 正規表現の話からはだいぶそれたので俺はこれ以上何も言わないことにするよ :P
- 629 名前:nobodyさん mailto:sage [2010/05/03(月) 00:36:11 ID:???]
- >>627-628
スマイリーコードが置換されるのはDBから引っ張ってからですが、 追加プログラムの導入IDによって優先順位があるので単純ではないんです。。。 で、私も正規表現から脱線しすぎなのでこれが最後。 脱線ついでに、タイムズスクウェアで爆発物を積んでた車って。。。 家の車も正規表現でマッチしちゃうwww
- 630 名前:nobodyさん [2010/05/19(水) 16:47:15 ID:t/z/xcK5]
- 質問させてください!
ああああああ @ ABCD @ abcd という文字を <b>ああああああ</b> @ ABCD @ <em>abcd</em> のように置換したい時はどういう正規表現を使えばいいのでしょうか? よろしくお願いいたします
- 631 名前:nobodyさん mailto:sage [2010/05/19(水) 17:44:20 ID:???]
- その例にするための条件って何?
スペース @ スペース が区切りとか?
- 632 名前:nobodyさん [2010/05/20(木) 19:43:15 ID:avs5qFDL]
- 質問させてください。
<table> <tr> <th>名称1</th> <td> 値1 </td> </tr> <tr> <th>名称2</th> <td> 値2 </td> </tr> </table> のようなHTMLがあります。 実際には全ての改行とインデントはトリムされてます。 この値1の部分をとるにはどのような正規表現を使えば良いでしょうか? <th>名称1</th><td>([^<]*)</td> のように考えてましたが値1には<img>タグが入る場合があります。 <table>や<td>が入ることはありません。
- 633 名前:632 mailto:sage [2010/05/20(木) 19:44:24 ID:???]
- 途中で投稿してしまいました。
お手数ですがご教授よろしくお願いします。 なお、当方18歳女子になります。
- 634 名前:nobodyさん mailto:sage [2010/05/20(木) 19:54:06 ID:???]
- <th>名称1</th><td>(.*?)</td>
- 635 名前:nobodyさん [2010/05/20(木) 20:40:36 ID:a5arSWsA]
- www19.atpages.jp/imagelinkget/get.php?t=v&u=www.phpbook.jp/regexp/ini/img/p1-1.png
ukiya.sakura.ne.jp/index.php?plugin=ref&page=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE%E8%AC%9B%E5%BA%A7%2F1&src=regex1.png ukiya.sakura.ne.jp/index.php?plugin=ref&page=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE%E8%AC%9B%E5%BA%A7%2F8&src=regex8.png
- 636 名前:nobodyさん mailto:sage [2010/05/20(木) 21:13:11 ID:???]
- <th>名称1</th><td>(値1|<img>)</td>
- 637 名前:632 [2010/05/21(金) 22:05:20 ID:E8tDrX2s]
- ありがとうございました。
無事に解決できました。 これより踊りに行くのでこれにて失礼致します。
- 638 名前:nobodyさん mailto:sage [2010/05/24(月) 12:25:48 ID:???]
- 便乗だけど
<table> <tr> <th>名称1</th> <td class="abc"> 値1 </td> </tr> <tr> <th>名称2</th> <td class="def"> 値2 </td> </tr> ...あと何個か続く この場合 <th>名称1</th><td .*>(.*?)</td> にしたのですが 何故かうまく 値1 だけ取得できません どうも .*で余計なものも取得しているようです どう書けばいいでしょうか 当方JKです。
- 639 名前:nobodyさん mailto:sage [2010/05/24(月) 14:40:31 ID:???]
- <th>名称1</th><td .*?>(.*?)</td>
|

|