Perlについての質問箱 ..
[2ch|▼Menu]
511:デフォルトの名無しさん
07/01/26 18:19:13
URLリンク(www.alles.or.jp)
684万人を調べて、約7万8千種の名字ランキングを公開している人がいるぞ。
そのデータを使うのが手っ取り早いと思われる。
....しかし、ヒマ人だな〜。


512:デフォルトの名無しさん
07/01/26 19:17:30
読みを当てはめるのも結局確率だから
↑のデータ使ってもやっぱ無理っしょ

513:デフォルトの名無しさん
07/01/26 20:45:14
そこでAIの出番なわけだ

514:デフォルトの名無しさん
07/01/26 20:52:49
そこでエスパーの出番なわけだ

515:デフォルトの名無しさん
07/01/26 20:57:04
WindowsXP上でActivePerlを使ってるんですが、USBデバイスをコントロールする方法はありますか?
学習リモコンのクロッサム2+USBとデータをやりとりしたいんですが。

516:デフォルトの名無しさん
07/01/26 21:07:32
>>511のリンク先より引用
----
名字 ふりがな 人数 順位 累積人数  累積比率
鈴木 スズキ 139,627 1  139,627 2.04029%
鈴木 ススギ 25 13,107 6,517,718 95.2398%
鈴木 ススキ 7 27,840 6,723,557 98.2476%
鈴木 スズノキ 3 41,426 6,795,040 99.2922%
鈴木 スズ 2 47,333 6,812,494 99.5472%
鈴木 スズシ 2 47,333 6,812,506 99.5474%
鈴木 スヅキ 2 47,333 6,812,518 99.5476%
鈴木 スス 1 56,150 6,832,142 99.8343%
鈴木 ススヘキ 1 56,150 6,832,147 99.8344%
鈴木 ススリキ 1 56,150 6,832,148 99.8344%
鈴木 スズギ 1 56,150 6,832,151 99.8344%
鈴木 ズスキ 1 56,150 6,832,308 99.8367%
鈴木 ズズキ 1 56,150 6,832,309 99.8367%
鈴木 ヌズキ 1 56,150 6,836,957 99.9047%
----

姓しかわからない状況で確実に読み仮名をつける方法は
>>513のAIじゃなく >>514のエスパーだな。
AIについて無知な>>513はAIと書けばかっこいいと思ってるのか?

517:デフォルトの名無しさん
07/01/26 21:11:14
ヌズキはねーよw どう考えても書き間違いだろwww

あ、ヌズキさん見てたらごめんなさい><

518:ヌズキ
07/01/26 21:24:52
呼んだ?

519:デフォルトの名無しさん
07/01/26 21:26:36
名前の仮名振りは、人間がやってもかなり難しい。
自動化なんてとても無理。 入力補助が限界でしょうね。

520:デフォルトの名無しさん
07/01/26 21:50:28
あと「ズスギ」さんと「ズズギ」さんが入れば
濁点のあるなしの組み合わせがそろうのにな

521:デフォルトの名無しさん
07/01/26 22:00:02
読みが存在しない漢字が存在する

522:デフォルトの名無しさん
07/01/27 00:46:22
たとえば、「東」と書いて「あずま」「ひがし」「とう」と、読み方がいろいろある。
漢字だけからは読み方は判別できない。
そのため、正しい読み方は、本人にしかわからない。

523:デフォルトの名無しさん
07/01/27 00:52:27
同じクラスに五島(ごとう)と五島(ごしま)が居たことあるよ。

524:デフォルトの名無しさん
07/01/27 01:09:35
>>523
おまえ、ひょっとして1年2組の時の近藤(こんどう)か?
おれ隣のクラスの権藤(ごんどう)だよ。おぼえてるか?

525: ◆TWARamEjuA
07/01/27 01:37:47 BE:4356285-BRZ(6761)
住基ネットワークに問い合わせれば総て解決♪

526:デフォルトの名無しさん
07/01/27 15:01:28
>>515
キミの質問は、2つに切り分けないといけない。
1.クロッサム2のDLLのインターフェースが公開されているかどうか。
2.ActivePerl から DLLを呼び出せるかどうか。

両方とも「YES」だからできるのだが、質問の切り分けができず、
「1」の当否を回答者に調べさせるキミには無理だ。

527:デフォルトの名無しさん
07/01/27 15:20:23
>>525
スーパーハッカーキタ━━━(゚∀゚)━━━ !!

528:デフォルトの名無しさん
07/01/27 16:01:58
あふぉか
姓しかわからないデータと住基ネットのデータをどうリンクするんだよ。
>>525=>>527か?
くだらないネタにみんなスルーしてるわけだが、
自作自演するほど反応してほしかったのか?


529:デフォルトの名無しさん
07/01/27 16:22:13
ネタだと思っているなら何故あふぉとか言ってマジ突っ込みするんだろう。分裂気味?
まぁ大方、真相がネタでもマジでも恥かかないよう工夫したら前後で矛盾が出たってとこか。

530:デフォルトの名無しさん
07/01/27 17:17:34
まぁ未承諾さんだし。

531:デフォルトの名無しさん
07/01/27 18:02:01
>>526
もちろんDLLとかWindowsの約束とかよく分かっておりません。
そのあと、mrccom.dllを見つけてWin32::APIでimportを試すところまで来ましたが、
unknown errorでimport出来ず\(^o^)/。どなたか気が向いたら教えてください。

532:デフォルトの名無しさん
07/01/27 20:09:12
>>528
サブイ

533:デフォルトの名無しさん
07/01/27 22:26:03
>>527,>>529,>>532
ここはvipでも口論・議論ではなくperlの質問箱スレだ。
前日の終わったネタをいつまでも引きずったり、
指摘されて逆切れして粘着するぐらいならほかのスレ行けよ


534:デフォルトの名無しさん
07/01/27 22:45:22
>>528=533 別に君以外誰も文句も言ってないし、しきりも頼んでないけど。
頓珍漢レスを>>529に指摘されて逆ギレしてる張本人乙にしかみえないよ?w

535:デフォルトの名無しさん
07/01/27 22:52:37
粘着だが逆ギレだか知らんが、
PerlのスレでPerlの話をしないやつはすべて平等に価値がない

536:デフォルトの名無しさん
07/01/27 23:29:55
ここは批判されると30分以内に逆切れコメントする527を観察スレですか?

537:デフォルトの名無しさん
07/01/28 00:35:56
>>531
>どなたか気が向いたら教えてください。
まず、C++を勉強しろ。C++でDLLを扱えるようになること。
PerlでDLLを扱う話はそれからだ。

538:デフォルトの名無しさん
07/01/28 01:35:42
>>533
ここはvipでも口論・議論ではなくperlの質問箱スレだ。
前日の終わったネタをいつまでも引きずったり、
指摘されて逆切れして粘着するぐらいならほかのスレ行けよ

539:デフォルトの名無しさん
07/01/28 02:58:29
    __
    |   |
    |   |   ___                  ___
    |   | .  /     |  __    _____   / _  \
    |   |  /  /|  |  /  /   / ____/  / /  >  l
    |   |. /  / .|  |. /  /   / /..   _    /   ̄  /
    |   |/  /  |  |/  /   /   ̄ ̄_/   /      \
    |       /.   |     /   / / ̄ ̄ __   /  / ̄ ̄>  |
    |    /   |___/  ./   ̄ ̄ ̄ /  /    ̄ ̄  /
     ̄ ̄ ̄             ̄ ̄ ̄ ̄ ̄     ̄ ̄ ̄ ̄ ̄     _____      ___ ___    ___
    ______                             /__  __/ [][] _| |_| |__ _| |_
     |  ___  \                               / /     |    _  | |_  レ'~ ̄|
     |  |    \  l                              |  |_      ̄|  | / / /   /| |
     |  |____/  /                             \__|      |  |  ̄ /_  /.  | |_
     |  ____/ ___  __    __/ヽ                    |_|.     |__|.   \/
     |  |     /`、_/_/ / _ ヽ  / _  /
     |  |     ヽ  /   | l   l l  | l   l l
     |  |       | l     ヽ  ̄ /  ,ヽ  ̄ /
      ̄          ̄      ̄ ̄  / __ ヽ
                        | l     l l
                        ヽ  ̄ ̄ /
                         ~ ̄ ̄~

540:デフォルトの名無しさん
07/01/28 03:41:10
それ、もう少し小さくならんか。

541:デフォルトの名無しさん
07/01/28 04:14:20
  Web
      でやれ
  Prog

542:デフォルトの名無しさん
07/01/28 04:16:24
vv3bpr0gマ”ゃれ

543:デフォルトの名無しさん
07/01/28 21:16:33
Image::Magickで32bit(RGBA)のpngを読み込んで、24bit(RGB)のpngに書き出したいんだけど、
どうやればいいか教えてください。

544:デフォルトの名無しさん
07/01/28 21:39:34
URLリンク(mechanics.civil.tohoku.ac.jp)
convertで24bit Raw RGBで出力して
それを再度pngで出力すればいいんでね?

545:543
07/01/29 00:12:46
もう少し調べてみたら、
$im->Set(matte => 0);
で解決できました。スレ汚しごめんなさい。

546:デフォルトの名無しさん
07/01/30 20:26:33
threads::shared なんですが、
例) $var : shared;
と言うのは、文法的にどういう意味なのでしょうか?
threadsだけに許された特殊な文法なのでしょうか?

547:デフォルトの名無しさん
07/01/30 21:18:54
attributes

548:デフォルトの名無しさん
07/01/30 22:02:55
>>547
ありがとうございます
CPANで見ても英語がさっぱりで…
分かり易く解説されているページ等はないでしょうか
はてなのは見ましたがさっぱりです

549:デフォルトの名無しさん
07/01/31 17:01:01
質問です
UNIX系OSやWindowsで
.soや.dllを利用したいのですが、
どうするのが一般的でしょうか?
出来れば日本語の解説ページをお願いします

550:デフォルトの名無しさん
07/01/31 23:53:20
質問です
コマンドラインでカウントダウンってできますか?

C:\>perl hoge.pl
次の処理まで待ち時間: 5秒...

のところ “5”の部分のみが 4 3 2 1... と更新されていくようにしたいのです
いちおー system "cls (もしくは) clear "でスクリーンごと更新とかは なしで

Activeperlですが cpanで解決するなら cpanでも結構です

よろしく〜

551:デフォルトの名無しさん
07/02/01 00:00:31
>>550
¥b


552:デフォルトの名無しさん
07/02/01 00:05:34
>551
うおっ! ありがとうございます!!
さっそくそのキーワードで調べてみます!!

553:デフォルトの名無しさん
07/02/02 13:47:58
perlでISHテキスト←→バイナリ変換するモジュールってある?
一通りCPANしたりぐぐったりしてみたが見つからなかったんだけど。

554:デフォルトの名無しさん
07/02/02 15:02:25
質問です。
項目数(列数)が多いCSVのデータを読み込んで処理するとき、皆さんはどうしてますか?

私は10項目くらいでしたら
my($id, $name, $age, ..) = split /,/;
と、それぞれ変数を用意するのですが、

100項目を超えるような場合、項目名を要素とする配列を用意しておき
@col_name = qw(id name age ..);

連想配列に格納して
my @array = split /,/;
my %hash = ();
for(0..$#col_name) {
  my $key = $col_name[$_];
  my $val = $array[$_];
  $hash{ $key } = $val;
}
$tel = $hash{tel};

今扱ってるCSVはデータの件数(行数)が500件あって、上記の連想配列の格納をその件数分繰り返し行なっています。



555:554
07/02/02 15:03:04
「項目名 => 項目番号」の連想配列を用意しておくのがいいのかなとも思うのですが、
%col_no = (
  id => 0,
  name => 1,
  ...,
  );
$tel = $array[ $col_no{tel} ];
↑ちょっと読みづらいかなとも思います。

項目数・項目名が変わる可能性は低いです。
効率よりも読みやすさ重視です。

よろしければ、ご意見お聞かせください。


556:デフォルトの名無しさん
07/02/02 15:07:30
$tel = $array->[$i]->{'col_no'}->{'tel'};

557:デフォルトの名無しさん
07/02/02 15:09:34
$tel = $array->[$i]->{'tel'};
これでいいのか
入れ方は任せる

558:デフォルトの名無しさん
07/02/02 18:22:13
@col_name = qw(id name age); # member

$_ = "1,hiroyuki,30"; # csv
@$record{@col_name} = split /,/;


#
print $$record{id},"\n";
print $$record{name},"\n";
print $$record{age},"\n";

559:デフォルトの名無しさん
07/02/02 21:32:19
利便性の為にハッシュを使わざるを得ないのが気になってるんじゃないの?
配列でやりたいなら、こんなことしちゃったり:

my $r = MyRecord->new(split /,/);
print("$r->name\n");

package MyRecord;
BEGIN {
my $i = 0;
my @col_name = qw(id name age); # カラム名を設定。
for my $n (@col_name) {
eval qq{ sub $n :lvalue { \$_[0][$i] }};
$i++; }}

sub new { bless [@_[1..$#_]], $_[0]; }

560:デフォルトの名無しさん
07/02/02 21:34:18
ミス。
print("$r->name\n")
修正 → print($r->name, "\n")

561:デフォルトの名無しさん
07/02/02 22:02:33
>>559
evalで作るのと、*{...} = sub{}で作るのどっちがスマートなんだろ。

562:デフォルトの名無しさん
07/02/02 22:22:43
evalはパーサが動く分遅くはなりそうだけど
通常の定義と見た目が一貫してるから読みやすいかも。

シンボルテーブル+クロージャだと、クロージャ作る側のレキシカルな環境?も意識しないとならないし、ちょっと嫌。

563:554
07/02/03 10:09:16
>>556-562
ご回答ありがとうございます。

いろいろ方法があるのですね。
まだご回答の内容が理解できていないので、勉強してきます。

564:デフォルトの名無しさん
07/02/04 09:24:15
他人が作った、FTPで複数のファイルを受信する為の処理に手を入れなくては
いけないのですが、元のソースにエラー時の処理が全く入っていません。

$ftpcmd = ○○○ #<-ftpコマンドが記述されたテキストファイル
system("ftp -n < $ftpcmd);

対象ファイルは複数あって mget logfile*.* で取って来ています。
ファイルが取って来れなかったり、相手に接続できなかったりといったような
エラーが起きた事を判定するにはどのようにすればいいのでしょうか?
PerlもLynuxも初めてなので、出来るだけ簡単な方法を教えていただけると
ありがたいです。

よろしくお願いします。

565:デフォルトの名無しさん
07/02/04 13:04:46
Net::FTP で書き直したらいいんじゃないかな。

566:デフォルトの名無しさん
07/02/04 15:35:04
>>564
Net::FTPでスクリプト書く例
URLリンク(search.cpan.org)

モジュールが入ってなかったら「perl CPAN」でググってCPANの使い方覚えていれろ

567:デフォルトの名無しさん
07/02/04 16:26:22
Lynuxはおらも初めてだ

568:デフォルトの名無しさん
07/02/04 17:13:07
>>565-566
そのやり方で書き直してみます。
ありがとうございました。

>>567
Linuxの打ち間違いですね。

569:デフォルトの名無しさん
07/02/05 23:30:35
>>565-566

教えていただいた方法で組んでみたのですが、複数のファイルをワイルドカードで
指定して取って来るにはどうしたらよいのでしょう?

対象のファイル名には出力された日付と時刻が含まれていて、個数も名前も不定
なのです(○○○YYYYMMDDHHMM.logのようなファイル名で、日付部分が
当日のものだけ取って来たいのです)。

何度もすみませんがよろしくお願いします。



570:デフォルトの名無しさん
07/02/06 01:45:03
sub mget {
   my($ftp,$pattern) = @_;
  foreach my $file ($ftp->ls($pattern)) {
     $ftp->get($file) or warn $ftp->message;
  }
}


571:デフォルトの名無しさん
07/02/06 23:22:19
>>570
どうもありがとうございます。
上手く持ってこれました。



572:デフォルトの名無しさん
07/02/07 11:31:08
希望結果を得たいのですが、実行結果の通りになります
以下のソースで実行結果になることは納得できるのですが、
希望結果を得るためにはどうすれば良いのでしょうか?

●ソース
@$data=(
{'name'=>'test1','pay'=>'1000','cancel_flg'=>'0','create_date'=>'20070131','cancel?date'=>''},
{'name'=>'test2','pay'=>'2000','cancel_flg'=>'1','create_date'=>'20070110','cancel_date'=>'20070120'},
{'name'=>'test3','pay'=>'100','cancel_flg'=>'0','create_date'=>'20070201','cancel_date'=>''},
);
foreach(@$data){
push(@lst,$_);
if($_->{cancel_flg}){
$_->{create_date}=$_->{cancel_date};
$_->{pay}="-".$_->{pay};
push(@lst,$_);
}
}
print "$_->{name}\t$_->{pay}\t$_->{create_date}\n" foreach(@lst);

●実結果
test1 1000 20070131
test2 -2000 20070120
test2 -2000 20070120
test3 100 20070201

●希望結果
test1 1000 20070131
test2 2000 20070110
test2 -2000 20070120
test3 100 20070201

573:デフォルトの名無しさん
07/02/07 11:44:59
foreach(@$data){
push(@lst, {%$_});

574:デフォルトの名無しさん
07/02/07 11:55:08
>>573
ありがとうございます
希望どおりの結果を得られました
ハッシュ内のデータを1つずつ別のハッシュに移し替えることで回避していましたが
これからはソースがスマートになりそうですw
私が無知なだけだと言う話かも知れませんが、勉強になりました

575:デフォルトの名無しさん
07/02/07 12:23:24
こういうことだな。
$X = ['A'];
$Y = $X; #リファレンスデータのポインタ(?)だけをコピーして、データそのものはコピーしてない。
$X->[0] = 'B';
print $Y->[0];

結果「B」

576:デフォルトの名無しさん
07/02/07 12:36:30
ちょっとCPANで調べるとStorableのdcloneとか、
Clone(::More/Fast/PP/Any...)とかなんかたくさんあるんだけど
どれを使うのがいいんだよ

577:デフォルトの名無しさん
07/02/07 12:39:19
俺は年寄りなのでcancelないときもコピーすんのもったいないと思ってしまう


578:デフォルトの名無しさん
07/02/07 13:56:18
辞書みたいなものを作っているのですが、見出し語にダブりが多数あります。
こんな感じで。

<midashi>kuki</midashi>
茎とはクキである。・・・・・

<midashi>kuki</midashi>
  茎とはクキである。・・・・・

見出し部分タグ内が同じ場合のみ、一つ残してダブりのぶんは見出しも本文も消す、
という作業を行いたいのですが、perlで出来ますか? 
何を勉強すればよいのか、示唆頂ければありがたいです。

579:デフォルトの名無しさん
07/02/07 14:05:52
xmlなら、専用のエディタ使う方がよっぽど早くて安全だと思うのだが。

580:デフォルトの名無しさん
07/02/07 16:05:05
ファイルのパースさえ出来れば楽勝だろうけどたぶんそこが一番の問題だと思う
機械読み取りを考慮した仕様になってればいいんだが

581:デフォルトの名無しさん
07/02/07 22:15:16
配列を初期化したいのですが、どのようにすればいいのでしょうか?

引き渡したパスにあるファイル名を配列に入れて、そのファイル1つ1つを順繰りに
処理していきたいのですが、1度処理をした後でもう1度処理を行うと、最初に配列
にセットしたファイル名が配列に残ってしまっています。
下のソースだと、「1回目」と「2回目」のところでは同じ内容のファイル名が表示
されます(2回目では何も表示されないで欲しいです)。
どこがおかしいのでしょうか?ご指導を宜しくお願いします。

sub aa{
($path) = @_;
@localfl;
@dir;

opendir(DIR,$path) || return(-1);
@dir = readdir(DIR);
foreach $f (@dir){
if($f =~ /^\.\.?/){ next;}#親&カレントフォルダ(.と..)を除外
$localfl{$f} = $f;
}
foreach $f (sort(keys(%localfl))){
print("1回目 $f\n");
}
undef @localfl;#これでクリア?
@localfl = ();#これでクリア?
foreach $f (sort(keys(%localfl))){
print("2回目 $f\n");
}
}

582:デフォルトの名無しさん
07/02/07 22:20:07
@localfl と %localfl は別物ですよ

583:デフォルトの名無しさん
07/02/07 22:55:59
なぜに Perl4 …
変数全部グローバルだし

584:デフォルトの名無しさん
07/02/07 23:05:43
>>582
@localflには最初から何も入ってなくて、%localflをクリアしてないから
前の中身が残ってるということでしょうか?
%localflの中身をクリアすればOKですか(%localfl=""; とか・・?)

>>583
すみません、まだPerl触り出して1週間のド素人なもので・・。


585:デフォルトの名無しさん
07/02/07 23:30:02
%localfl = ();

586:582
07/02/07 23:36:52
とりあえず >>585 の %localfl = (); または undef %localfh; で意図する結果が得られます

バグの温床になるのを防ぐために use strict; と use warnings; をお薦めします
変数を宣言するときは my を使ってください
適当に書き直したらこんな感じでしょうか

use strict;
use warnings;
sub aa {
my ($path) = @_;
opendir(my $dh, $path) or return -1;
my @localfl = sort grep { ! /^\.\.?/ } readdir($dh);
foreach my $f (@localfl) {
print("1回目 $f\n");
}
}

587:デフォルトの名無しさん
07/02/08 00:19:07
>>585
>>586

丁寧に教えていただきありがとうございました。
参考にさせていただきます。

588:デフォルトの名無しさん
07/02/08 20:09:30
Encodeモジュール使い方を勉強中です。
なんとか試行錯誤しながらやってるんですが、
Data::Dumper がやたら文字化けします。
Dumper無しで出力すると化けないので
エンコードの部分は間違ってないと思うのですが。

589:デフォルトの名無しさん
07/02/08 20:16:37
use strict;
use utf8;
use Data::Dumper;
binmode STDOUT,":encoding(cp932)";
my $str="あああ";
print Dumper $str;
print $str;
以上をutf8で書いて実行すると
$VAR1 = "\x{3042}\x{3042}\x{3042}";
あああ
となります
どうにかして日本語をDumperする方法はないでしょうか?

590:578
07/02/08 20:17:25
ありがとうございました。
XML エディタ で検索してみましたが、どうもよく分かりませんでした。
ちなみに見出しは全部でaからzまで数十万あります。
ダブり語は多分、数千種類が各2〜7個くらいダブっています。
差し支えなければ、使えそうな専用エディタを教えて頂けないでしょうか?

ファイルのパースさえ出来れば楽勝だろうとおっしゃるのは素晴らしいです。
ちなみに楽勝というのはperl で、ですか? 
機械で読むというのがよく分からないのですが(すみません)、多分txt形式で
50MBくらいのファイルになりそうで、そこまでは出来ます。

591:588=589
07/02/08 20:19:08
ちなみに環境は WindowsXP sp2 上で、ActivePerl Build 819 使用しています。

592:デフォルトの名無しさん
07/02/09 02:39:44
なんとなくWebProgからきました。取り留めもない質問なんですがお願いします。

WEBの掲示板などでよく、特定のタグだけ書き込み許可してますよね。それを実現するのに
下記のようなコードを書きました。最近、WEBに限らず、テキスト系の処理は何するにも
こんな感じでsplitして再帰する書き方に固執してしまってます。
字ヅラ的には短くて気に入ってるんですが、処理的には効率悪い気がしてならないのです。
もっとうまい方法があるでしょうか。

sub escape_limited {

my %args = (str => '', @_);

$exception = q!</?(?:a|img|blockquote|pre|code|span)(?:\s[^>]*)?>!;

my @scraps = split(/($exception)/im, $args{'str'}, 2);

if ((scalar @scraps) == 3) {

return &escape(%args, str => $scraps[0]). $scraps[1]. &escape_limited(%args, str => $scraps[2]);
}

else {

return &escape($args{'str'});
}
}

593:デフォルトの名無しさん
07/02/09 04:00:04
sub escape_limited {
  my %args = (
    str     => '',
    allowed => qr{a|img|blockquote|pre|code|span},
    @_
  );
  my $text = $args{str};
  $text =~ s{( < (?! /? (?:$args{allowed}) \b ) [^>]* > )}{ escape($1) }iegx;
  return $text;
}

とかでどう?

594:デフォルトの名無しさん
07/02/09 09:53:04

$LT = quotemeta escape("<");
$GT = quotemeta escape(">");

($str = escape($str)) =~s/$LT\/?(a|img|b|blockquote|pre|code|span)\b.*?$GT//ig;

とかねー。多分軽いよ。

タグ内に'<' '>' が無いことを前提にしてるみたいだけど、大丈夫?
属性も調べないと、スタイルシートとかスクリプトとか埋め込まれる可能性もあるし。

595:デフォルトの名無しさん
07/02/09 10:35:31
うおっ、間違えた。正規表現のリテラルのトコ…。
s/$LT(\/?(?:a|img|b|blockquote|pre|code|span))\b(.*?)$GT/<$1$2>/ig

だわな。スマソ

596:デフォルトの名無しさん
07/02/09 13:59:17
試しました。
592(私):スプリット型
593:一発置換型
594:例外事後処理型

マッチングがひとつもない場合
592:速い
593:圧倒的に遅い
594:速い

マッチングがある場合
592:圧倒的に遅い(しかも多重再帰の警告でまくり)
593:少し速い
594:速い

一旦、なりふり構わず置換してから例外を元に戻すってのは、
分かりやすいだけで処理的に気持ち悪いと思ってましたが、
意外と効率いいんですね。


597:デフォルトの名無しさん
07/02/09 14:07:03
お礼を忘れました。みなさんありがとうございます。
ひとつ、事後処理型の場合、対象文字列に最初からエスケープ文字が
含まれてるケースを考慮する必要がありますね。これが一番やっかいかなあ。


598:デフォルトの名無しさん
07/02/09 14:10:29
いや、一旦、二重エスケープになって元に戻るからいいのか。
混乱してきたので仕事に戻ります。


599:デフォルトの名無しさん
07/02/09 15:02:53
>>590
テキスト読み込んで処理はPerlの得意とする分野なので楽勝

タグは<midasi></midasi>だけなのか?その他のタグがあったとして処理する必要はないのか?
複数の同じ見出しに対し残す本文はどれでもいいのか?
本文中にタグや特殊文字があったりした場合は?一意に判別できるエスケープの仕様はある?

あたりの仕様さえ確定できればファイル読み込みのやりかた、正規表現、ハッシュあたり覚えればできるっしょ
ちゃんとしたXML形式になってるなら専用のパーサ使えば楽が出来るが、正規表現でも十分なように思える

600:デフォルトの名無しさん
07/02/09 23:36:51
ちゃんとしたXMLになってなくても、XML::Liberal使えばわりといける。

601:デフォルトの名無しさん
07/02/10 03:35:34
wxperlを使ってGUIのメモ帳を作っています。ファイルを新規に保存するとき
ファイルと同名のフォルダをつくりたいのですがなぜかうまくいきません。
my $filename = $saveasdialog->GetPath;  
$this->{text_ctrl_1}->SaveFile($filename);
mkdir($filename);

このスクリプトで、一行目でwxperl filedialogオブジェクトにより
ファイル名が取得され$filenameに入ります。2行目でsavefileメソッドで
テキストが$filenameの通りに名前がつけられ保存されます。これは正常にいきます。
しかし、3行目のコードではフォルダが作成されません。

wxperl固有というよりもperlのコードの書き方に問題があるような気がするのですが、
アドバイスがあったらお願いします。

602:デフォルトの名無しさん
07/02/10 03:46:04
> ファイルを新規に保存するときファイルと同名のフォルダをつくりたい

なんじゃそりゃ??

603:デフォルトの名無しさん
07/02/10 03:54:30
どの OS でテストしてるんだか知らないけど、ファイルシステム側の問題だろう。
例えば Windows では同名のファイルとフォルダは作れない。

604:601
07/02/10 04:31:21
>>603
すみませんでした。windows xp, active perl環境です。
>例えば Windows では同名のファイルとフォルダは作れない。
これは知りませんでした。というか大昔に聞いたことがあるような気がしますが
盲点でした。
mkdir($filename."Folder");
のようにしたら("作成したファイル名"Folder)という名前でフォルダが出来ました。
自分の考えている機能としてはこれで十分先に進めそうです。
ありがとうございました。


605:デフォルトの名無しさん
07/02/10 13:39:41
て言うか、同名のファイルとフォルダを作れるファイルシステムってあったっけ?

606:デフォルトの名無しさん
07/02/10 13:43:46
同名のファイルとフォルダがあるとApacheがまいっちんぐしちゃうよ

607:デフォルトの名無しさん
07/02/10 15:15:31
>>605
むかし、「同名のファイルとディレクトリ作れるんじゃねえ!!」と怒った記憶がある。


608:デフォルトの名無しさん
07/02/10 17:42:01
これも拡張子を非表示にするゆとり教育の弊害か…

609:デフォルトの名無しさん
07/02/10 18:27:55
これもファイル名とディレクトリ名を同じ名前空間に置くという異常なことを
やったUNIXの弊害か……

610:デフォルトの名無しさん
07/02/10 18:44:58
初学ながらリファ本片手にCGIスクリプトを書いています。
下記のような問題にぶつかるもどうにも解決方法がわかりません。
どうすればよいか教えてください。よろしくお願いします。

【やりたいこと】
 投票CGIの改造で、イエスノーの2択の選択肢の投票に応じて、表示されて
いる数字も増減されるようにしたい。 数字の増減はカウンタスクリプトを流用し
ています。

【現在書いているスクリプト(抜粋)】
open(FILE, "+<./count.dat") or die("エラー:カウントファイルが開けません");
eval { flock(FILE, 2); };
$counta = <FILE>;
seek(FILE, 0, 0);
if($item == 1 ){ print FILE $counta+1 } else { print FILE $counta-1 }
close(FILE);

【問題点】
 例えば現在の$countaの値が100で、値が-1される場合、結果は99となって欲しいのに、990と
なって返ってきます。1000から999の場合なども同じです(どうも桁数が減る場合にうまく動作し
てくれない模様)。

【解決したいこと】
 100が99になって欲しい場合、その動作が990とならず希望どおり表示されるようにしたいです。

【その他】
 同じ桁数が変わる場合でも、99→100など、桁数が増える場合は問題が発生しないです。

611:デフォルトの名無しさん
07/02/10 18:45:26
ファイル名とディレクトリ名の名前空間が異なるなんて想像したら
そちらの方が異常だと思うが。

そもそもそいった実装のOSはあるんかえ?

612:デフォルトの名無しさん
07/02/10 18:58:46
>>609
最近それで頭に来てる。百万個を越えるファイルを持つ非常に巨大なファイルツリーを
トラバースするのにリソース食いまくり。
やっぱり分けてあるシステムってあるんだ。


613:デフォルトの名無しさん
07/02/10 19:19:45
>610

use Fcntl qw/:flock/;

open my $fh, '+<', './count.dat' or die $!;
eval { flock $fh, LOCK_EX };
$count = <$fh>;
seek $fh, 0, 0;
print $fh $item == 1 ? $count + 1 : $count -1;
truncate $fh or die $!;
close $fh;

614:610
07/02/10 19:27:24
>>613
正直、書かれている内容がさっぱり分からないので、リファ本で読み進めながら
テストしたいと思います。ありがとうございます。

615:610
07/02/10 21:14:23
>>613
早速アドバイスを実装したところ、思った通りに動いてくれました。
どうもtruncateがポイントだったようですね。ありがとうございました。

616:デフォルトの名無しさん
07/02/11 04:18:34
正規表現でマッチしたものを任意の変数に入れて(もしくは任意のエイリアスに結びつけて)、
後で取り出すことって出来るのでしょうか?
マッチした順に$1や$2ではなく、(.*?>$name)とかした時、
(.*?)のマッチを$nameで受け取れると非常に嬉しいのですが。。
どなたかアドバイスいただけると嬉しいです。。

617:デフォルトの名無しさん
07/02/11 05:58:10
>>616
マッチした後に代入しておくんじゃなんで駄目なんだ?
if (/(.*?)/) {
$name = $1;
}


618:デフォルトの名無しさん
07/02/11 06:01:14
>>616
マッチしたもののリストが返ってくるのでそれを受け取る
($a, $b) = /^(.)(.)/;


619:616
07/02/11 09:49:39
>>617-618
返信ありがとうございます _ _
なぜエイアリアスに結びつけたいかというと
βのウェブサービスのラッパーを作っていて、
正規表現がころころ変わる可能性がある(欲しい文字列が前後する可能性がある)からです。
欲しい文字列が前後してしまうと正規表現だけでなく、
その後の正規表現を受け取るコードも変更しなければならなくなってしまうので。。
# 正規表現を正規表現で自動生成するスクリプトを作っていたら、
# 文字列が前後した場合その部分は自動化できなくなってしまうことに気づき、
# 質問させて頂きました。

620:デフォルトの名無しさん
07/02/11 11:04:20
>>588,599
それは文字化けでなく、エスケープされてるだけ。
Data::Dumper の仕様

621:デフォルトの名無しさん
07/02/11 11:30:06
詳説正規表現第2版 7.8.8 名前つきキャプチャを模倣する
(.*?)(?{ $name = $^N })

622:592
07/02/11 15:22:43
タグそのものだけでなく、例えば<pre>の内側はエスケープしない、など、
ちょっと込み入っている場合、例外事後処理だと信じられないほど遅くなりました。
コーディングに問題があったかも知れませんが。
という訳でスプリット型に戻しました・・。もっとうまい方法があるでしょうか。

sub escape_limited {
 
 my %args = (str => '', exception => [], exception_block => [], @_);
 
 my @regexp_array;
 
 (scalar @{$args{'exception_block'}}) and push(@regexp_array, sprintf(q!<(%s)\b.*?>.+?</\2>!, join('|', @{$args{'exception_block'}})));
 (scalar @{$args{'exception'}}) and push(@regexp_array, sprintf(q!</?(?:%s)\b.*?>!, join('|', @{$args{'exception'}})));
 
 return &loop($args{'str'}, join('|', @regexp_array));
 
 sub loop {
  
  if ($_[1]) {
   my @scraps = split(/($_[1])/is, $_[0], 2) ;
   return &escape($scraps[0]). $scraps[1]. &loop(pop(@scraps), $_[1]) if ((scalar @scraps) >= 3);
  }
  
  return &escape($_[0]);
 }
}


623:デフォルトの名無しさん
07/02/11 18:28:22
>>619
たぶんアプローチが根本的に間違ってる。

624:616
07/02/11 19:05:54
>>621
ありがとうございます!知らなかったです使わせて頂きます。
URLリンク(search.cpan.org)
>>623
良くあるので、今回もそうかもしれないのですが;
URLリンク(www.nicovideo.jp)の検索のラッパーとして、
URLリンク(www.kiseki.info)を作りました。
そして、上記ラッパーの正規表現生成に、
URLリンク(www.kiseki.info)
というコードを使っていました。(>>621さんのアドバイス未導入コード)
お暇があればアドバイスいただけると幸いです。

625:デフォルトの名無しさん
07/02/11 22:38:26
前から疑問に思ってたんですが、
$input = 'hoge';
$output = $input;
$output =~ s/ho/ha/g;
return $output;
これを$outputを使わずにreturn &func($input, /ho/, 'ha');
みたいに表現することはできないんでしょうか。

626:デフォルトの名無しさん
07/02/11 22:54:33
こんなん?
join('ha', split(/ho/, $input))

627:デフォルトの名無しさん
07/02/11 23:09:34
return str_replace('ho', 'ha', $input);

628:デフォルトの名無しさん
07/02/11 23:11:41
>>627
どこの国のPHPだよ

629:デフォルトの名無しさん
07/02/12 00:06:59
関数的な操作が充実してる割に標準でついてる関数がほとんど破壊的なんだよな

630:592
07/02/12 00:10:16
すみません、うそを言いました。594さんのがやっぱり一番速いです。
遅くなったのはバグでした。スレ汚しすみません。

631:デフォルトの名無しさん
07/02/12 02:58:08
パッケージが提供してる関数の一覧って簡単に取得できますか?

632:631
07/02/12 03:15:00
ちょっとぐぐったら見つかりました。すみません。
URLリンク(search.cpan.org)
サブクラスなどにもぐっていく処理もありますが、どうもこの行がミソのようでした。
keys %{ "$module::" }

633:デフォルトの名無しさん
07/02/12 07:44:44
動的に生成された複数のPNG画像データをzip圧縮したいと考えています。

GDモジュールとArchive::Zipモジュールが活用できそう、
と調べたのですが不明点があります。

Archive::ZipモジュールのaddFileメソッドは引数としてファイル名が必要ですが、
GDモジュールのpngメソッドで動的に生成されたPNG画像データをzip圧縮するにはどうしたら良いでしょうか。
生成されたPNGデータをbinmodeを使用して画面表示するサンプルは見かけたのですが・・・

Perlを勉強し始めたばかりで基本事項も良く分からず五里霧中です。
アドバイスのほど、よろしくお願いいたします。

634:デフォルトの名無しさん
07/02/12 09:40:25
addString

635:デフォルトの名無しさん
07/02/12 13:43:39
system() で所定の場所からwgetでファイルを持ってくる処理を作っています。
必ずしもその場所にファイルがあるとは限らないので、ファイルが無かった時と
接続出来ないなどで取ってこれなかった時を判定したいのですが、どうすれば
よいのでしょうか?


636:デフォルトの名無しさん
07/02/12 13:47:37
system関数の戻り値でチェックできないの?

637:デフォルトの名無しさん
07/02/12 14:20:49
>>636
ありがとうございます。
やってみましたが、ファイルが無かった時も接続できなかった時も、戻り値は
256となるので区別がつかないです・・。

638:デフォルトの名無しさん
07/02/12 14:21:07
wgetの複雑な機能をバリバリ使ってるなら別だが、ただファイルとってくる
だけならLWP使う方がその辺のエラー処理は書きやすいと思うけどな。


639:デフォルトの名無しさん
07/02/12 14:39:33
>>638
すみません、wgetを使わないといけないので別の方法で取ってくるというのは
出来ないのです。

640:デフォルトの名無しさん
07/02/12 15:06:35
美しくないがstderr読むしかないだろう

641:デフォルトの名無しさん
07/02/12 15:11:25
接続とファイル存在チェックだけ別ルーチンで作っといて、
それがOKならwgetで取ってくるってのはどうだ?

642:デフォルトの名無しさん
07/02/12 15:59:14
>>640,641
ありがとうございます。>>640さんの方法の方が簡単そうなのでこちらで
いこうと思うのですが、

open(STDERR, ">> errmsg.txt");
$ret = system("wget 〜");
close(STDERR);

とやって、$ret が256 だったらerrmsg.txtを1行づつ読み込んで
[ 404 Notfound ]という文字列が見つかったらファイルなし、無い
ならその他のエラー、という感じでいいのでしょうか?


643:デフォルトの名無しさん
07/02/12 16:27:24
というかwgetはちゃんと終了コード返すけど?

# wget -q URLリンク(www.google.com) && echo ok
ok
# wget -q URLリンク(www.google.com) || echo ng
ng
#

644:デフォルトの名無しさん
07/02/12 16:28:39
あーごめん、404と接続できなかった時とを区別したいのか。早とちりスマソ。

645:デフォルトの名無しさん
07/02/12 20:57:32
気にしてへんからええよ。
書いてくれてありがとな。

646:デフォルトの名無しさん
07/02/13 00:23:46
>>642
perldoc IPC::Open3

647:デフォルトの名無しさん
07/02/14 00:10:02
数字と文字が混在した要素からなる配列があるんですけど、これをsortすると
1〜〜,11〜〜,2〜〜,23〜〜・・・
という風になってしまいます。
これを数字順
1〜〜,2〜〜,11〜〜,23〜〜・・・
にするにはどうすればいいのでしょうか??

648:デフォルトの名無しさん
07/02/14 00:17:12
>>647
@dst = sort { $a <=> $b } @src; # 数値ソート
@dst = sort { $a cmp $b } @src; # 文字列ソート(こっちは略せる)

649:デフォルトの名無しさん
07/02/14 00:39:50
>>648
それ試したんですけど、数字順にならないんです・・orz

650: ◆TWARamEjuA
07/02/14 00:49:01 BE:3049474-2BP(6811)
@dst = sort { sprintf qq|%02d|,$a cmp sprintf qq|%02d|,$b } @src;
とかとか♪

651:デフォルトの名無しさん
07/02/14 00:53:47
>>650
Sort subroutine didn't return a numeric value
ってエラーがががorz

652:脱帽
07/02/14 00:59:09
ちょうてけとう

@dst = sort { ($a =~ /(\d+)/)[0] <=> ($b =~ /(\d+)/)[0] } @src;

653:デフォルトの名無しさん
07/02/14 00:59:59
print join qq/, /, sort { $a <=> $b } qw/21d 1aa 11b 2cc 13e 5b/;
1aa, 2cc, 5b, 11b, 13e, 21d

ちゃんとなってるけどなあ

654:デフォルトの名無しさん
07/02/14 01:08:03
>>653
いろいろ試したらできました。
splitを何回か使って要素の中の数列にまで要素を分割して比較したらうまくいきました。
俺なんかに付き合ってくれてありがとうございましたm(_ _m)

655:デフォルトの名無しさん
07/02/14 05:36:07
ひ〜(悲鳴)

656:デフォルトの名無しさん
07/02/14 06:05:37
(悲鳴)

657:デフォルトの名無しさん
07/02/14 06:25:24
 シュー 三(悲鳴)

658:デフォルトの名無しさん
07/02/14 06:31:03
質問〜perlから直接web上のファイルを開く事はできますか?
ソースをテキストで保存したくて

open(IN,"URLリンク(****)・・・") or die "無理";

ってやってみたら無理でした。

659:デフォルトの名無しさん
07/02/14 06:56:37
startup.plに
print int rand 10;
のようなコードを入れたtest.plをrequireして実行すると
↓↓httpdプロセス番号(実行結果)↓↓
1(3), 2(3), 3(3), 1(5), 2(5), 3,(5), 1(2), 2(2), 3(2)
のように完全でない乱数がある規則で発生してしまいます。
srandを加える、もしくはtest.plを意図的に更新し共有メモリから外すと期待通り全て違う表示がされます。
なぜこのような動作になるのか教えていただけませんでしょうか。
環境はFedora core5、Perl v5.8.8、mod_perl-2.0.2-5.1、httpd-2.2.2-1.2(prefork)です。

660:デフォルトの名無しさん
07/02/14 07:17:33
>>658
URLリンク(www.kt.rim.or.jp)

>>659
【激速】mod_perl SpeedyCGI FastCGI【激速】
スレリンク(php板)

661:デフォルトの名無しさん
07/02/14 07:32:33
あ、ありがとうございます!
お陰で心置きなく寝れます。いや、仕事でした。いってきます;;

662:デフォルトの名無しさん
07/02/14 11:51:52
% cat > test.pl
#!/usr/bin/perl
$ID = "id";
$PASS = "pass";
__END__

perlと余り関係ない質問かもしれませんが..
上の様なスクリプトを作った場合ファイルを開くと$PASSの「pass」が丸見えに
なるのですがこの部分を暗号化してわからないようにしてスクリプト実行時に
何らかの処理をして$PASSをpassに戻すような事は可能でしょうか?



663:デフォルトの名無しさん
07/02/14 12:01:30
なんらかの処理をしてpassに戻ったら意味がないだろうが
SHA-1とかでハッシュにしてそれを持ってるとよろし

664:デフォルトの名無しさん
07/02/14 12:05:42
>>663
ありがとうございます
ぐぐってきます..(´・ω・)

665:デフォルトの名無しさん
07/02/14 13:30:21
音声入力でPerlスクリプトを書ける時代はいつになったら来るのかね
URLリンク(www.youtube.com)

666:デフォルトの名無しさん
07/02/14 14:08:49
>>665
なんか失敗ばっかりしているように見えるね。

667:デフォルトの名無しさん
07/02/14 14:35:28
>>665
warata

668:デフォルトの名無しさん
07/02/14 14:45:30
>>665
やべえ面白すぎるwww

669:デフォルトの名無しさん
07/02/14 15:29:03
SMTPを使わず/usr/lib/sendmail等から送る場合sendmailをパイプでopenする
手法がよく使われていますがこれらを実現出来るCPANに登録されているスタンダードな
モジュール名を教えていただけませんでしょうか。

670:デフォルトの名無しさん
07/02/14 15:39:30
途中で手入力してるしw
開発部署のあちこちのデスクから、こんなん聞こえてきたらコエー。

671:デフォルトの名無しさん
07/02/14 15:56:45
>>669
search.cpan.orgでsendmailをキーワードに検索すればいくつか出てくるので
適当に好きなのを使えばいいんじゃないか。


672:デフォルトの名無しさん
07/02/14 20:43:09
>>665
この後に、オフィスPCに切れて投げ壊してる外人おっさんの動画を

673:デフォルトの名無しさん
07/02/14 21:31:26
>>665
That was eazy.txt
ワロス

674:デフォルトの名無しさん
07/02/14 21:57:07
Thank you って言ったらそれまで入ってもうて、必死で消してるw

675:デフォルトの名無しさん
07/02/14 22:00:56
Undoできないのかな

676:デフォルトの名無しさん
07/02/14 22:03:04
5分もかかってまだ open ( INFO しか入力できてねぇしw

677:デフォルトの名無しさん
07/02/14 22:12:07
いや、INFO は結局入力できず手で入れてたし。

678:デフォルトの名無しさん
07/02/14 22:39:15
検索結果を表示させるだけのものなんですが、大文字小文字の区別がつきません
297 if ( $line =~ /\Q$in{$form1}\E/ ) {
を   if ( $line =~ i/\Q$in{$form1}\E/ ) {  にするとエラーが出てしまいます

syntax error at test.cgi line 297, near "$in{"
syntax error at test.cgi line 297, near "/ )"
syntax error at test.cgi line 300, near "}"
Execution of test.cgi aborted due to compilation errors.

292 sub umu1 {
293 open(IN,"$file"); #csv読み込み
294 while(1) {
294 $line = <IN>; #csvの行を&lineに代入
295 @data = split( /,/ ,$line ); #@data[0~]にcsv行を個別に代入
296 if ( $line eq "" ) { last; } #無限ループ終了条件
297 if ( $line =~ /\Q$in{$form1}\E/ ) {
298 print "$data[0]$data[1]"."<br>"."\n";
299 }
300 }
301 close(IN);
302 }

679:678
07/02/14 23:04:54
自己解決しました。なんともお粗末なミスで・・・

680:デフォルトの名無しさん
07/02/15 00:37:59
WWW::Mechanizeを使用しているのですが、RecIE(URLリンク(www.h7.dion.ne.jp))
のように、IEにhtmlの内容を表示させながらhtml解析する方法ってないでしょうか?
今はcontentで一旦ファイルに保存して、systemでIEを起動させ表示させています。


681:デフォルトの名無しさん
07/02/15 10:04:00
sub foo {
処理
return(@A,@B,@C)
}

としている関数で、
(@A,@B,@C) = &foo()
↑のような感じで返り値を配列個別に受け取りたいんですが、
Perlでは可能なんでしょうか?


682:デフォルトの名無しさん
07/02/15 10:16:08
sub foo {
hoge;
return \(@A, @B, @C);
}

($refA, $refB, $refC) = foo;

こういう感じにリファレンス渡しにしないといけない。

683:デフォルトの名無しさん
07/02/15 11:20:31
>>680
Win32OLE
JavaScriptみたいなタグの分解も一緒にやってくれる

684:デフォルトの名無しさん
07/02/16 04:43:05
Win32::GUIのListviewで行ごとに色を変えるにはどうしたらよいでしょうか?


685:デフォルトの名無しさん
07/02/16 14:44:56
>>684
カスタムドローかオーナードロー
ってかWinAPI使うならCとかC++のが断然楽だぞ?

686:デフォルトの名無しさん
07/02/16 17:14:27
>>685
カスタムロードがいいみたいですね。
Perlのサンプルコードはぜんぜんないようで。。。
困った


次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5370日前に更新/220 KB
担当:undef