共 36 页, « 第一页 ... « 3 4 5 [6] 7 8 9 » ... 最后一页 »
相信很多人都写过下面这种函数,把参数当作hash引用来赋值:
sub foo {
my $hash = shift;
$hash->{foo} = 'bar';
}
然后这样调用:
foo($a);
调用之后,$a就变成了一个hash引用,里面包含了 foo => 'bar' 这一对值。 当然你可能会说,干嘛要在foo里面修改参数,直接return $hash不行吗。 当然可以,而且我也推荐使用return的方式, 不过有时候foo函数可能会很复杂,或者由于其他的原因而不得不使用修改参数的方式。
且慢!这种用法有时候会会失败。看下面的例子:
#!/usr/bin/perl
use Data::Dumper;
sub foo {
my $h = shift;
$h->{hello} = 'World!';
}
my $a;
my $b = {};
foo($a); print Dumper($a);
foo($b); print Dumper($b);
运行结果:
$VAR1 = undef;
$VAR1 = {
'hello' => 'World!'
};
为什么$a执行foo后仍然为undef,而$b就有值?
这是因为,my $a; 没有对$a初始化,此时$a的值为undef。 而调用foo时,参数实际上是传值调用,$a的undef值被赋给了$h变量, 此时$h = undef。而下一行将$h作为hash引用赋值时,系统会自动为$h赋一个空引用作为初始值。 ——但是,这个空引用以及接下来赋给的 hello => 'World!' 的值不会传回给外面的 $a,因为是值传递!
而$b则不同,初始化成一个空hash引用,这样传递给foo的就是个真正的引用值, 这样 hello => 'World!'的赋值可以赋给该引用。
所以,在使用hash引用时,初始化是非常必要的。
Firefox的工具菜单中有个非常有用的功能:清除隐私数据,快捷键是Ctrl-Shift-Del。 经常做Web开发的人对这个功能一定非常熟悉,修改完一点代码看看效果时,都需要 Ctrl-Shift-Del然后按回车。
不过这个功能有个很郁闷的地方。Firefox 2中,默认是不清除网站登录信息的, 比如你登录了Gmail并选择下次无需输入密码,在Firefox 2中直接按Ctrl-Shift-Del再回车, 是不会清除Gmail上记忆的密码的。但是在Firefox 3中添加了一个很讨厌的选项, 清除“已通过验证的会话”,而且是默认选中的,这样直接Ctrl-Shift-Del再回车, Gmail上记住的密码也就没有了,下次进入Gmail还得再点一次登录。
幸好,通过about:config可以修改清除隐私数据对话框的默认值。 在地址栏中输入about:config,然后查找 privacy.item, 把 privacy.item.sessions 改为false就可以了。 这样再按 Ctrl-Shift-Del,“已通过验证的会话”选项就是默认不选中了。
今天讨论一下m//g一个的小问题。m//g表示在字符串中查找所有可能出现的模式匹配。 在标量环境下,m//g会依次查找每个出现的匹配。通常的用法是这样的:
while (/(pattern)/g) {
print $1; # 做些操作
}
在内部,m//g会保存一个“匹配位置”的变量,表示这次的m//g匹配到了什么位置,以便下次运行时从该处继续开始。 (这个位置可以通过pos函数获得,这里就不多说了。)通常,用在while循环里是没有任何问题的,但如果换成if会怎样?
$_ = "abc"; print "a" if /a/g; print "b" if /b/g; # 输出结果:ab
结果是正确的。如果将语句换个位置呢?
$_ = "abc"; print "b" if /b/g; print "a" if /a/g; # 输出结果:b
可见,第二次的模式 a 没有匹配。其实可以想到,第一次的m/b/g匹配后,匹配位置已经指向了字符串中的下一个位置c, 第二行的m/a/g继续从c开始匹配,当然不会匹配到任何东西。
借用一下《精通正则表达式》第7章对于Match运算符的说明:
| 匹配类型 | 尝试开始位置 | 匹配成功时的pos值 | 匹配失败时的pos值 |
| m/.../ | 字符串起始位置(忽略pos) | 重置为undef | 重置为undef |
| m/.../g | 字符串的pos位置 | 匹配结束位置的偏移值 | 重置为undef |
| m/.../gc | 字符串的pos位置 | 匹配结束位置的偏移值 | 不变 |
话说回来,在if中使用/g选项是毫无意义的。这里只是提个醒,当你遇到诡异的无法匹配的问题时,别忘了是不是在if中使用了m//g。
昨天一个同事问我关于Perl中的 -| 描述符的问题。 他的程序大概是这样的:
unless (open FH, "-|") {
exec "foo bar"; # 用exec执行另一个程序
exit;
}
while (<fh>) {
...
}
close FH;
$ret = $? >> 8;
if ($ret == 1) {
...
}
那么这里的 open FH, "-|" 是什么意思?$? >> 8 又是什么意思?
阅读全文 »/fh
在Perl中解析XML的方法最常见的就是使用 XML::DOM 和 XML::Simple了。 XML::DOM过于庞大,而且解析结果是一个DOM树,操作也不方便。 对于小型且不复杂的XML文件,XML::DOM真是杀鸡用牛刀。 这时就轮到轻便的XML::Simple上场了。
XML::Simple如其名,真的很简单。假设XML内容如下:
<opt>
<user login="grep" fullname="Gary R Epstein" />
<user login="stty" fullname="Simon T Tyson" >
<session pid="12345"/>
</user>
<text>This is a test.</text>
</opt>
那么只需这样写:
use XML::Simple;
use Data::Dumper;
$xml = XMLin('sample.xml');
print Dumper($xml);
就可以轻而易举地将XML解析成一个hash,然后用foreach依次处理即可。
阅读全文 »开发中遇到的几点问题:
1. split的分隔符不能使用字符串,只能使用正则表达式。
用perl -de 1; 启动后做实验:
DB<1> x split '\\', 'a\\b\\c' Trailing \ in regex m/\/ at (eval 13)[/usr/lib/perl5/5.8/perl5db.pl:628] line 2. DB<2> x split '\\\\', 'a\\b\\c' 0 'a' 1 'b' 2 'c' DB<3> x split /\\/, 'a\\b\\c' 0 'a' 1 'b' 2 'c'
试图指定分隔符为反斜杠,但 '\\' 出错,原因是perl会将第一个参数(字符串)的值作为正则表达式来解释, 结果 '\\' 就变成了 /\/ ,显然这是错误的正则表达式。 正确的写法是 '\\\\' 被解释成 /\\/,或者直接写 /\\/。
读了bkブログ的文章后发现, perl的split函数是忽略末尾的空元素的,想让它不忽略,必须加个参数-1:
DB<38> x split /,/, 'a,b,,c,,' 0 'a' 1 'b' 2 '' 3 'c' DB<39> x split /,/, 'a,b,,c,,',-1 0 'a' 1 'b' 2 '' 3 'c' 4 '' 5 ''
更多内容请点开看。
阅读全文 »应该很多人都在为mod_perl的调试方法发愁吧。通常只能使用print,或者输出到syslog中, 但都需要猜测错误位置并添加相应的日志输出,然后重启服务器,刷新,看结果…… 虽然使用Apache::Reload能减少重启服务器的麻烦,但Apache::Reload用多了就会出错,而必须重启, 何况打日志总不像交互式调试器方便。
mod_perl的官方文档中写明了如何使用调试器来调试, 不过这个方法在RHEL4下似乎不太好用(自己编译mod_perl的同学就应该没这个问题)。 查看了一下,原来RHEL4自带的mod_perl是 mod_perl-1.99_16-4, 而在官方的mod_perl的下载页面上最高版本只有 1 系的 1.30 和2系的2.0.4,并没有所谓的1.99版。 看这个mod_perl-1.99的内容,应该是1系和2系的混合体吧。 Apache::DB这个包与mod_perl-1.99不兼容,于是就无法正常调试了。
阅读全文 »这篇文章,对于能看懂的同学是非常非常重要的资料,对于看不懂的同学就一点用处都没有啦。
调查一下mod_perl下BEGIN/INIT/CHECK/END等块的行为如何?
测试程序,保存为life.cgi:
#!/usr/bin/perl
print "pid = $$\n";
print "Start main running here\n";
BEGIN { print "BEGIN\n"; }
INIT { print "INIT\n"; }
CHECK { print "CHECK\n"; }
END { print "END\n"; }
如果直接执行就是这样的:
$ ./life.cgi BEGIN CHECK INIT pid = 4610 Start main running here END
不论执行多少次,结果都相同(除了每次的pid不同之外)。但如果放到mod_perl下,结果就完全不一样了。 先单进程启动(httpd -X),再从浏览器中访问,结果如下:
BEGIN pid = 4557 Start main running here END
刷新一次,结果是:
pid = 4557 Start main running here END
可见,mod_perl下没有INIT和CHECK过程,只有BEGIN和END。其中END在每次请求时必然执行, 但BEGIN只有在进程刚创建后的第一次请求时才执行,以后的请求就不执行了。
如果你用了 Apache::Reload,那么可以修改一下life.cgi试试看,哪怕是一点小小的改动也行。 修改之后刷新,可以看到BEGIN又回来了,不过再刷一次就没有了。 所以Apache::Reload会在重新加载程序后再执行一遍BEGIN。
根据上述结论再引申一下,use = BEGIN { requre + import }, 可以推断,在同一进程下两次加载执行了use的页面,那么第二次的use是不起作用的。
Perl对YAML的支持很好,著名的Plagger就是用YAML作为配置文件的。
在Perl中读取YAML文件也很简单。常用的模块就是YAML,这是个纯Perl的实现,速度慢,但可以跨平台运行。 如果追求运行速度而不在乎平台问题,可以使用YAML::Syck和YAML::XS,两者都是C语言的实现。 YAML::Syck的C语言部分基于libsyck,而YAML::XS的C语言部分基于libyaml。 两者相比,YAML::XS稍稍快一点,而且它精确地实现了YAML标准1.1版的内容。
阅读全文 »memcached全面剖析的连载已经结束,翻译工作也已经全部完成了。 为了方便阅读,现将原来的翻译结果打包成PDF文档。可在本文末尾处下载。
原来的各篇翻译的地址如下:
- 第1章:http://tech.idv2.com/2008/07/10/memcached-001/
- 第2章:http://tech.idv2.com/2008/07/11/memcached-002/
- 第3章:http://tech.idv2.com/2008/07/16/memcached-003/
- 第4章:http://tech.idv2.com/2008/07/24/memcached-004/
- 第5章:http://tech.idv2.com/2008/07/31/memcached-005/
