2009年3月28日星期六

[PerlChina] Re: Firefox JS 版 X Hunter 抽取器与 Perl VDOM.pm 抽取器的性能对比 (Was Re: 寻 WWW::Baidu 的维护者)

2009/3/29 agentzh <agentzh@gmail.com>
浏览器核心是生产者,将其内部的 DOM 树“串行化”为 VDOM 格式的 dump 文件;

呃。。。serialize 这个词在中文中似乎译作“序列化”更好一些。。。呵呵。。。


然后,在 Perl 脚本中可以直接加载这个 VDOM 文件然后享受 JavaScript 的那些 DOM 特权:

use VDOM;

my $infile = "test.vdom";
open my $in, $infile or
    die "Can't open $infile for reading: $!\n";
my $win = VDOM::Window->new->parse_file($in);

对于 sina 首页,生成的 test.vdom 文件的大小为 275 KB,而 sina 首页自身的 HTML 大小为 380 KB (是的,还不包括其包含的那些外部 CSS 代码)。VDOM.pm 加载这个 test.vdom 在我机器上的用时为 450 ms(呵呵,是的,sina 首页有点儿大了 :P)


在 Firefox 3.1b3pre 中用 JS 遍历 sina 首页的 DOM 生成 VDOM 串,在我的 Pentinum 4 的台机上需要 2.3 sec,

s/Pentinum/Pentium/ :P
 
Thanks!
-agentzh

--~--~---------~--~----~------------~-------~--~----~
您收到此信息是由于您订阅了 Google 论坛"PerlChina Mongers 讨论组"论坛。
 要在此论坛发帖,请发电子邮件到 perlchina@googlegroups.com
 要退订此论坛,请发邮件至 perlchina+unsubscribe@googlegroups.com
 更多选项,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛

-~----------~----~----~----~------~----~------~--~---

没有评论: