2009年3月25日星期三

Re: 寻 WWW::Baidu 的维护者 (Was Re: [PerlChina] Re: 网页不能抓取)

貌似他博客有相关介绍,长篇大论的 :)

2009/3/26 azure wang <azure1st@gmail.com>
agentzh 能够介绍一下 X Hunter 抽取器和 Firefox/Webkit 集群。

以前都是普通的分析文本  抓取链接,对于解析js获取连接很感兴趣啊。尤其是抓取页面通过ajax获取的链接。

2009/3/25 Question <wanliyou@gmail.com>



呵呵,我们现在的 X Hunter 抽取器都是 100% 纯 Perl(从前是 100% 纯 JavaScript,哈哈) :)
等后面量更大了,再换 ANSI C++ ;)

原来的JS开上JIT和Perl有对跑过么? 
--
>: ~

--
Azure.Wang
--
anny raul <annyraul@gmail.com>
http://annyraul.blogspot.com

--~--~---------~--~----~------------~-------~--~----~
您收到此信息是由于您订阅了 Google 论坛"PerlChina Mongers 讨论组"论坛。
 要在此论坛发帖,请发电子邮件到 perlchina@googlegroups.com
 要退订此论坛,请发邮件至 perlchina+unsubscribe@googlegroups.com
 更多选项,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛

-~----------~----~----~----~------~----~------~--~---

没有评论: