2009年3月25日星期三

Re: 寻 WWW::Baidu 的维护者 (Was Re: [PerlChina] Re: 网页不能抓取)

下一代Leopard, Snow Leopard..., just kidding ;-)

2009/3/26 Michael Zeng <galaxy2004@gmail.com>:
> 什么猫啊,鼠的
>
>
> On 3/26/09, agentzh <agentzh@gmail.com> wrote:
>>
>> 2009/3/26 anny raul <annyraul@gmail.com>:
>> > 貌似他博客有相关介绍,长篇大论的 :)
>> >
>> > 2009/3/26 azure wang <azure1st@gmail.com>
>> >>
>> >> agentzh 能够介绍一下 X Hunter 抽取器和 Firefox/Webkit 集群。
>> >>
>> >> 以前都是普通的分析文本  抓取链接,对于解析js获取连接很感兴趣啊。尤其是抓取页面通过ajax获取的链接。
>> >>
>>
>> 呵呵,我在博客上介绍过的是我们的第一代 Mouse 集群,我们目前线上跑的是第二代 Cat
>> 集群,我这个月以来一直在集中力量开发的是我们的第三代 Tiger 集群。从第一代到第三代都是基于 Firefox 的,我同学
>> xunxin++ 目前正在为第四代基于 webkit 的 Lion 集群做准备工作。
>>
>> 等 Tiger 上线之后,我会在征得公司同意之后,对其中的一些关键组件开放源代码,并给出一系列介绍,呵呵,毕竟这些技术比较的敏感了 ;)
>>
>> Cheers,
>> -agentzh
>> >>
>

--~--~---------~--~----~------------~-------~--~----~
您收到此信息是由于您订阅了 Google 论坛"PerlChina Mongers 讨论组"论坛。
要在此论坛发帖,请发电子邮件到 perlchina@googlegroups.com
要退订此论坛,请发邮件至 perlchina+unsubscribe@googlegroups.com
更多选项,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛
-~----------~----~----~----~------~----~------~--~---

没有评论: