2009年3月22日星期日

[PerlChina] Re: 网页不能抓取

2009/3/23 Leeo <yeli210@163.com>
>
> 我想通过这样的一个perl程序来抓取百度搜索perl关键词后的页面,但运行后报错:500 server closed connection
> with any date back!   我第一次写抓网页的程序,望大家多多指教!
因为向百度提交搜索请求的时候用的是GET而不是POST,你可以在你的firefox里面装个httpFox插件看到整个过程,或者使用Wireshark抓包看:
-my $response=$browser->post($url, ['q'=>'perl',], );
+my my $response=$browser->post("$url" . '/s?wd=perl' );

--
You should be the change you wish to see in the world

--~--~---------~--~----~------------~-------~--~----~
您收到此信息是由于您订阅了 Google 论坛"PerlChina Mongers 讨论组"论坛。
要在此论坛发帖,请发电子邮件到 perlchina@googlegroups.com
要退订此论坛,请发邮件至 perlchina+unsubscribe@googlegroups.com
更多选项,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛
-~----------~----~----~----~------~----~------~--~---

没有评论: