汗,对的。
其实我想应该是这样的。
当perl读入文件后,无论对方是什么编码,自动转化为perl的内码。
就是那种有utf8_flag on的。
然后当再次输出的时候,是需要encode一下的。
我再看了一遍Encode模块的文档。
2009/9/17 cnhack TNT <cnhacktnt@gmail.com>
我知道什么问题了,你得这样用
-----
use Encode;
use WWW::Mechanize;
$a = new WWW::Mechanize;
$a->get("http://bendi.koubei.com/shanghai/searchstore--category-4");
print encode("gbk",$a->content);
2009/9/17 cnhack TNT <cnhacktnt@gmail.com>
1. 搞清楚抓来的数据是什么编码, 假设编码为 XX
2. $data_encoded = encode("gbk", decode("XX", $data) );
应该是没有问题的
2009/9/17 Mike.G <hylinux@gmail.com>
Hi, 各位有哪些朋友在cygwin环境下使用Perl呢?有么有碰到乱码的问题?我今天在cygwin下使用perl抓取数据,非常郁闷的是,无论如何也解决不了乱码的问题。use Encode后无论怎么编码解码都不能解决乱码。xp的code page本身都是gb2312的。请指教。谢谢。Mike.G
--~--~---------~--~----~------------~-------~--~----~
您收到此信息是由于您订阅了 Google 论坛"PerlChina Mongers 讨论组"论坛。
要在此论坛发帖,请发电子邮件到 perlchina@googlegroups.com
要退订此论坛,请发邮件至 perlchina+unsubscribe@googlegroups.com
更多选项,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛
-~----------~----~----~----~------~----~------~--~---
没有评论:
发表评论