2010年8月7日星期六

[PerlChina] Re: OSCON 美国开源大会的演讲下载

太棒了啊,谢谢啦!

On 7月30日, 上午10时31分, "Qiang (James)" <shijia...@gmail.com> wrote:
> http://www.oscon.com/oscon2010/public/schedule/proceedings
>
> 一年一度的盛会刚结束,很多演讲可以下载。
>
> Qiang (James)

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 能从文件句柄来知道文件名称么

open(my $h, "<test.dat");
$h{name} = "test.dat";

打开文件时,把文件名存在filehandle里面 也许比较适合

不过你这个需求,貌似有问题。。。
在 2010年8月8日 上午7:44,Michael Zeng <galaxy2004@gmail.com> 写道:
> 就是 我要打开的文件太多
>
> 很多 file handle ,
>
> 要回到很前面 才查到 打开哪个文件,如果 能从 handle直接 知道 就好了
>
>
>
> 2010/8/8 Huangj <redspid@163.com>
>>
>> 介个需求是如何产生的?
>>
>> At 2010-08-05 22:30:08,"Michael Zeng" <galaxy2004@gmail.com> wrote:
>>
>> 就是
>>
>> open my $F1, '<', 'ABC'
>>
>> or open my $F2 , '>' , "DEF" ;
>>
>>
>> 现在 拿到 $F1, $F2 , 如何返回文件的名称呢
>>
>> 比如ABC , DEF
>>
>>
>>
>> --
>> Yours Sincerely
>> Zeng Hong
>>
>> --
>> 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
>> 要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
>> 要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
>> 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
>>
>>
>> ________________________________
>> 您想拥有和网易免费邮箱一样强大的软件吗?
>>
>> --
>> 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
>> 要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
>> 要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
>> 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
>
>
>
> --
> Yours Sincerely
> Zeng Hong
>
> --
> 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
> 要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
> 要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
> 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
>

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 能从文件句柄来知道文件名称么

就是 我要打开的文件太多
 
很多 file handle ,
 
要回到很前面 才查到 打开哪个文件,如果 能从 handle直接 知道 就好了
 


 
2010/8/8 Huangj <redspid@163.com>
介个需求是如何产生的?


At 2010-08-05 22:30:08,"Michael Zeng" <galaxy2004@gmail.com> wrote:
就是
 
 open my $F1, '<',  'ABC' 
 
or   open my $F2 , '>' ,  "DEF" ;
 
 
现在 拿到 $F1, $F2 , 如何返回文件的名称呢
 
比如ABC , DEF
 
 


--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



您想拥有和网易免费邮箱一样强大的软件吗?

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re:[PerlChina] 能从文件句柄来知道文件名称么

介个需求是如何产生的?

At 2010-08-05 22:30:08,"Michael Zeng" <galaxy2004@gmail.com> wrote:
就是
 
 open my $F1, '<',  'ABC' 
 
or   open my $F2 , '>' ,  "DEF" ;
 
 
现在 拿到 $F1, $F2 , 如何返回文件的名称呢
 
比如ABC , DEF
 
 


--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



您想拥有和网易免费邮箱一样强大的软件吗?

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

2010年8月6日星期五

[PerlChina] excel表格,把页眉、页脚取消,怎么取消打印网格线,怎么设置页边距,perl可以做到吗??

excel表格,把页眉、页脚取消,怎么取消打印网格线,怎么设置页边距,
是用Spreadsheet-WriteExcel对吧,但要怎么写呢??
谢谢.....
 
------------------
我的QQ空间
最基本也是最常用的一些表达式
正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些...
 

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

2010年8月5日星期四

[PerlChina] Fwd: UG News: Processing and Arduino in Tandem--New Course from O'Reilly



-------- Original Message --------
Subject: UG News: Processing and Arduino in Tandem--New Course from O'Reilly
Date: Thu, 5 Aug 2010 11:16:45 -0700
From: Marsee Henon <usergroups@oreilly.com>
To:


O'Reilly Media, Inc.

View in Browser.

Forward this announcement to your user group or a friend.

Free Online Course
Processing with Arduino

Create your own drawing and animation software-and learn basic programming and electronics skills at the same time. This engaging 5-week online course introduces you to two simple tools: Processing, a programming language for visual thinkers, and Arduino, a hardware platform for working with electronics. You'll learn how to use these tools together to build something useful right away. You'll learn to:

  • Use Processing to create basic software applications
  • Make your own drawing and animation tools
  • Create a GUI (Graphical User Interface) to control your software
  • Use an Arduino to provide physical controls for your drawing and animation tools

Learn more Processing and Arduino in Tandem.

Register Now
Price: Free
calender icon 5-Week Course:
Tues, 8/31 – 9/28
clock icon 3:00pm PST
Each 90 - 120 minutes

Make the most of your course with our exclusive project kit.

projBox Kit
Price: $75

The projBox Kit contains everything you need to follow along with Processing and Arduino in Tandem. The kit, which requires no soldering, is ideal for beginners in electronics and physical computing. The projBox Kit contains:

  • projBox
  • Arduino Duemilanove
  • Electronics Breadboard
  • 4 10k potentiometers
  • 4 SPST switches
  • 4 LEDs
  • USB cable
  • Wires

Spreading the knowledge of innovators

oreilly.com

You are receiving this email because you are a User Group contact with O'Reilly Media. Forward this announcement. If you would like to stop receiving these newsletters or announcements from O'Reilly, send an email to marsee@oreilly.com.

O'Reilly Media, Inc. 1005 Gravenstein Highway North, Sebastopol, CA 95472 (707) 827-7000


Re: [PerlChina] 能从文件句柄来知道文件名称么

谢谢,原来  文件句柄 和文件名称 或者文件一些属性 还没啥关系
 
 
感觉 有些联系的,  也算是间接访问了

2010/8/6 woosley. xu. <redicaps@gmail.com>
就语言来说本身没有提供相应的方法

在linux上面可以通过fileno获得fd,然后在/proc/pid/fd目录下面查看对应fd软连接到了哪个文件


在 2010年8月5日 下午10:30,Michael Zeng <galaxy2004@gmail.com>写道:
就是
 
 open my $F1, '<',  'ABC' 
 
or   open my $F2 , '>' ,  "DEF" ;
 
 
现在 拿到 $F1, $F2 , 如何返回文件的名称呢
 
比如ABC , DEF
 
 


--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



--
Woosley.Xu




--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 能从文件句柄来知道文件名称么

就语言来说本身没有提供相应的方法

在linux上面可以通过fileno获得fd,然后在/proc/pid/fd目录下面查看对应fd软连接到了哪个文件


在 2010年8月5日 下午10:30,Michael Zeng <galaxy2004@gmail.com>写道:
就是
 
 open my $F1, '<',  'ABC' 
 
or   open my $F2 , '>' ,  "DEF" ;
 
 
现在 拿到 $F1, $F2 , 如何返回文件的名称呢
 
比如ABC , DEF
 
 


--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



--
Woosley.Xu



--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 能从文件句柄来知道文件名称么

忘了说, find . -inum 这里只在当前目录找

2010/8/6 cnhack TNT <cnhacktnt@gmail.com>
-MData::Dumper 选项不必要,我习惯性打上去的

2010/8/6 cnhack TNT <cnhacktnt@gmail.com>

在 linux/unix 上一个可能的方法是通过 stat 函数取得句柄所绑定的文件的 inode,然后用 find -inum 找,以 /etc/hosts 举例:

    perl -MData::Dumper -le 'open F, "/etc/hosts";  $ino=(stat(F))[1]; $file=`find . -inum $ino 2> /dev/null`; print $file'

但这么做是非常不靠谱的,如果你的系统上挂载有多个分区,那它们之间可能会碰上相同的 inode 号,但是不同文件。而且这么做非常没效率。

好方法是,在你读文件的时候,自己维护一个  文件句柄<->文件名 的映射哈希表。


2010/8/5 Michael Zeng <galaxy2004@gmail.com>

就是
 
 open my $F1, '<',  'ABC' 
 
or   open my $F2 , '>' ,  "DEF" ;
 
 
现在 拿到 $F1, $F2 , 如何返回文件的名称呢
 
比如ABC , DEF
 
 


--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 能从文件句柄来知道文件名称么

-MData::Dumper 选项不必要,我习惯性打上去的

2010/8/6 cnhack TNT <cnhacktnt@gmail.com>
在 linux/unix 上一个可能的方法是通过 stat 函数取得句柄所绑定的文件的 inode,然后用 find -inum 找,以 /etc/hosts 举例:

    perl -MData::Dumper -le 'open F, "/etc/hosts";  $ino=(stat(F))[1]; $file=`find . -inum $ino 2> /dev/null`; print $file'

但这么做是非常不靠谱的,如果你的系统上挂载有多个分区,那它们之间可能会碰上相同的 inode 号,但是不同文件。而且这么做非常没效率。

好方法是,在你读文件的时候,自己维护一个  文件句柄<->文件名 的映射哈希表。


2010/8/5 Michael Zeng <galaxy2004@gmail.com>

就是
 
 open my $F1, '<',  'ABC' 
 
or   open my $F2 , '>' ,  "DEF" ;
 
 
现在 拿到 $F1, $F2 , 如何返回文件的名称呢
 
比如ABC , DEF
 
 


--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。


--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 能从文件句柄来知道文件名称么

在 linux/unix 上一个可能的方法是通过 stat 函数取得句柄所绑定的文件的 inode,然后用 find -inum 找,以 /etc/hosts 举例:

    perl -MData::Dumper -le 'open F, "/etc/hosts";  $ino=(stat(F))[1]; $file=`find . -inum $ino 2> /dev/null`; print $file'

但这么做是非常不靠谱的,如果你的系统上挂载有多个分区,那它们之间可能会碰上相同的 inode 号,但是不同文件。而且这么做非常没效率。

好方法是,在你读文件的时候,自己维护一个  文件句柄<->文件名 的映射哈希表。


2010/8/5 Michael Zeng <galaxy2004@gmail.com>
就是
 
 open my $F1, '<',  'ABC' 
 
or   open my $F2 , '>' ,  "DEF" ;
 
 
现在 拿到 $F1, $F2 , 如何返回文件的名称呢
 
比如ABC , DEF
 
 


--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] 能从文件句柄来知道文件名称么

就是
 
 open my $F1, '<',  'ABC' 
 
or   open my $F2 , '>' ,  "DEF" ;
 
 
现在 拿到 $F1, $F2 , 如何返回文件的名称呢
 
比如ABC , DEF
 
 


--
            Yours Sincerely
                    Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

2010年8月4日星期三

Re: [PerlChina] 正则表达的问题和如何抓取网页信息

HTML::TreeBuilder::Select和Web::Scraper用的似乎是同样的模块啵。
感觉Web::Scraper的概念更易用。但两者效率是差不多的。
如果考虑效率的话,HTML::Parser是更好的。

Beckheng Lam 写道:
> 有没人想帮这几个模块做个benchmark?
>
> snyh 写道:
>
>> HTML::TreeBuilder::Select
>>
>> 两者的整合
>>
>> 在 2010年8月2日 上午9:31,azure wang <azure1st@gmail.com> 写道:
>>
>>
>>> HTML::Selector::XPath;
>>> 配合HTML::TreeBuilder::XPath;很强大 用CSS选择器的语法获取内容 和Jquery类似的语法 非常方便
>>> 比如
>>>
>>> div#footer a id是footer的div 下的所有连接
>>>
>>> 在 2010年7月30日 下午6:03,cnhack TNT <cnhacktnt@gmail.com>写道:
>>>
>>>
>>>> 网页信息抽取,用 Web::Scraper 会方便得多
>>>> http://perlchina.org/advent/2009/WebScraper.html
>>>>
>>>> 2010/7/30 Qiang (James) <shijialee@gmail.com>
>>>>
>>>>
>>>>> xuanshi wrote:
>>>>>
>>>>>
>>>>>> Hi all
>>>>>>
>>>>>>
>>>>>> 1,我在做 正则表达时, 我用了如下的语句: if ($KnowEn[$i] =~ /\$Instance/)
>>>>>> {
>>>>>> print $KnowEn[$i] ."\n";
>>>>>> }
>>>>>> 系统总是对这个报错。我想知道,是什么原因呢 ? 我现在猜测是:$KnowEn[$i]与循环有关,出了问题,环不下去,还有原文件里有空白的行。
>>>>>>
>>>>>>
>>>>>>
>>>>> 报什么错?最重要的错误信息请不要省略。
>>>>>
>>>>>
>>>>>
>>>>>> 2, 另外,我想从一个网页里,把我需要的信息抓取下来,要从哪里入手呢?比如这个网站:
>>>>>> http://www2.chkd.cnki.net/kns50/Dict/dict_list.aspx?firstLetter=B#
>>>>>> 有如下信息,有些是重要的,有些不重要。
>>>>>>
>>>>>>
>>>>> 你需要先抓网页(通过 LWP 或 WWW::Mechanize 即可),然后根据内容的分布来匹
>>>>> 配(你可以通过正则匹配或是 CPAN 上的一些模块)。
>>>>>
>>>>> 这是 LWP 的一个教程 http://wiki.perlchina.org/LWP与WEB的基本使用
>>>>>
>>>>> 鉴于你要抓取的内容是在一个 html table 里,你可以使用
>>>>> CPAN(search.cpan.org) 上众多的解析 table 的模块,例如 HTML::TableExtract
>>>>> 和 HTML::TableParser。
>>>>>
>>>>> Qiang (James)
>>>>>
>>>>>
>>>>>
>>>>>
>>> --
>>> Azure.Wang
>>>
>>>
>>>
>>
>>
>
>
>


--
Perl乐事 -- http://www.perlersh.org
我的博客 -- http://www.perlersh.org/blog.html
诸法从缘起,如来说是因。
彼法因缘尽,是大沙门说。

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] 如何删除中文文件中,重复出现的信息,只保留第一次出现信息。

我有如下程序,在处理英文文件的时候,可以把一个
/a/b "blah"
=/c/cc "blah"
/a/b "blah"
=/c1/cc3 "blah"
/a/c "blah"
=/c2/cc "blah"
=/ccc/cd ""blah
/a/c
=/d/dd "blah"
=/ds/dd "blah"
=/df/x "blah"

变成
/a/b "blah"
=/c/cc "blah"
=/c1/cc3 "blah"
/a/c "blah"
=/c2/cc "blah"
=/ccc/cd ""blah
=/d/dd "blah"
=/ds/dd "blah"
=/df/x "blah"

但在处理相同格式的中文文件时,却出现了问题,请教下大家,这个是怎么回事呢 ?如何解决呢?

程序:
my $file = 'blah blah';
my %seen = ();
{
local @ARGV = ($file);
local $^I = '.bac';
while(<>)
{
$seen{$_}++;
next if $seen{$_} > 1;
print;
}
}

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] Re: 正则表达的问题和如何抓取网页信息

找到原因了,应该是因为那个源文件里的( ,]等等符号,正则判断时, 会对结果有影响,从而找不到正解


On 2 Aug., 11:52, xuanshi <xuanb...@googlemail.com> wrote:
> 这个是报错的信息: Unmatched ) in regex; marked by <-- HERE in m/
> chinese_anno_2_en_Instance_1008]) <-- HERE
>
> On 29 Jul., 16:18, xuanshi <xuanb...@googlemail.com> wrote:
>
> > Hi all
>
> > 1,我在做 正则表达时, 我用了如下的语句: if ($KnowEn[$i] =~ /\$Instance/)
> > {
> > print $KnowEn[$i] ."\n";
> > }
> > 系统总是对这个报错。我想知道,是什么原因呢 ? 我现在猜测是:$KnowEn[$i]与循环有关,出了问题,环不下去,还有原文件里有空白的行。
>
> > 2, 另外,我想从一个网页里,把我需要的信息抓取下来,要从哪里入手呢?比如这个网站:http://www2.chkd.cnki.net/kns50/Dict/dict_list.aspx?firstLetter=B#
> > 有如下信息,有些是重要的,有些不重要。
> > 1 11-beta-Hydroxysteroid Dehydrogenase Type 1 11-β-羟甾脱氢酶1型 2 0 0 0
> > 2 11-beta-Hydroxysteroid Dehydrogenase Type 2 11-β-羟甾脱氢酶2型 0 0 0 0
> > 3 11-beta-Hydroxysteroid Dehydrogenases 11-β-羟甾脱氢酶类 73 23 12 1
> > 4 4-(3-Butoxy-4-methoxybenzyl)-2-imidazolidinone 4-(3-丁氧基-4-甲氧基苄基)-2-咪唑
> > 啉酮 0 0 0 0
> > 5 4-1BB Ligand 4-1BB配体 80 24 24 0
> > 6 4-Butyrolactone 4-丁内酯 74 16 2 5
> > 7 8-Bromo Cyclic Adenosine Monophosphate 8-溴环腺苷一磷酸 9 1 0 0
> > 8 B-Cell Activating Factor B-细胞激活因子 96 37 33

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

2010年8月3日星期二

Re: [PerlChina] 用了一个星期的mongodb,发现超耗内存和硬盘呀。

我在本机开了两个进程同时操作,用top看到mongod的VIRT是1.122G。
而在VPS,开了大概5个左右进程同时操作。内存已经爆到2G了。再后来开进程操作
就出现out of memory了。
不知道是否后期加了几个索引的原因。

smallfish 写道:
> 磁盘消耗大是正常的,内存以前没发觉太过猛烈啊
> 以空间换时间啊~
> --
> blog: http://chenxiaoyu.org twitter: @nnfish <http://twitter.com/nnfish>
>
>
>
> 在 2010年8月4日 上午9:54,Beckheng Lam <bi.ken.lam@gmail.com
> <mailto:bi.ken.lam@gmail.com>>写道:
>
> 貌似比较变态。
>
> --
> Perl乐事 -- http://www.perlersh.org
> 我的博客 -- http://www.perlersh.org/blog.html
> 诸法从缘起,如来说是因。
> 彼法因缘尽,是大沙门说。
>
>


--
Perl乐事 -- http://www.perlersh.org
我的博客 -- http://www.perlersh.org/blog.html
诸法从缘起,如来说是因。
彼法因缘尽,是大沙门说。

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 用了一个星期的mongodb,发现超耗内存和硬盘呀。

磁盘消耗大是正常的,内存以前没发觉太过猛烈啊
以空间换时间啊~
--


在 2010年8月4日 上午9:54,Beckheng Lam <bi.ken.lam@gmail.com>写道:
貌似比较变态。

--
Perl乐事 -- http://www.perlersh.org
我的博客 -- http://www.perlersh.org/blog.html
诸法从缘起,如来说是因。
彼法因缘尽,是大沙门说。

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。


--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] 用了一个星期的mongodb,发现超耗内存和硬盘呀。

貌似比较变态。

--
Perl乐事 -- http://www.perlersh.org
我的博客 -- http://www.perlersh.org/blog.html
诸法从缘起,如来说是因。
彼法因缘尽,是大沙门说。

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

2010年8月2日星期一

Re: 回复: [PerlChina] Re: 说说大家网站被攻击的事

关注。。。。

在 2010年7月23日 下午12:18,x2x4 <x2x4com@gmail.com>写道:

我认为针对cc类的攻击还是需要维护人员通过日志来写正则来封ip
但有时候对sa的要求太高了。

但是如果碰过堆流量的udp flood我实在没有什么好办法,现在是买了电信的清洗服务

在 2010-7-23 上午11:52,"Xti9er" <xti9er@gmail.com>编写:


rewrite时也消耗系统性能,除非对方是固定IP进行CC,如果是大量分布式的,用iptables防都比rewrite强。


On 7月21日, 下午9时11分, PIG <addm...@gmail.com> wrote:
> 写个脚本,对肉鸡ip rewrite到fl功网站就OK了。全中国硬防。
>

> 在 2010年7月21日 下午8:52,centerqi hu <cente...@gmail.com> 写道:

>
>
>
> > 说说大家网站被攻击的事,今天我们花了半天的时间才把入侵者杀死。
>
> > --
> > 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers ...

> > 若有更多问题,请通过http://groups.google.com/group/perlchina?hl=zh-CN访问此网上论坛。- 隐藏被引用文字 -
>
> - 显示引用的文字 -

--

您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
...

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] Re: 深更半夜,Rakudo Star 发布!

应该有的吧,不过没有怎么关注,刚刚看到一个 yapsi :A Perl 6 compiler-and-runtime written in
Perl 6。


On Aug 2, 5:56 am, greencow <spiralzh...@gmail.com> wrote:
> 不知道会不会有人开发不基于parrot的编译器perl6? 我是说active development。 Pugs 看似已经停顿了。
>
> On Jul 31, 1:42 pm, phenicsl <pheni...@gmail.com> wrote:
>
> > linux下面也不是很快,不到1秒,不过不像使用perl5那样即刻出现结果。
>
> > 是不是因为perl6先要编译成pir中间格式,然后再load Parrot进来执行, 所以就免不了要为小事情做大动作。
>
> > 话说回来,当前只是whatever的版本,期待会做得更好。
>
> > On Jul 31, 6:37 pm, Michael Zeng <galaxy2...@gmail.com> wrote:
>
> > > 运行起来不要太慢
>
> > > perl6 -e " say 'hello world' " 要十几秒 , 我下载了 win32版
>
> > > 2010/7/30 phenicsl <pheni...@gmail.com>
>
> > > > 乐土之星终于到来!
>
> > > > On Jul 30, 12:08 am, smallfish <smallfish...@gmail.com> wrote:
> > > > > Rakudo Star 发布,Perl 6 看起来速度也加快了!
>
> > > > >http://rakudo.org/announce/rakudo-star/2010.07
>
> > > > > --
> > > > > blog:http://chenxiaoyu.orgtwitter:@nnfish<http://twitter.com/nnfish>
>
> > > > --
> > > > 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
> > > > 要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
> > > > 要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com<perlchina%2Bunsubscribe@googlegroups.com>
> > > > 。
> > > > 若有更多问题,请通过http://groups.google.com/group/perlchina?hl=zh-CN访问此网上论坛。
>
> > > --
> > > Yours Sincerely
> > > Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] Re: 正则表达的问题和如何抓取网页信息

这个是报错的信息: Unmatched ) in regex; marked by <-- HERE in m/
chinese_anno_2_en_Instance_1008]) <-- HERE


On 29 Jul., 16:18, xuanshi <xuanb...@googlemail.com> wrote:
> Hi all
>
> 1,我在做 正则表达时, 我用了如下的语句: if ($KnowEn[$i] =~ /\$Instance/)
> {
> print $KnowEn[$i] ."\n";
> }
> 系统总是对这个报错。我想知道,是什么原因呢 ? 我现在猜测是:$KnowEn[$i]与循环有关,出了问题,环不下去,还有原文件里有空白的行。
>
> 2, 另外,我想从一个网页里,把我需要的信息抓取下来,要从哪里入手呢?比如这个网站:http://www2.chkd.cnki.net/kns50/Dict/dict_list.aspx?firstLetter=B#
> 有如下信息,有些是重要的,有些不重要。
> 1 11-beta-Hydroxysteroid Dehydrogenase Type 1 11-β-羟甾脱氢酶1型 2 0 0 0
> 2 11-beta-Hydroxysteroid Dehydrogenase Type 2 11-β-羟甾脱氢酶2型 0 0 0 0
> 3 11-beta-Hydroxysteroid Dehydrogenases 11-β-羟甾脱氢酶类 73 23 12 1
> 4 4-(3-Butoxy-4-methoxybenzyl)-2-imidazolidinone 4-(3-丁氧基-4-甲氧基苄基)-2-咪唑
> 啉酮 0 0 0 0
> 5 4-1BB Ligand 4-1BB配体 80 24 24 0
> 6 4-Butyrolactone 4-丁内酯 74 16 2 5
> 7 8-Bromo Cyclic Adenosine Monophosphate 8-溴环腺苷一磷酸 9 1 0 0
> 8 B-Cell Activating Factor B-细胞激活因子 96 37 33

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] 如果在多线程中,在子程序中对引用lock,能lock原变量么

RT谢谢
code:



my %result:shared;

$result{"flag"}=&share({});
$result{"flag"}{"wait"}=&share({});
$result{"flag"}{"wait"}=0;


resume617(\%result);


sub resume617{

($local_result)=@_;
lock($local_result);
$local_result->{"flag"}->{"wait"}=0;

}

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

2010年8月1日星期日

Re: [PerlChina] 正则表达的问题和如何抓取网页信息

有没人想帮这几个模块做个benchmark?

snyh 写道:
> HTML::TreeBuilder::Select
>
> 两者的整合
>
> 在 2010年8月2日 上午9:31,azure wang <azure1st@gmail.com> 写道:
>
>> HTML::Selector::XPath;
>> 配合HTML::TreeBuilder::XPath;很强大 用CSS选择器的语法获取内容 和Jquery类似的语法 非常方便
>> 比如
>>
>> div#footer a id是footer的div 下的所有连接
>>
>> 在 2010年7月30日 下午6:03,cnhack TNT <cnhacktnt@gmail.com>写道:
>>
>>> 网页信息抽取,用 Web::Scraper 会方便得多
>>> http://perlchina.org/advent/2009/WebScraper.html
>>>
>>> 2010/7/30 Qiang (James) <shijialee@gmail.com>
>>>
>>>> xuanshi wrote:
>>>>
>>>>> Hi all
>>>>>
>>>>>
>>>>> 1,我在做 正则表达时, 我用了如下的语句: if ($KnowEn[$i] =~ /\$Instance/)
>>>>> {
>>>>> print $KnowEn[$i] ."\n";
>>>>> }
>>>>> 系统总是对这个报错。我想知道,是什么原因呢 ? 我现在猜测是:$KnowEn[$i]与循环有关,出了问题,环不下去,还有原文件里有空白的行。
>>>>>
>>>>>
>>>> 报什么错?最重要的错误信息请不要省略。
>>>>
>>>>
>>>>>
>>>>> 2, 另外,我想从一个网页里,把我需要的信息抓取下来,要从哪里入手呢?比如这个网站:
>>>>> http://www2.chkd.cnki.net/kns50/Dict/dict_list.aspx?firstLetter=B#
>>>>> 有如下信息,有些是重要的,有些不重要。
>>>>>
>>>> 你需要先抓网页(通过 LWP 或 WWW::Mechanize 即可),然后根据内容的分布来匹
>>>> 配(你可以通过正则匹配或是 CPAN 上的一些模块)。
>>>>
>>>> 这是 LWP 的一个教程 http://wiki.perlchina.org/LWP与WEB的基本使用
>>>>
>>>> 鉴于你要抓取的内容是在一个 html table 里,你可以使用
>>>> CPAN(search.cpan.org) 上众多的解析 table 的模块,例如 HTML::TableExtract
>>>> 和 HTML::TableParser。
>>>>
>>>> Qiang (James)
>>>>
>>>>
>>>>
>>>
>>
>> --
>> Azure.Wang
>>
>>
>
>


--
Perl乐事 -- http://www.perlersh.org
我的博客 -- http://www.perlersh.org/blog.html
诸法从缘起,如来说是因。
彼法因缘尽,是大沙门说。

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 正则表达的问题和如何抓取网页信息

HTML::TreeBuilder::Select

两者的整合

在 2010年8月2日 上午9:31,azure wang <azure1st@gmail.com> 写道:
> HTML::Selector::XPath;
> 配合HTML::TreeBuilder::XPath;很强大 用CSS选择器的语法获取内容 和Jquery类似的语法 非常方便
> 比如
>
> div#footer a id是footer的div 下的所有连接
>
> 在 2010年7月30日 下午6:03,cnhack TNT <cnhacktnt@gmail.com>写道:
>>
>> 网页信息抽取,用 Web::Scraper 会方便得多
>> http://perlchina.org/advent/2009/WebScraper.html
>>
>> 2010/7/30 Qiang (James) <shijialee@gmail.com>
>>>
>>> xuanshi wrote:
>>> > Hi all
>>> >
>>> >
>>> > 1,我在做 正则表达时, 我用了如下的语句: if ($KnowEn[$i] =~ /\$Instance/)
>>> > {
>>> > print $KnowEn[$i] ."\n";
>>> > }
>>> > 系统总是对这个报错。我想知道,是什么原因呢 ? 我现在猜测是:$KnowEn[$i]与循环有关,出了问题,环不下去,还有原文件里有空白的行。
>>> >
>>>
>>> 报什么错?最重要的错误信息请不要省略。
>>>
>>> >
>>> >
>>> >
>>> > 2, 另外,我想从一个网页里,把我需要的信息抓取下来,要从哪里入手呢?比如这个网站:
>>> > http://www2.chkd.cnki.net/kns50/Dict/dict_list.aspx?firstLetter=B#
>>> > 有如下信息,有些是重要的,有些不重要。
>>>
>>> 你需要先抓网页(通过 LWP 或 WWW::Mechanize 即可),然后根据内容的分布来匹
>>> 配(你可以通过正则匹配或是 CPAN 上的一些模块)。
>>>
>>> 这是 LWP 的一个教程 http://wiki.perlchina.org/LWP与WEB的基本使用
>>>
>>> 鉴于你要抓取的内容是在一个 html table 里,你可以使用
>>> CPAN(search.cpan.org) 上众多的解析 table 的模块,例如 HTML::TableExtract
>>> 和 HTML::TableParser。
>>>
>>> Qiang (James)
>>>
>>> --
>>> 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
>>> 要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
>>> 要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
>>> 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
>>>
>>
>> --
>> 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
>> 要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
>> 要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
>> 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
>
>
>
> --
> Azure.Wang
>
> --
> 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
> 要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
> 要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
> 若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
>

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] About required parameters in sub

perldoc perlsub

search for prototype.

2010/8/2 <ppstay@hotmail.com>
I saw someone uses the following syntax to define a subroutine:
 
sub SubName($$;$;$)
 
which means there are 2 required parameters? and the rest 2 are optional? I did a search but didn't find it. Anyone could give me a link?
 
Thanks in advance!
 
Andy

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

Re: [PerlChina] 正则表达的问题和如何抓取网页信息

HTML::Selector::XPath;
配合HTML::TreeBuilder::XPath;很强大 用CSS选择器的语法获取内容   和Jquery类似的语法  非常方便
 比如
 
div#footer a   id是footer的div 下的所有连接

在 2010年7月30日 下午6:03,cnhack TNT <cnhacktnt@gmail.com>写道:
网页信息抽取,用 Web::Scraper 会方便得多



2010/7/30 Qiang (James) <shijialee@gmail.com>

xuanshi wrote:
> Hi all
>
>
> 1,我在做 正则表达时, 我用了如下的语句: if ($KnowEn[$i] =~ /\$Instance/)
>                                       {
>                                               print $KnowEn[$i] ."\n";
>                                       }
> 系统总是对这个报错。我想知道,是什么原因呢 ? 我现在猜测是:$KnowEn[$i]与循环有关,出了问题,环不下去,还有原文件里有空白的行。
>

报什么错?最重要的错误信息请不要省略。

>
>
>
> 2, 另外,我想从一个网页里,把我需要的信息抓取下来,要从哪里入手呢?比如这个网站:
> http://www2.chkd.cnki.net/kns50/Dict/dict_list.aspx?firstLetter=B#
> 有如下信息,有些是重要的,有些不重要。

你需要先抓网页(通过 LWP 或 WWW::Mechanize 即可),然后根据内容的分布来匹
配(你可以通过正则匹配或是 CPAN 上的一些模块)。

这是 LWP 的一个教程 http://wiki.perlchina.org/LWP与WEB的基本使用

鉴于你要抓取的内容是在一个 html table 里,你可以使用
CPAN(search.cpan.org) 上众多的解析 table 的模块,例如 HTML::TableExtract
和 HTML::TableParser。

Qiang (James)

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。


--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



--
Azure.Wang

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] Re: 深更半夜,Rakudo Star 发布!

不知道会不会有人开发不基于parrot的编译器perl6? 我是说active development。 Pugs 看似已经停顿了。

On Jul 31, 1:42 pm, phenicsl <pheni...@gmail.com> wrote:
> linux下面也不是很快,不到1秒,不过不像使用perl5那样即刻出现结果。
>
> 是不是因为perl6先要编译成pir中间格式,然后再load Parrot进来执行, 所以就免不了要为小事情做大动作。
>
> 话说回来,当前只是whatever的版本,期待会做得更好。
>
> On Jul 31, 6:37 pm, Michael Zeng <galaxy2...@gmail.com> wrote:
>
> > 运行起来不要太慢
>
> > perl6 -e " say 'hello world' " 要十几秒 , 我下载了 win32版
>
> > 2010/7/30 phenicsl <pheni...@gmail.com>
>
> > > 乐土之星终于到来!
>
> > > On Jul 30, 12:08 am, smallfish <smallfish...@gmail.com> wrote:
> > > > Rakudo Star 发布,Perl 6 看起来速度也加快了!
>
> > > >http://rakudo.org/announce/rakudo-star/2010.07
>
> > > > --
> > > > blog:http://chenxiaoyu.orgtwitter:@nnfish <http://twitter.com/nnfish>
>
> > > --
> > > 您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
> > > 要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
> > > 要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com<perlchina%2Bunsubscribe@googlegroups.com>
> > > 。
> > > 若有更多问题,请通过http://groups.google.com/group/perlchina?hl=zh-CN访问此网上论坛。
>
> > --
> > Yours Sincerely
> > Zeng Hong

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

[PerlChina] About required parameters in sub

I saw someone uses the following syntax to define a subroutine:
 
sub SubName($$;$;$)
 
which means there are 2 required parameters? and the rest 2 are optional? I did a search but didn't find it. Anyone could give me a link?
 
Thanks in advance!
 
Andy

Re: [PerlChina] 有擅长网站日志分析的朋友吗?

做api方式 允许用户实时提交日志 内部系统 我就是这么设计的 前端大概也有几十台的样子

2010/7/15 imxae <imx365ster@gmail.com>

大日志文件上传不方便

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



--
光风 @ http://webisbeauty.appspot.com/

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。