2009年2月4日星期三

[PerlChina] Re: 强大好用的分词模块Text::Scws

ftphp是开源的不?是不是索引系统都得有个分词的工具?想改成别的语言的,是否有可能?
 
 
 

发件人: Beckheng Lam
发送时间: 2009-02-04  15:01:44
收件人: perlchina
抄送:
主题: [PerlChina] Re: 强大好用的分词模块Text::Scws
果然是好消息呀,xueron是谁?

//BR


wbi 畢 wrote:
用来开发 爬虫 不错

> Date: Tue, 3 Feb 2009 22:23:00 -0800
> Subject: [PerlChina] 强大好用的分词模块Text::Scws
> From: loveme1314@gmail.com
> To: perlchina@googlegroups.com
>
> 记得Perl大会的时候有人因为Perl没有好的分词工具而头疼,这下不用愁了
> 关于Scws的相关文档可以参看http://www.ftphp.com/scws/docs.php#phpscws
> Text::Scws是一个使用了Scws分词接口的模块,使用c代码编写,其分词效率和效果都很不错
> 一下是我的一个测试
> 南京市长江大桥欢迎你
> 分词后:
> 南京市 长江 大桥 欢迎 你
> 支持GB和UTF8甚至繁体分词
> 该模块的作者是xueron@xueron.com,如果你在使用中有什么问题可以与他联系
>


--   Perl乐事 -- http://www.perlersh.org  我的博客 -- http://www.perlersh.org/blog.html  
--~--~---------~--~----~------------~-------~--~----~
您收到此信息是由于您订阅了 Google 论坛"PerlChina Mongers 讨论组"论坛。
 要在此论坛发帖,请发电子邮件到 perlchina@googlegroups.com
 要退订此论坛,请发邮件至 perlchina+unsubscribe@googlegroups.com
 更多选项,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛

-~----------~----~----~----~------~----~------~--~---

没有评论: