2009年1月5日星期一

[PerlChina] Re: 如何抓取doc文件中的有规律的一段内容

2009/1/5 allen <allenogz@gmail.com>
1.一大堆文档(doc),都是基于一个模板写成的。然后,在模板中,有定义某一
章节是流程图。现在需要把每个文档的流程图抓出来,形成一个总项目的所有的流
程图,(doc格式)。
 
我记得我在从前替一家小公司打杂时做过类似的事情。不过当时我是写了一个 Perl 脚本将他们公司大量的 .doc 文档全转为了 .pod 文件。我使用了 Win32::OLE 这个模块调用  MS Word 的 COM 接口。
 

如何使用perl来实现该操作。 使用微软office自带的VB script很不好解决。
 
我一般都是先用 Office 内部的 VBA recorder 生成一些代码,再自己把那些 VBA 改好调通,最后再手工转码为 Perl. 呵呵。
 
不过貌似这里还需要识别出是流程图的图片,以及不是流程图的图片,呵呵。
 
-agentzh
 
P.S. 使用 Win32::OLE 来用 Perl 自动化 Office 应用程序还是很爽滴~~~

--~--~---------~--~----~------------~-------~--~----~
您收到此信息是由于您订阅了 Google 论坛"PerlChina 论坛"论坛。
 要在此论坛发帖,请发电子邮件到 perlchina@googlegroups.com
 要退订此论坛,请发邮件至 perlchina+unsubscribe@googlegroups.com
 更多选项,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛

-~----------~----~----~----~------~----~------~--~---

没有评论: