求助一个问题:
解析一些html文件,需要把每个元素的属性分别读取到一个hash中,并且把属性原来的引号去掉,例如:
<button type="button" style = " border:none;background:url(button_bk.png); width:150px; height:49px; ">
应该是 %btn_hash = {
"type" => "button",
"style" => "border:none;background:url(button_bk.png); width:150px; height:49px;",
}
注:style去掉了多余的空格和原来字符串中的引号(""),所有属性都用字符串形式存放。
再如:
<font size=6>
应该是 %font_hash = {"size" => "6",}
这里6也是字符串。
我现在用的办法比较繁琐,用了多次正则表达式和s///g替换,而且使用了空格作为分隔属性的标志,在处理style时是存在错误的。
不知道有没有什么技巧,可以比较优雅地解决这个问题?
Thanks
--
B.R
Kermit
--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。
没有评论:
发表评论