Perl China Blog Spot: [PerlChina] Re: 在我遇到的这种情况下散列和数组哪个快？

2009年9月22日星期二

[PerlChina] Re: 在我遇到的这种情况下散列和数组哪个快？

呵呵，确实是搞生物的，想做一个基因组分析。
15长度的字串是在序列上依次取的。因而一个长度为N bp 的DNA 序列会有(100－15)*2 种字串，当然可能有重复的。。。

On 9月21日, 下午10时48分, Michael Zeng <galaxy2...@gmail.com> wrote:
> 嗬嗬，原来是搞生物的，
>
> 用hash好了
>
> $hash{ $key} ++ ;
>
> 不知道你那个15长度的字符串怎么取的
>
> 2009/9/21 空格 <ribozyme2...@gmail.com>
>
> > 有一个长度为4.8G的字符串，其中只有四种字母ATGC。按照排列组合数，这四个字母组成的长度为15字符串总共有1｀073｀741｀824种可能
> > 性。我想统计一下，这个大字符串中是否包含了所有的长度为15的可能的字串。如果没有包含全部，那么有哪些字串的出现次数为零。
> > 为此，我想需要建立一个很大的表，然后从那个超大的字符串中逐个取出长度为15的字串，然后在表中统计其出现次数。这样可以得到结果。
> > 我的问题是，这样大的表格，用散列写好还是用二维数组写比较好？或者有什么别的方式实现更可行一些。
>
> > 谢谢各位～
>
> --
> Yours Sincerely
> Zeng Hong
--~--~---------~--~----~------------~-------~--~----~
您收到此信息是由于您订阅了 Google 论坛"PerlChina Mongers 讨论组"论坛。
要在此论坛发帖，请发电子邮件到 perlchina@googlegroups.com
要退订此论坛，请发邮件至 perlchina+unsubscribe@googlegroups.com
更多选项，请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛
-~----------~----~----~----~------~----~------~--~---

没有评论:

发表评论

Perl China Blog Spot

2009年9月22日星期二

[PerlChina] Re: 在我遇到的这种情况下散列和数组哪个快？

没有评论:

订阅

博客归档