2011年7月13日星期三

Re: Re: [PerlChina] DNA,DG值。

谢谢两位的回复,确实,通过这个反例证明我那个方法不能找到最优解。我请教了我的一个同学,他叫我用 图论 来解决这个问题:建立这样一个图模型:该图含有400个顶点,代表不同的DNA;含有若干边,边代表两DNA可以发生杂交(dG<1)。用矩阵描述这个图。然后利用matlab bioinformational tool中的graphconncomp()(http://www.mathworks.com/help/toolbox/bioinfo/ref/graphconncomp.html)找若弱连通图。我对他这个方法的理解是这样的:孤立的点(一种弱连通图),一定是可以放进这个子集的;同时必然还存在一些其他的弱连通图中的顶点是可以放进这个子集的。如果matlab绘出图来,我倒是可以根据边的关系选出符合条件的点来,但是毕竟这是人工找出的,不是程序运算出的。关于用图论解决这个问题,大家有好的想法吗?

2011/7/13 zjf <microsoft_win7@126.com>


在 2011-07-12 20:19:25,"jie liu" <liujie.dhu@gmail.com> 写道:
大家好!

我这有个最优化问题,是关于求最大子集的,想请大家帮我想想。
问题的具体情形是这样的:
有一种指标dG,它能描述两两单链DNA互补杂交的热力学特征。我现在有400条DNA(编号为0,2,3...399),它们组成一个集合;我现在要从这个集合中找到一个子集,这个子集里的任意两两DNA的dG值大于等于一个值(m=1)。因为符合这样条件的子集很多,我要找到含有最多DNA个数的那个子集。
我的方法是这样的:方便起见,400条DNA两两之间的dG,凡dG>=1的重新赋值为1,dG<1的重新赋值为0。我把这些值写入一个2维矩阵。如图1(见附件)。含有最多1的那一行所代表的DNA被选出来,并且把所有与这个DNA杂交指标为1的其他DNA序列的相互关系写入一个新的2维矩阵,同时也会得到一个含有最多1的那一行,把它选出来,重复上个运算。如此反复,最终筛选出来的DNA将组成最大子集。
我用perl写出来这个算法,但是当我扩大总DNA数时出现了问题:理论上,最大子集中DNA个数将不小于扩大之前的,但是实际上,情况相反。
请大家帮我看看,1)这个算法有问题吗?2)你能把你的办法写成伪代码告诉我吗?如果你能用perl写成源代码最好了。


-- 
Best regards,
Liu Jie
 
020-32015312
Guangzhou Institutes of Biomedicine and Health, Chinese Academy of Sciences 

--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

感觉算法似乎有问题:
举个反例吧,如果有九条DNA,分别编号0~8
                              4
                              |
                       1----0-----2        5------8
                              |                  |    X  |
                              3                 6-----7

上图分别表示0和1,2,3,4的dg值>1;5 ,6 ,7 , 8之间两两dg >1,但是按照你的算法的话,
首先取的DNA为0,但最大子集却是5,6,7,8(没有0). 我也想不出什么好办法,等待高手吧。





--
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。



--
Best regards,
Liu Jie
 
020-32015312
Guangzhou Institutes of Biomedicine and Health, Chinese Academy of Sciences 

--
您收到此邮件是因为您订阅了 Google 网上论坛的"PerlChina Mongers 讨论组"论坛。
要向此网上论坛发帖,请发送电子邮件至 perlchina@googlegroups.com。
要取消订阅此网上论坛,请发送电子邮件至 perlchina+unsubscribe@googlegroups.com。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

没有评论: