来源
2006-3-27 8:21:22

什么是 Bioperl?

Bioperl  是一组  Perl  模块,它主要目的在于利用  Perl  解决生物学研究中的一些问题,主要是生物信息学中的各种实际问题,如获取分子生物学数据,分析序列文件,序列间比对,大批量  BLAST  ,数据挖掘,等等。

它主要的用途不在于直接提供可以使用的程序,而是提供大量可扩展的模块,使得生物学家可以利用它们很方便的写出满足自己需要的  Perl  脚本,以完成多种多样的任务。



谁需要使用  Bioperl  ?

Bioperl为生物信息学(bioinformatics)而设计,服务于研究生物学问题的生物学家或计算机专家。



perl.com上有  James  D.  Tisdall  写的几篇关于bioinformatics的文章:

Beginning  Bioinformatics  http://www.perl.com/pub/a/2002/01/02/bioinf.html

Parsing  Protein  Domains  with  Perl  http://www.perl.com/pub/a/2001/11/16/perlbio2.html

A  Chromosome  at  a  Time  with  Perl,  Part  1  http://www.perl.com/pub/a/2003/09/10/bioinformatics.html

A  Chromosome  at  a  Time  with  Perl,  Part  2  http://www.perl.com/pub/a/2003/10/15/bioinformatics.html



O’Reilly也已经出版了两本关于Perl和bioinformatics的书:  

Beginning  Perl  for  Bioinformatics  http://www.oreilly.com/catalog/begperlbio/  

Mastering  Perl  for  Bioinformatics  http://www.oreilly.com/catalog/mperlbio/



关于  Bioperl  开发项目



Bioperl  开发项目正式开始于1995年。它是一个开源项目,使用Perl语言开发,由  OBF  (Open  Bioinformatics  Foundation)  所支持。Bioperl的官方主页是  http://bioperl.org

Bioperl  的开发团队目前依然十分活跃,它的最新版本是1.5.0(2005年1月29日发布),目前的项目主持者是  Duke  大学的Jason  Stajich  http://www.duke.edu/~jes12/



Bioperl的简介

        Bioperl  最近已经到了1.0版,先说bioperl.org,该组织正式成立于1995年,在此之前已经作为非正式的团体存在那很多年,现在他已经形成了一个国际性的开发者的协会,这些开发者开发用于生物信息学,基因组学,和生命科学研究的开放源码的Perl  工具.

        该组织的支持者和推动者是Open  Bioinformatics  Foundation.  他们的伙伴还有biojava.org,  biopython.org,  DAS,  bioruby.org,  biocorba.org,  ENSEMBL  和  EMBOSS.  

        Bioperl的服务器提供供下列服务,用于生命科学的基于perl的模块,脚本,web联接的软件.  

        Bioperl现在已发展成为一个令人瞩目的国际性的自由软件开发计划,bioperl在生物信息学的使用加速了生物信息学、基因组学以及其他生命科学研究的发展。最近bioperl  1.0版本正式发布,这其间历时七年,成绩斐然。Bioperl  1.0  包括832个文件,93个Script,功能丰富,源码全部开放。它是生物信息学研究的利器。详细的内容大家可以访问www.bioperl.org。

        Bioperl作为perl的扩充的专门用于生物信息的工具与函数集,自然也继承了perl的众多优点.

        第一.  Perl强大的正则表示式(regular  expression)比对以及字符串操作使这个工作变得简单而没有其它语言能相比。Perl  非常擅长于切割,扭转,绞,弄平,总结,以及其它的操作文字文件。生物资料大部分是文字文件:物种名称,种属关系,基因或序列的注解,评住,目录查阅,  甚至DNA序列也是类文字的。现在互相交换以以文字文件的形式存在的但是具有不兼容的资料格式生物信息资料是一个很头疼的问题,perl的这个方面的优点,可以在这一方面解决不少问题.

        第二.  Perl  能容错。生物资料通常是不完全的,错误或者说误差从数据的产生时候可能就产生了.另外生物数据的某项值栏位可以被忽略  ,可能是空着的,或是某个栏位也就是某个值,被预期要出现好几次(举例来说,一个实验可能被重复的操作),或是资料以手动输入所以有错误。Perl并不介意某个值是空的或是有奇怪的字符。正规表示式能够被写成取出并且更正错误的一般错误。当然这种弹性也可能是各坏处。  

        还有,Perl  是组件导向的。Perl  鼓励人们将他们的软件写成小模组,不论是用  Perl  函式库模组或是正统的  Unix  工具导向的方式。外部程序能够轻易的被整合进  Perl  程序,靠着管道(pipe),系统呼叫,或是插座(socket)。Perl5  引进的动态载入器允许人们使用  C  的函式,或者让整个编程过的函式库,被使用在  Perl  直译器中。最近的成果是世界各地的智能结晶都会收录在一组模组里面,称为”bioPerl”(请参考  Perl  Journal)

        Perl  很容易去写并且能很快开发完。直译器让你不需要宣告你所有的函数型式以及资料型态,当未定义的函式被呼叫时只会引起一个错误,除错器也能与Emacs很好的合作并且让你能用令人舒服的交谈式的开发模式。

        Perl  是良好的原型语言。因为它快而且脏(quick  and  dirty),用  Perl  建构新演算的原型比直接写成一个快的需要编程过的语言来的有意义。有时候发现结果是Perl已经够快了,所以程序变不需要移植;更多情形是某人可以用C写一个小的核心程序,编程成动态载入的模组或是外部的可执行程序,然后其它的部分用Perl来完成。这部分的例子可以参考  http://waldo.wi.mit.edu/ftp/distribution/software/rhmapper/,)。  

        有一点要强调的是,  Perl  在写作网页  CGI  方面非常优秀,而且重要性随着各实验将资料发表在网络上之后更是增加。我在基因中心环境下使用  Perl  的经验从头到尾都是值得称赞的。然而我发现  Perl  也有它的问题。它的松散的程序风格导致许多错误,这些在其它严格的语言都会被抓到。举例来说,Perl  让你在一个变数在被指定值之前就能使用,这是个很有用的特性当你需要的时候,但是却是一个灾难当你单纯的打错了辨识名称。同样的,很容易忘记要宣告一个函式里面的区域变数,导致不小心地改到了全域变数。

        最后,Perl  的不足之处在于建立图形化的使用者接口。虽然  Unix忠实信徒所有事情都能在命令模式下完成,大多数的终端使用者却不同意。视窗,选单,弹跳的图案已经变成了必要的时尚。

        直到最近,直到最近,Perl  的使用者界面(GUI)发展仍是不成熟的。然而  Nick  Ing-Simmons的努力使得  perlTK(pTK)  的整合使得以  Perl  驱动的使用者接口在  X-window上面成为可能。我的伙伴和我曾经在  MIT  基因中心写过几个  pTK  为基础的应用程序供互连网使用者,而且从头到尾都是一个令人满意的经验。其它的基因中心则更大规模的使用  pTK,在某些地方已经成为主要的生产力。

  • 众说风云 (已有2条评论)

    相关新闻

    • 没有相关生物频道

    聚焦

    个人基因组测序将蓬勃发展

    生物谷专访:全球首家个人基因组测序机构Knome公司总裁及CEO

    Master

    人物

    成功的秘诀

    Train to gain

    招聘

    为你的职业拓宽道路

    分子生物学相关产品



    定量PCR仪

    Eppendorf Ep Master
    定量PCR仪

    实时定量PCR仪

    ABI Stepone TM 实时定量PCR仪,最新的软件系统,界面友好,操作简单

    PCR产物纯化

    各种厂家和各种规格的PCR产物纯化试剂盒


    定量PCR试剂

    最全的定量PCR试剂


    荧光定量PCR全套服务方案

    从引物设计到实验全程服务