蛋白质结构域是蛋白质的结构、功能和进化单元。已经有一些对蛋白质结构域进行预测的工具,如用隐马尔可夫链(Profile hidden Markov models ,profile HMMs),根据它构建的Pfam数据库,已经能很好的解决蛋白结构域预测的问题。但是,对于较远缘的同源结构域检索,任然存在较大的噪音污染的问题,这是由于远源蛋白质的蛋白质序列相差较大引起的,虽然它们在结构和功能上相似。
在不同的物种中有不同的蛋白结构域,实际上,一些蛋白结构域是界专一性的(kingdom specific),但这种界专一性的信息还没有整合到现有的蛋白结构域预测方法中来。这篇文章试图通过在原有的检测方法中增加界专一性这种新的信息来提高检测的灵敏度。
结果表明,与原有的隐马尔可夫链方法相比,新的方法确实提高了检测的灵敏度。这种新的方法同样可以用于其它蛋白质分析工具中,如蛋白质的定位分析。
参考文献:
Lachlan Coin , Alex Bateman and Richard Durbin.
Enhanced protein domain discovery using taxonomy.
BMC Bioinformatics 2004, 5:56
http://www.biomedcentral.com/1471-2105/5/56


