自2021年以来,DeepMind开源AlphaFold2,发布了AlphaFold蛋白质结构数据库(AlphaFold DB) 。而现在,DeepMind正式宣布该数据库已经从近100万扩大到2.14亿个结构,预测蛋白质结构数量也提升了200多倍!几乎涵盖了地球上所有已进行过基因组测序的生物体。
据介绍,在超过2亿个蛋白质结构预测中,大约35%的结构具有高精度,并且已达到了实验手段获取的结构精度。80%的结构可靠性足以用于多项后续分析。让人兴奋的是,所有蛋白质三维结构都可以通过谷歌云公共数据集 (Google Cloud Public Datasets) 进行批量下载。这次数据库的更新更是涵盖了植物、细菌、动物和其他微生物的蛋白质结构。
另外,DeepMind也将自身数据库集成到其他公共数据集,像Ensembl、UniProt 和 OpenTargets都可以使用。目前,AlphaFold已被广泛使用,成为了世界各地成千上万实验室和大学的重要工具。
仅发布12个月后,已经有190个国家/地区的50多万研究人员访问数据库AlphaFold DB,查看了超200万个结构。科学家用其推进现实问题的研究,诸如疟疾候选疫苗、蜜蜂健康、抗生素抗药性等等。