Rosetta@home

Rosetta@home
原作者戴维·贝克團隊
开发華盛頓大學貝克實驗室
最初发布时间2005年10月6日​(19年前)​(2005-10-06
开发状态活躍
项目目标蛋白質結構預測
蛋白質設計英语Protein design
操作系统Microsoft Windows
麥金塔操作系統
Linux
Android
平台BOINC
使用语言英語
许可学术使用和非營利使用免费
商业使用须签署商业协议[1]
截止时间2023-04-02
平均表现225,041吉
活跃用户数36,726
总用户数1,363,584
活跃主机数249,673
总主机数529,112
网址boinc.bakerlab.org/rosetta 編輯維基數據鏈接

Rosetta@home是一个基于伯克利开放式网络计算平台(BOINC)的分布式计算项目,由华盛顿大学贝克实验室开发和维护,用于蛋白质结构预测蛋白质-蛋白质对接和新的蛋白质设计英语Protein design的研究。截至2015年2月12日,全球共有5万多台计算机是这一项目的活跃志愿者,平均每秒浮點運算次數达87万亿(87.688 teraFLOPS)。[2]Rosetta@Home还开发了一款电子游戏Foldit,目的是通过众包途径来实现上述研究目标。尽管这个项目很大程度上侧重于进行提高蛋白质组学方法的精确性和稳固性的基础研究,它也进行一些关于艾滋病疟疾癌症阿兹海默病以及其他疾病的病理学的应用研究。[3]

与其他BOINC项目一样,Rosetta@home使用志愿者的计算机中空闲的进程资源来执行单独的单元计算。计算结果会被发送到项目的中央服务器,经验证後存入数据库中。这个项目是跨平台的,支持多种不同的软件計算機硬件环境。用户可通过Rosetta@home的屏幕保护程序观看正在自己计算机上进行的蛋白质结构预测的情况。

除了疾病相关研究,Rosetta@home网络还是结构生物信息学中新方法的一个测试框架。这些新方法经Rosetta@home庞大且多样的用户群体使用後,若运行效果稳定,将会被用于其他基于Rosetta的应用程序,例如RosettaDock人类蛋白质组折叠项目英语Human Proteome Folding Project(HPF)。新方法测试中的两个重要项目是蛋白质结构预测技术的关键测试(CASP)和交互作用预测的关键测试英语Critical Assessment of Prediction of Interactions(CAPRI)。这两项测试实验分别用于评估蛋白质结构预测和蛋白质-蛋白质对接预测的最前沿技术。Rosetta@home稳居最重要的对接预测器之一,并且是现有最好的蛋白质三级结构预测器之一。[4]

计算平台

Rosetta@home应用程序和BOINC均支持Microsoft WindowsLinux苹果机Android平台。(BOINC还可在更多平台上运行,如FreeBSD。)[5]参与Rosetta@home的客户端计算机需要有一个时钟频率至少达到500兆赫中央处理器、400MB空餘的硬盘空间、512MB的物理内存,以及因特网连接。[6]截至2021年5月1日,Rosetta应用程序的最新版本号是4.20,在Android平台上应用程序的最新版本号是4.20。[7]用户的BOINC客户端与位于华盛顿大学的Rosetta@home服务器端之间使用标准HTTP(80端口)进行通信,HTTPS(443端口)用于密码交换。BOINC客户端使用1043和31416端口进行远程和本地控制,这两个端口可能需要在防火墙中被设置为“解除封禁”才可被使用。[8]包含蛋白质数据的工作单元由服务器分配给志愿者的计算机(客户端),然后客户端对所分配得到的任务进行蛋白质预测运算。为了避免重复的预测,每个工作单元会得到一个初始的随机种子。这使得每个预测具有独一无二的沿蛋白质能量图景(energy landscape)的下降轨道。[9]对于给定的蛋白质能量图景,Rosetta@home的结构预测近似为整体极小值。这个整体极小值代表该蛋白质的能量最佳构造,即它的自然态

Rosetta@home屏幕保护程序,显示了一个合成泛素蛋白质(PDB ID: 1ogw)的结构预测进行情况

Rosetta@home的图形用户界面是一个屏幕保护程序,显示了当前工作单元进行蛋白质折叠模拟的情况。屏幕左上方为当前蛋白质链正在尝试的移动(即搜索的形状)。紧邻其右侧是最新一个被接受的移动。再往右侧分上下两个小图,上图为当前最低能量形状,下图为实验中得到的真实形状(如果已知)。屏幕中部显示的是被接受模型的自由能变化曲线。屏幕上方最右侧是接受模型的均方根偏差(RMSD)曲线,体现了被接受模型与实验中真实模型之间的相似度。在自由能变化曲线右侧、RMSD曲线下方,使用这两项结果生成了一个能量/RMSD图,伴随着模型的不断精确。[10]

与所有其他BOINC项目类似,Rosetta@home利用客户端空闲资源,在后台执行。执行过程可能发生在用户登录操作系统之前或之后。当其他应用程序需要时,Rosetta@home会释放资源,因此不会影响用户对计算机的正常使用。为了使计算机的功耗或者放热降到最低,用户可以自行指定Rosetta@home使用CPU资源的最大比例。此外,Rosetta@home每天最多运行次数,以及更多选项也都可以通过用户的账户选项来进行设置。

Rosetta@home网络所使用的Rosetta软件最早用Fortran编写,后改用C++重新编写,以利于进一步的开发。新版本于2008年2月8日发布,实现了面向对象[11]Rosetta代码由Rosetta Commons开发。[12]这个软件对学术使用免费,对制药公司则收取费用。[12]

项目意义

通过一系列的基因组测序计划,科学家能够判定许多种在细胞内发挥作用的蛋白质的氨基酸序列或者一级结构。为了更好地了解蛋白质的功能,以及向合理化药物设计提供辅助,科学家们需要知道蛋白质的三维三级结构

CASP6的目标蛋白质T0281:首个接近原子级精度的ab initio蛋白质结构预测。Rosetta生成了T0281(洋红色)的一个模型,与实验测定的晶体结构(蓝色)之间的RMSD为1.5

蛋白质的三维结构目前主要通过X射线晶体学核磁共振技术来进行实验确定。这个过程十分耗时,例如可能花费数星期或者几个月才能首次研究出如何使一种蛋白质结晶;而成本又非常高,每种蛋白质耗费约10万美元。[13]更重要的是,发现新序列的速度远超确定结构的速度:美国国家生物技术信息中心非冗余蛋白质数据库中存在的超过740万个蛋白质序列中,仅有不到5.2万已被确定结构并被存入蛋白质数据库中。[14]Rosetta@home的一个主要目标是在显著降低时间和金钱成本的情况下,预测蛋白质结构,并且达到与现有实验方法同样的精度。Rosetta@home还开发了确定膜蛋白(如G蛋白偶联受体)结构和对接的方法。[15]膜蛋白是现代药物设计的主要目标,但通过X射线晶体学、核磁共振等传统技术却极难获得其结构。

蛋白质结构预测的进展通过两年一届的蛋白质结构预测技术的关键测试(CASP)实验来进行评估。在这项实验中,来自全球各地的研究人员尝试从氨基酸序列中得到蛋白质结构。这项实验有时竞争十分激烈,得分高的小组被认为是最高端蛋白质结构预测研究的事实上的标准制定者。Rosetta@home所基于的Rosetta程序,自1998年的CASP3实验上开始被使用。在2004年的CASP6上,Rosetta创造了历史,在它为CASP目标蛋白质T0281提供的模型中,首次生成了接近原子级精度的ab initio蛋白质结构预测。[16]Ab initio不使用结构同源英语Structural alignment的信息,而必须依赖于序列同源信息以及蛋白质内的模拟物理交互,因此被认为是一类特别难以预测的蛋白质结构。Rosetta@home自2006年CASP7上开始被使用。在CASP7上,它在每个类别的预测中都成为最好的预测器之一。[17][18][19]而高质量的预测需要来自Rosetta@home众多志愿者提供计算资源。[20]不断增多的计算资源使Rosetta@home能够对构象空间(一个蛋白质可以被假设具有的可能的形状)更多的区域进行取样,根据“黎文索尔佯谬”(Levinthal paradox),采样数量会随着蛋白质长度的增长而呈指数增长

Rosetta@home也被用于蛋白质-蛋白质对接预测。这项预测确定蛋白质复合体结构或者四级结构。这一类型的蛋白质交互作用影响到许多细胞功能,包括抗原-抗体-抑制剂捆绑等。确定这些交互作用在药物设计中十分关键。Rosetta被用于交互作用预测的关键测试(CAPRI)实验。这项实验评估当前最前沿的蛋白质对接技术,评估模式与CASP类似。Rosetta在这项实验中得到的结果属最精确、最完整之一,而志愿者提供的计算资源被认为是Rosetta获得成功的主要因素之一。[21]

2008年初,Rosetta被用来推算设计一种具有在自然界中从未被观察到功能的蛋白质。[22]这个灵感源自2004年一篇引起关注的、被撤稿的论文,那篇论文中描述了一种蛋白质的推算设计,这种蛋白质与天然的蛋白质相比提高了酶活力。[23]2008年,大卫·贝克的研究组发表了论文,描述了这种蛋白质的制造过程。论文指出Rosetta@home为其提供计算资源,作为这种蛋白质设计方法的一项重要的概念论证。[22]这一类型的蛋白质设计将来可能在药物设计绿色化学生物修复等领域得到应用。[22]

疾病相关研究

除了蛋白质结构预测、对接、设计等基础研究,Rosetta@home也被用在疾病相关研究。[24]大卫·贝克的Rosetta@home日志上描述了许多附属的研究项目。[25]

阿兹海默病

Rosetta套装软件当中的一个组件RosettaDesign,被用来精确预测淀粉样蛋白(amyloidogenic protein)的哪个区域最可能形成淀粉样纤维。[26]通过获取蛋白质中的六肽(6个氨基酸长度的片断),选择与一个已知能够形成纤维的六肽相匹配的最低能量结构,RosettaDesign能够识别出形成纤维可能性为随机蛋白质两倍的肽段。[27]在此类研究中,Rosetta@home被用于预测β淀粉样蛋白的结构。[28]β淀粉样蛋白是一种能够形成纤维的蛋白质,被认为会引起阿兹海默病。RosettaDesign一项尚未发表的初步结果设计出了也许可以预防纤维形成的蛋白质,但它能否预防这种疾病尚不得而知。[29]

炭疽病

Rosetta的另一个组件RosettaDock[30][31][32]与实验方法相结合,被用于构造致死因子(lethal factor,LF)、水肿因子(edema factor,EF)和保护性抗原(protective antigen,PA)等三种蛋白质的交互作用模型。这三种蛋白质构成了炭疽病毒素。这个模型精确预测LF与PA之间的对接,帮助确定两种蛋白质分别有哪些结构域参与到LF-PA复合体的构造中。这项成果最终被应用到改良的炭疽病疫苗的研制。引用错误:没有找到与<ref>对应的</ref>标签[33]

单纯疱疹病毒1型

RosettaDock还被用来构造一种抗体免疫球蛋白G)与能够使抗病毒抗体退化的单纯疱疹病毒1型HSV-1)表面蛋白之间的对接模型。RosettaDock预测的蛋白质复合体与极难得到的实验模型近乎一致。研究人员总结说,这种对接方法可望解决X射线结晶学方法构造蛋白质-蛋白质界面模型所遇到的一些问题。[34]

HIV

作为一项获得比尔与美琳达·盖茨基金会1940万美元资助的研究项目的一部分[35],Rosetta@home被用于设计人类免疫缺陷病毒(HIV)疫苗。[36][37]

疟疾

在与“全球重大卫生挑战计划”相关的研究中[38],Rosetta还被用于运算设计新型的归巢核酸内切酶蛋白质。这种蛋白质能够根除冈比亚疟蚊或者使这种疟蚊无法传播疟疾[39]由于能够构建及改变蛋白质-DNA交互作用模型,特别是归巢核酸内切酶蛋白质等,像Rosetta这一类运算蛋白质设计方法成为基因治疗中的一个重要角色。[24][40]

COVID-19

華盛頓大學蛋白質設計研究所(IPD)就目前的進展進行了報告。該消息證實,Rosetta @ home 一直在處理冠狀病毒的臭名昭著的棘突蛋白(spike protein),並透露它已經能夠“準確預測重要的冠狀病毒蛋白的標度結構可以在實驗室中檢測到。IPD還強調了這項研究的一些可能的應用。他們寫道:“掌握了這些知識後,蛋白質設計研究所的研究人員現在正在努力創造新的蛋白質來中和冠狀病毒。如果成功,這些抗病毒蛋白將粘附在SARS-CoV-2穗蛋白上,從而防止病毒顆粒感染健康細胞。” 此外,IPD透露,美國國立衛生研究院和華盛頓大學的研究同事正在使用 Rosetta @ home 的結果來生產候選疫苗-其中一些已經在小鼠身上進行了測試。[41]

发展历史与分支

Rosetta最初是作为ab initio蛋白质结构预测方法,在1998年由贝克实验室开发[42];而到目前,这个项目已经形成多个分支,有各自不同的发展和服务方向。Rosetta平台得名于罗塞塔石碑(被用于破译古埃及文字),因为该平台试图破译蛋白质的氨基酸序列的结构“含义”。[43]Rosetta出现7年之后,Rosetta@home项目于2005年10月6日发布。[44]许多参与到Rosetta起步工作的研究生和研究人员已经搬迁到各个不同的大学和研究机构。这使Rosetta项目的不同分支也得到加强。

RosettaDesign

Rosetta设计的TOP7模型(红色)与其X射线晶体结构(蓝色,PDB ID: 1QYS)的叠合

RosettaDesign是基于Rosetta的一个蛋白质设计工具。它始于2000年对蛋白质G的折叠路径的一项研究。[45]2002年,RosettaDesign被用来设计TOP7。TOP7是一种93个氨基酸长度的α/β型蛋白质,具有在自然界中尚未被发现的整体折叠结构。这一全新的结构由Rosetta预测,与X射线晶体学确定的结构的之间的RMSD在1.2范围内,是一个精度极高的结构预测。[46]Rosetta和RosettaDesign最早设计和精确预测出这一长度的新型蛋白质,受到广泛的认可。他们2003年在《科学》杂志上发表的相关论文已被270多篇论文引用。[47]这项研究的显著成果TOP7被选为蛋白质数据库2005年10月的“月度分子”(Molecule of the Month)。[48]这项预测与其X射线晶体学结构的叠合被包含在Rosetta@home的logo设计中。[16]曾在贝克实验室当博士后、现任北卡罗来纳大学教堂山分校助理教授的布赖恩·库尔曼[49]提供了RosettaDesign的在线服务。[50]

RosettaDock

RosettaDock在2002年CAPRI实验时作为贝克实验室的蛋白质-蛋白质对接预测算法被添加到Rosetta软件套装中。[51]在那次实验中,RosettaDock对化脓性链球菌毒素A和T细胞受体β链的对接做出了高精度预测,对一种猪的α淀粉酶与相应骆驼抗体的复合体做出了中等精度预测。尽管RosettaDock方法只在七种可能中给出两种可接受精度的预测,这已经足以让它在那届CAPRI实验中名列19个预测方法中的第7位。[51]

RosettaDock的基础工作主要是由杰弗里·格雷在华盛顿大学期间完成的。后来他搬到约翰·霍普金斯大学接受另一个工作职位。因此,RosettaDock在这之后的开发出现了两个分支。这两个分支在侧链建模、诱捕选择等方面存在细微差异。[32][52]尽管存在这些差异,贝克和格雷的方法均在第二次CAPRI实验中表现出色,在30个小组中分列第5位和第7位。[53]

2006年10月,RosettaDock被整合到Rosetta@home中。这一方法首先仅用蛋白质骨架进行快速、粗略的对接建模,然后进行缓慢的全原子优化。在后一阶段中,两个互相作用的蛋白质之间的相对位置以及蛋白质-蛋白质界面的侧链交互作用同时被优化,从而得到最低能量构造。[54]Rosetta@home网络提供的巨大的运算能力,以及骨架灵活性和连接环建模经修订的折叠树表述,使RosettaDock在第三次CAPRI实验中名列63个预测组中的第6位。[4][21]

Robetta

Robetta是一个自动化的蛋白质结构预测服务,由贝克实验室提供,用于非商业性质的ab initio和比较建模。[55]它自2002年起参加CASP实验,在当届CASP5的自动化服务器预测类别中名列前茅。[56]此后,Robetta又参加了CASP6和CASP7,成绩比自动化服务器和人工预测组的平均水平都高。[19][57][58]

到CASP6时为止,Robetta构建蛋白质结构模型时采用的方法是,首先用BLAST、PSI-BLAST和3D-Jury搜索结构同源体,然后通过序列与Pfam数据库中的结构族的匹配,将目标序列解析为单独的结构域或者独立的折叠单元。下一步,具有结构同源体的结构域则要遵循一个基于模板的模型(即同源建模)协议。在此处,贝克实验室内部的一个程序K*sync会生成一组序列同源体,其中的每一项由Rosetta的de novo方法建模,产生诱捕(可能的结构)。然后,由低分辨率Rosetta能量函数确定的最低能量模型被选为最终的结构预测方案。对于未检测到结构同源体的结构域,将根据de novo协议,选定生成的诱捕中具有最低能量的模型作为最终的结构预测方案。这些结构域预测方案将被连接在一起,用来研究蛋白质内跨结构域、三级结构级别的交互作用。最后,根据一个蒙特·卡罗构造搜索协议来构建侧链贡献。[59]

在CASP8中,由于Rosetta高分辨率全原子优化方法的引入,Robetta的性能得到提高。[60]而缺少这一方法被认为是Robetta在CASP7中精度低于Rosetta@home的主要原因。[20]

Foldit

2008年5月9日,贝克实验室接受Rosetta@home用户关于交互式版本的建议,发布了电子游戏Foldit。这是一个基于Rosetta平台的在线蛋白质结构预测游戏。[61]截至2009年1月9日,Foldit的注册用户已经接近7.9万名。[62]这个游戏赋予使用者一系列的控制功能(如“摇动”、“摆动”、“重建”等),来操纵目标蛋白质的骨架和氨基酸侧链,以获得最佳能量构造。用户能够以单独或者集体的形式来进行游戏,通过改进结构预测方案来获得积分。[63]用户还可以通过“决斗”功能来与其他用户进行竞赛,在20个动作内得到最低能量结构的用户获胜。

Foldit 新增了全新關卡,為了阻止冠狀病毒感染人體細胞,正在尋找阻斷兩者的蛋白質結構。雖然對一般玩家來說要徹底理解可能稍嫌複雜,但遊戲的開發是為了「讓任何人都能參與」,Foldit 會提供一系列教學關卡,透過輔助工具解謎並獲得分數,研究人員會參考有潛力的方案並進行實驗。[64]

RoseTTAFold

RoseTTAFold受到AlphaFold的啟發,使用神經網路來預測殘基之間的距離和方向。這些預測指導Rosetta軟體生成結構。 RoseTTAFold是在MIT許可證下開源的。[65]

非貝克實驗室分支機構

中國的 Janyi Yang 實驗室提供了Rosetta的修改版本,稱為 tr-RosettaX2(變換約束 Rosetta)。[66]它使用與RoseTTAFold不同的基於深度學習的接觸預測方法來指導通常的Rosetta折疊演算法。 trRosetta 早於 RoseTTAFold。[67]

与类似的分布式计算项目的比较

目前有多个分布式计算项目与Rosetta@home具有类似的研究方向,但研究方法上存在差异。

Folding@home

斯坦福大学开发的Folding@home是与蛋白质研究相关的主要分布式计算项目中唯一不使用BOINC平台的。[68]Rosetta@home与Folding@home都研究蛋白质错误折叠疾病(如阿兹海默病),但Rosetta@home还进行其他研究,而Folding@home则主要集中于这类研究。[69]Folding@home并不采用基于结构或者基于设计的方法来预测淀粉体行为,而是采用分子动力学方法来构建蛋白质折叠活动(以及可能的错误折叠和聚合)的模型。[70]换言之,Folding@home的优势在于模拟蛋白质折叠活动,而Rosetta@home的优势则在于蛋白质运算设计以及蛋白质结构对接的预测。这两个项目在计算资源和主机分布上也存在显著差异。Rosetta@home的主机群体基于PC,平均执行速度为78万亿FLOPS[2];而Folding@home的主机群体包括了PlayStation 3图形处理器,平均执行速度达4769万亿FLOPS,大约是Rosetta@home的61倍[71]

世界公共网格

世界公共网格的子项目人类蛋白质组折叠项目英语Human Proteome Folding Project(HPF)1期和2期均使用Rosetta程序来为不同的基因组添加结构和功能注解。[72][73]人类蛋白质组折叠项目的首席科学家里夏尔·博诺在华盛顿大学贝克实验室攻读博士学位期间积极参与了Rosetta的早期开发,但他现在主要使用Rosetta来为生物学家创建数据库。[74]他的个人网站上设置了关于HPF1、HPF2的信息布告板。[75]

Predictor@home

与Rosetta@home相似,蛋白质结构预测也是Predictor@home的研究重点。Predictor@home还计划在其分布式计算平台上开发蛋白质设计与对接的新研究领域(采用分子动力学的CHARMM软件包)。[76]这将使它与Rosetta@home更加相似。进行结构预测时,Rosetta@home使用的是Rosetta程序,而Predictor@home则使用dTASSER方法。[77]

其他

BOINC平台上其他的蛋白质相关分布式计算项目包括QMC@HomeDocking@HomePOEM@homeSIMAPTANPAKU。RALPH@home是Rosetta@home的alpha版本,用来进行新应用程序、工作单元以及更新被添加到Rosetta@home之前的测试工作。RALPH@home也在BOINC平台上运行。[78]

志愿者的贡献

Rosetta@home在CASP8实验期间的用户贡献柱状统计图

Rosetta@home的研究依赖于大量志愿者提供的计算资源。截至2014年4月18日,Rosetta@home的活跃用户超过2.69万人,分布在150个国家,总共提供了66000台计算机的空闲资源,使Rosetta@home的平均执行速度达到83万亿FLOPS[2]

用户的贡献通过BOINC积分来度量。一个用户从某一工作单元得到的积分是他在这个工作单元上产生的“诱饵”数量与所有用户在该工作单元获得的积分均值的乘积。[79]Rosetta@home对CPU每秒工作所给的积分低于绝大多数其他BOINC项目。[80]尽管如此,Rosetta@home仍在所有BOINC项目中名列总积分值第9位。[81]

预测的蛋白质结构被提交到CASP实验的用户,也在相关的学术出版物中被致谢。[82]而预测出指定工作单元最低能量结构的用户及其所在队伍则会在Rosetta@home的主页上被列为“当日预测者”(Predictor of the Day)。[83]每天还有一名随机选出的用户会被列在主页上,成为“当日用户”(User of the Day)。[84]

参考文献

  1. ^ UW TechTransfer Home : Digital Ventures : UW Technology : Express Licenses : Rosetta. UW TechTransfer. [2009年1月8日]. (原始内容存档于2012年2月16日) (英语). 
  2. ^ 2.0 2.1 2.2 Rosetta@home - Credit overview. boincstats.com. [2015年2月12日]. (原始内容存档于2011年10月7日) (英语). 
  3. ^ Rosetta@home是什么?. 华盛顿大学. [2009年1月8日]. (原始内容存档于2008年9月13日) (中文). 
  4. ^ 4.0 4.1 Lensink, Marc F.; Méndez, Raúl; Wodak, Shoshana J. Docking and scoring protein complexes: CAPRI 3rd Edition. Proteins: Structure, Function, and Bioinformatics. 2007-10-05, 69 (4): 704–718 [2022-05-01]. PMID 17918726. doi:10.1002/prot.21804. (原始内容存档于2022-05-01) (英语). 
  5. ^ Download BOINC client software. BOINC. 加利福尼亚大学伯克利分校. 2008年12月16日 [2009年1月8日]. (原始内容存档于2008年12月7日) (英语). 
  6. ^ Recommended System Requirements. Rosetta@home. 华盛顿大学. 2008年12月10日 [2009年1月8日]. (原始内容存档于2008年9月25日) (英语). 
  7. ^ 引用错误:没有为名为apps的参考文献提供内容
  8. ^ Rosetta@Home FAQ (work in progress) (message 10910). Rosetta@home forums. 华盛顿大学. 2006年2月18日 [2009年1月8日]. (原始内容存档于2009年2月26日) (英语). 
  9. ^ David E K. Random Seed (message 3155). Rosetta@home forums. 华盛顿大学. 2005年11月14日 [2009年1月8日]. (原始内容存档于2009年2月26日) (英语). 
  10. ^ Rosetta及其图像的快速向导. Rosetta@home. 华盛顿大学. 2007年11月10日 [2009年1月8日]. (原始内容存档于2008年9月24日) (中文). 
  11. ^ David E K. Problems with minirosetta version 1.+ (Message 51199). Rosetta@home forums. 华盛顿大学. 2008年2月6日 [2009年1月8日]. (原始内容存档于2009年2月26日) (英语). 
  12. ^ 12.0 12.1 Rosetta Commons. RosettaCommons.org. [2009年1月8日]. (原始内容存档于2008年9月15日) (英语). 
  13. ^ (英文)Bourne PE, Helge W (编). Structural Bioinformatics. Hoboken, NJ: Wiley-Liss. 2003. ISBN 978-0471201991. OCLC 50199108. 
  14. ^ Yearly Growth of Protein Structures. RCSB Protein Data Bank. 2009年1月6日 [2009年1月8日]. (原始内容存档于2008年9月28日) (英语). 
  15. ^ David Baker. David Baker's Rosetta@home journal (message 55893). 华盛顿大学. 2008年9月20日 [2009年1月8日]. (原始内容存档于2008年6月23日) (英语). 
  16. ^ 16.0 16.1 研究概况. Rosetta@home. 华盛顿大学. 2007年11月10日 [2009年1月9日]. (原始内容存档于2008年9月25日) (中文). 
  17. ^ Kopp, Jürgen; Bordoli, Lorenza; Battey, James N.D.; Kiefer, Florian; Schwede, Torsten. Assessment of CASP7 predictions for template-based modeling targets. Proteins: Structure, Function, and Bioinformatics. 2007, 69 (S8): 38–56 [2022-05-01]. PMID 17894352. doi:10.1002/prot.21753. (原始内容存档于2022-05-01) (英语). 
  18. ^ Read, Randy J.; Chavali, Gayatri. Assessment of CASP7 predictions in the high accuracy template-based modeling category. Proteins: Structure, Function, and Bioinformatics. 2007, 69 (S8): 27–37 [2022-05-01]. PMID 17894351. doi:10.1002/prot.21662. (原始内容存档于2022-05-01) (英语). 
  19. ^ 19.0 19.1 Jauch, Ralf; Yeo, Hock Chuan; Kolatkar, Prasanna R.; Clarke, Neil D. Assessment of CASP7 structure predictions for template free targets. Proteins: Structure, Function, and Bioinformatics. 2007, 69 (S8): 57–67 [2022-05-01]. PMID 17894330. doi:10.1002/prot.21771. (原始内容存档于2022-05-01) (英语). 
  20. ^ 20.0 20.1 Das, Rhiju; Qian, Bin; Raman, Srivatsan; Vernon, Robert; Thompson, James; Bradley, Philip; Khare, Sagar; Tyka, Michael D.; Bhat, Divya. Structure prediction for CASP7 targets using extensive all-atom refinement with Rosetta@home. Proteins: Structure, Function, and Bioinformatics. 2007, 69 (S8): 118–128 [2022-05-01]. PMID 17894356. doi:10.1002/prot.21636. (原始内容存档于2022-05-01) (英语). 
  21. ^ 21.0 21.1 Wang, Chu; Schueler-Furman, Ora; Andre, Ingemar; London, Nir; Fleishman, Sarel J.; Bradley, Philip; Qian, Bin; Baker, David. RosettaDock in CAPRI rounds 6-12. Proteins: Structure, Function, and Bioinformatics. 2007-08-01, 69 (4): 758–763 [2022-05-01]. PMID 17671979. doi:10.1002/prot.21684. (原始内容存档于2022-05-01) (英语). 
  22. ^ 22.0 22.1 22.2 Jiang, Lin; Althoff, Eric A.; Clemente, Fernando R.; Doyle, Lindsey; Röthlisberger, Daniela; Zanghellini, Alexandre; Gallaher, Jasmine L.; Betker, Jamie L.; Tanaka, Fujie. De Novo Computational Design of Retro-Aldol Enzymes. Science. 2008-03-07, 319 (5868): 1387–1391 [2022-05-01]. ISSN 0036-8075. PMC 3431203可免费查阅. PMID 18323453. doi:10.1126/science.1152692. (原始内容存档于2022-02-25) (英语). 
  23. ^ Check Hayden, Erika. Protein prize up for grabs after retraction. Nature. 2008-02-13: news.2008.569 [2022-05-01]. ISSN 0028-0836. doi:10.1038/news.2008.569. (原始内容存档于2021-08-06) (英语). 
  24. ^ 24.0 24.1 相关疾病研究. Rosetta@home. 华盛顿大学. 2007年11月10日 [2009年1月9日]. (原始内容存档于2008年9月23日) (中文). 
  25. ^ David Baker. David Baker's Rosetta@home journal. 华盛顿大学. [2009年1月9日]. (原始内容存档于2008年9月25日) (英语). 
  26. ^ Kuhlman, Brian; Baker, David. Native protein sequences are close to optimal for their structures. Proceedings of the National Academy of Sciences. 2000-09-12, 97 (19): 10383–10388 [2022-05-01]. ISSN 0027-8424. PMC 27033可免费查阅. PMID 10984534. doi:10.1073/pnas.97.19.10383. (原始内容存档于2022-05-01) (英语). 
  27. ^ Thompson, Michael J.; Sievers, Stuart A.; Karanicolas, John; Ivanova, Magdalena I.; Baker, David; Eisenberg, David. The 3D profile method for identifying fibril-forming segments of proteins. Proceedings of the National Academy of Sciences. 2006-03-14, 103 (11): 4074–4078 [2022-05-01]. ISSN 0027-8424. PMC 1449648可免费查阅. PMID 16537487. doi:10.1073/pnas.0511295103. (原始内容存档于2022-05-01) (英语). 
  28. ^ amyloid fibril structure prediction. Rosetta@home forums. 华盛顿大学. [2009年1月9日]. (原始内容存档于2009年2月26日) (英语). 
  29. ^ David Baker. Publications on R@H's Alzheimer's work? (message 54681). Rosetta@home forums. 华盛顿大学. [2009年1月9日]. (原始内容存档于2009年2月26日) (英语). 
  30. ^ Wang, Chu; Schueler-Furman, Ora; Baker, David. Improved side-chain modeling for protein-protein docking. Protein Science. 2005-05, 14 (5): 1328–1339. PMC 2253276可免费查阅. PMID 15802647. doi:10.1110/ps.041222905 (英语). 
  31. ^ Gray, Jeffrey J.; Moughon, Stewart; Wang, Chu; Schueler-Furman, Ora; Kuhlman, Brian; Rohl, Carol A.; Baker, David. Protein–Protein Docking with Simultaneous Optimization of Rigid-body Displacement and Side-chain Conformations. Journal of Molecular Biology. 2003-08, 331 (1): 281–299 [2022-05-01]. PMID 12875852. doi:10.1016/S0022-2836(03)00670-3. (原始内容存档于2022-03-27) (英语). 
  32. ^ 32.0 32.1 Schueler-Furman, Ora; Wang, Chu; Baker, David. Progress in protein-protein docking: Atomic resolution predictions in the CAPRI experiment using RosettaDock with an improved treatment of side-chain flexibility. Proteins: Structure, Function, and Bioinformatics. 2005-06-24, 60 (2): 187–194 [2022-05-01]. PMID 15981249. doi:10.1002/prot.20556. (原始内容存档于2022-05-01) (英语). 
  33. ^ Albrecht, Mark T.; Li, Han; Williamson, E. Diane; LeButt, Chris S.; Flick-Smith, Helen C.; Quinn, Conrad P.; Westra, Hans; Galloway, Darrell; Mateczun, Alfred. Human Monoclonal Antibodies against Anthrax Lethal Factor and Protective Antigen Act Independently To Protect against Bacillus anthracis Infection and Enhance Endogenous Immunity to Anthrax. Infection and Immunity. 2007-11, 75 (11): 5425–5433 [2022-05-01]. ISSN 0019-9567. PMC 2168292可免费查阅. PMID 17646360. doi:10.1128/IAI.00261-07. (原始内容存档于2021-08-07) (英语). 
  34. ^ Sprague, Elizabeth R; Wang, Chu; Baker, David; Bjorkman, Pamela J. Virgin, Skip , 编. Crystal Structure of the HSV-1 Fc Receptor Bound to Fc Reveals a Mechanism for Antibody Bipolar Bridging. PLoS Biology. 2006-05-02, 4 (6): e148. ISSN 1545-7885. PMC 1450327可免费查阅. PMID 16646632. doi:10.1371/journal.pbio.0040148 (英语). 
  35. ^ Paulson, Tom. Gates Foundation awards $287 million for HIV vaccine research. Seattle Post-Intelligencer. 2006年7月19日 [2009年1月9日]. (原始内容存档于2022年9月5日) (英语). 
  36. ^ Liu Y; et al. Development of IgG1 b12 scaffolds and HIV-1 env-based outer domain immunogens capable of eliciting and detecting IgG1 b12-like antibodies (PDF). Global HIV Vaccine Enterprise. 2007 [2008年9月28日]. (原始内容 (PDF)存档于2009年2月25日) (英语). 
  37. ^ David Baker. Dr. Baker's journal archive (read only) (message 40756). 华盛顿大学. [2009年1月9日]. (原始内容存档于2009年2月26日) (英语). 
  38. ^ Dr. Austin Burt. Homing Endonuclease Genes: New Tools for Mosquito Population Engineering and Control. Grand Challenges in Global Health. [2009年1月9日]. (原始内容存档于2008年7月6日) (英语). 
  39. ^ Windbichler, N.; Papathanos, P. A.; Catteruccia, F.; Ranson, H.; Burt, A.; Crisanti, A. Homing endonuclease mediated gene targeting in Anopheles gambiae cells and embryos. Nucleic Acids Research. 2007-08-23, 35 (17): 5922–5933 [2022-05-01]. ISSN 0305-1048. PMC 2034484可免费查阅. PMID 17726053. doi:10.1093/nar/gkm632. (原始内容存档于2017-07-28) (英语). 
  40. ^ Ashworth, Justin; Havranek, James J.; Duarte, Carlos M.; Sussman, Django; Monnat, Raymond J.; Stoddard, Barry L.; Baker, David. Computational redesign of endonuclease DNA binding and cleavage specificity. Nature. 2006-06, 441 (7093): 656–659 [2022-05-01]. ISSN 0028-0836. PMC 2999987可免费查阅. PMID 16738662. doi:10.1038/nature04818. (原始内容存档于2022-05-01) (英语). 
  41. ^ Rosetta@home Rallies a Legion of Computers Against the Coronavirus. HPCwire. 2020-03-24 [2022-05-01]. (原始内容存档于2020-04-09) (美国英语). 
  42. ^ Simons, K. T.; Bonneau, R.; Ruczinski, I.; Baker, D. Ab initio protein structure prediction of CASP III targets using ROSETTA. Proteins. 1999,. Suppl 3: 171–176 [2022-05-01]. ISSN 0887-3585. PMID 10526365. doi:10.1002/(sici)1097-0134(1999)37:3+<171::aid-prot21>3.3.co;2-q. (原始内容存档于2022-05-01). 
  43. ^ Interview with David Baker. Team Picard Distributed Computing. 2006年4月28日 [2009年1月9日]. (原始内容存档于2009年2月18日) (英语). 
  44. ^ News archive. Rosetta@home. 华盛顿大学. [2009年1月9日]. (原始内容存档于2016年6月16日) (英语). 
  45. ^ Nauli, Sehat; Kuhlman, Brian; Baker, David. Computer-based redesign of a protein folding pathway. Nature Structural Biology. 2001-07-01, 8 (7): 602–605 [2022-05-01]. PMID 11427890. doi:10.1038/89638. (原始内容存档于2016-06-03). 
  46. ^ Kuhlman, Brian; Dantas, Gautam; Ireton, Gregory C.; Varani, Gabriele; Stoddard, Barry L.; Baker, David. Design of a Novel Globular Protein Fold with Atomic-Level Accuracy. Science. 2003-11-21, 302 (5649): 1364–1368 [2022-05-01]. ISSN 0036-8075. PMID 14631033. doi:10.1126/science.1089427. (原始内容存档于2022-05-01) (英语). 
  47. ^ Articles citing: Kuhlman et al (2003) 'Design of a novel globular protein fold with atomic-level accuracy'. ISI Web of Science. [2009年1月8日] (英语). [失效連結]
  48. ^ David S. Goodsell. Designer Proteins - October 2005 Molecule of the Month. RCSB Protein Data Bank. 2005年10月 [2009年1月9日]. (原始内容存档于2008年9月28日) (英语). 
  49. ^ Kuhlman Lab. 北卡罗来纳大学教堂山分校. [2009年1月8日]. (原始内容存档于2008年10月10日) (英语). 
  50. ^ RosettaDesign web server. 北卡罗来纳大学教堂山分校. [2009年1月8日]. (原始内容存档于2008年9月13日) (英语). 
  51. ^ 51.0 51.1 Gray, Jeffrey J.; Moughon, Stewart E.; Kortemme, Tanja; Schueler-Furman, Ora; Misura, Kira M.S.; Morozov, Alexandre V.; Baker, David. Protein-protein docking predictions for the CAPRI experiment. Proteins: Structure, Function, and Genetics. 2003-07-01, 52 (1): 118–122 [2022-05-01]. ISSN 0887-3585. PMID 12784377. doi:10.1002/prot.10384. (原始内容存档于2022-05-01) (英语). 
  52. ^ Daily, Michael D.; Masica, David; Sivasubramanian, Arvind; Somarouthu, Sony; Gray, Jeffrey J. CAPRI rounds 3-5 reveal promising successes and future challenges for RosettaDock. Proteins: Structure, Function, and Bioinformatics. 2005-06-24, 60 (2): 181–186 [2022-05-01]. PMID 15981262. doi:10.1002/prot.20555. (原始内容存档于2022-05-01) (英语). 
  53. ^ Méndez, Raúl; Leplae, Raphaël; Lensink, Marc F.; Wodak, Shoshana J. Assessment of CAPRI predictions in rounds 3-5 shows progress in docking procedures. Proteins: Structure, Function, and Bioinformatics. 2005-06-24, 60 (2): 150–169 [2022-05-01]. PMID 15981261. doi:10.1002/prot.20551. (原始内容存档于2022-05-01) (英语). 
  54. ^ Chu Wang. protein-protein docking at Rosetta@Home. 华盛顿大学. [2008年9月7日]. (原始内容存档于2008年6月23日) (英语). 
  55. ^ Robetta: full-chain protein structure prediction server. 华盛顿大学. [2009年1月9日]. (原始内容存档于2008年9月25日) (英语). 
  56. ^ Aloy, Patrick; Stark, Alexander; Hadley, Caroline; Russell, Robert B. Predictions without templates: New folds, secondary structure, and contacts in CASP5. Proteins: Structure, Function, and Genetics. 2003, 53 (S6): 436–456 [2022-05-01]. ISSN 0887-3585. PMID 14579333. doi:10.1002/prot.10546. (原始内容存档于2022-05-01) (英语). 
  57. ^ Tress, Michael; Ezkurdia, Iakes; Graña, Osvaldo; López, Gonzalo; Valencia, Alfonso. Assessment of predictions submitted for the CASP6 comparative modeling category. Proteins: Structure, Function, and Bioinformatics. 2005, 61 (S7): 27–45 [2022-05-01]. ISSN 0887-3585. PMID 16187345. doi:10.1002/prot.20720. (原始内容存档于2022-05-01) (英语). 
  58. ^ Battey, James N. D.; Kopp, Jürgen; Bordoli, Lorenza; Read, Randy J.; Clarke, Neil D.; Schwede, Torsten. Automated server predictions in CASP7. Proteins: Structure, Function, and Bioinformatics. 2007, 69 (S8): 68–82 [2022-05-01]. PMID 17894354. doi:10.1002/prot.21761. (原始内容存档于2022-05-01) (英语). 
  59. ^ Chivian, Dylan; Kim, David E.; Malmström, Lars; Schonbrun, Jack; Rohl, Carol A.; Baker, David. Prediction of CASP6 structures using automated robetta protocols. Proteins: Structure, Function, and Bioinformatics. 2005, 61 (S7): 157–166 [2022-05-01]. ISSN 0887-3585. PMID 16187358. doi:10.1002/prot.20733. (原始内容存档于2022-05-01) (英语). 
  60. ^ David Baker. David Baker's Rosetta@home journal (message 52902). 华盛顿大学. 2008年5月7日 [2009年1月9日]. (原始内容存档于2008年6月23日) (英语). 
  61. ^ David Baker. David Baker's Rosetta@home journal (message 52963). 华盛顿大学. 2008年5月10日 [2009年1月9日]. (原始内容存档于2008年6月23日) (英语). 
  62. ^ Players. Foldit. [2009年1月9日]. (原始内容存档于2015年2月14日) (英语). 
  63. ^ Frequently Asked Questions. Foldit. [2009年1月9日]. (原始内容存档于2008年9月14日) (英语). 
  64. ^ Zoey. 玩遊戲可以破解病毒?蛋白質摺疊遊戲 Foldit 新增 COVID-19 謎題,全球玩家都能提供幫助!. LINE. 2020-03-20 [2020-04-11]. (原始内容存档于2020-04-11) (中文(臺灣)). 來自華盛頓大學的蛋白質摺疊遊戲 Foldit 由電腦科學和工程學系與生物化學學系共同開發,2008 年推出初始版本,透過遊戲的方式讓任何人都可以參與蛋白質結構預測,利用人腦的 3D 圖像視覺能力、非專業領域玩家的直覺思考模式,改善現有蛋白質摺疊軟體的演算法,甚至提供具有可能性的方案,實現分散式計算與學術眾包。 
  65. ^ Baek, Minkyung; DiMaio, Frank; Anishchenko, Ivan; Dauparas, Justas; Ovchinnikov, Sergey; Lee, Gyu Rie; Wang, Jue; Cong, Qian; Kinch, Lisa N.; Schaeffer, R. Dustin; Millán, Claudia; Park, Hahnbeom; Adams, Carson; Glassman, Caleb R.; DeGiovanni, Andy; Pereira, Jose H.; Rodrigues, Andria V.; van Dijk, Alberdina A.; Ebrecht, Ana C.; Opperman, Diederik J.; Sagmeister, Theo; Buhlheller, Christoph; Pavkov-Keller, Tea; Rathinaswamy, Manoj K.; Dalwadi, Udit; Yip, Calvin K.; Burke, John E.; Garcia, K. Christopher; Grishin, Nick V.; Adams, Paul D.; Read, Randy J.; Baker, David. Accurate prediction of protein structures and interactions using a three-track neural network. Science. 20 August 2021, 373 (6557): 871–876. Bibcode:2021Sci...373..871B. PMC 7612213可免费查阅. PMID 34282049. doi:10.1126/science.abj8754. 
  66. ^ Peng, Z; Wang, W; Han, R; Zhang, F; Yang, J. Protein structure prediction in the deep learning era.. Current Opinion in Structural Biology. December 2022, 77: 102495. PMID 36371845. S2CID 253470306. doi:10.1016/j.sbi.2022.102495. 
  67. ^ Du, Zongyang; Su, Hong; Wang, Wenkai; Ye, Lisha; Wei, Hong; Peng, Zhenling; Anishchenko, Ivan; Baker, David; Yang, Jianyi. The trRosetta server for fast and accurate protein structure prediction. Nature Protocols. December 2021, 16 (12): 5634–5651. PMID 34759384. S2CID 243987300. doi:10.1038/s41596-021-00628-9可免费查阅. 
  68. ^ Project list - BOINC. 加利福尼亚大学伯克利分校. [2009年1月8日]. (原始内容存档于2008年9月8日) (英语). 
  69. ^ Folding@home Diseases Studied FAQ. 斯坦福大学. 2007年11月3日 [2009年1月9日]. (原始内容存档于2012年9月21日) (英语). 
  70. ^ About Folding@home. 斯坦福大学. 2008年9月17日 [2009年1月9日]. (原始内容存档于2012年9月21日) (英语). 
  71. ^ Client statistics by OS. 斯坦福大学. [2009年2月8日]. (原始内容存档于2012年9月21日) (英语). 
  72. ^ Malmström, Lars; Riffle, Michael; Strauss, Charlie E. M; Chivian, Dylan; Davis, Trisha N; Bonneau, Richard; Baker, David. Sali, Andrej , 编. Superfamily Assignments for the Yeast Proteome through Integration of Structure Prediction with the Gene Ontology. PLoS Biology. 2007-03-20, 5 (4): e76. ISSN 1545-7885. PMC 1828141可免费查阅. PMID 17373854. doi:10.1371/journal.pbio.0050076 (英语). 
  73. ^ Bonneau R. World Community Grid Message Board Posts: HPF -> HPF2 transition. 纽约大学博诺实验室. 2006年5月26日 [2009年1月9日]. (原始内容存档于2008年8月29日) (英语). 
  74. ^ List of Richard Bonneau's publications. 纽约大学博诺实验室. [2009年1月8日]. (原始内容存档于2008年7月7日) (英语). 
  75. ^ Bonneau R. World Community Grid Message Board Posts. 纽约大学博诺实验室. [2009年1月8日]. (原始内容存档于2008年7月4日) (英语). 
  76. ^ Developing new application areas for P@H. The Brooks Research Group. [2009年1月9日] (英语). [失效連結]
  77. ^ Carrillo-Tripp M. dTASSER. The Scripps Research Institute. 2007年2月 [2009年1月9日]. (原始内容存档于2007年7月6日) (英语). 
  78. ^ RALPH@home. 华盛顿大学. [2009年1月9日]. (原始内容存档于2016年1月13日) (英语). 
  79. ^ The new credit system explained. 华盛顿大学. 2006年8月24日 [2009年1月9日]. (原始内容存档于2009年2月2日) (英语). 
  80. ^ Project credit comparison. boincstats.com. [2009年1月9日]. (原始内容存档于2008年9月13日) (英语). 
  81. ^ Credit divided over projects. boincstats.com. [2010年11月23日]. (原始内容存档于2009年3月26日) (英语). 
  82. ^ Das, Rhiju; Qian, Bin; Raman, Srivatsan; Vernon, Robert; Thompson, James; Bradley, Philip; Khare, Sagar; Tyka, Michael D.; Bhat, Divya. Structure prediction for CASP7 targets using extensive all-atom refinement with Rosetta@home. Proteins: Structure, Function, and Bioinformatics. 2007, 69 (S8): 118–128 [2022-05-01]. doi:10.1002/prot.21636. (原始内容存档于2022-05-01) (英语). 
  83. ^ Predictor of the day archive. Rosetta@home. 华盛顿大学. [2009年1月9日]. (原始内容存档于2008年9月24日) (英语). 
  84. ^ Rosetta@home. 华盛顿大学. [2009年1月9日]. (原始内容存档于2016年1月3日) (中文). 

外部链接