來自Stowers醫(yī)學(xué)研究所的研究人員創(chuàng)造了一種以快速,有效和信息豐富的方式定義個(gè)體蛋白質(zhì)關(guān)聯(lián)的新方法。這些發(fā)現(xiàn)發(fā)表在2019年3月8日的Nature Communications期刊上,展示了由Stowers研究人員創(chuàng)建的拓?fù)湓u分(TopS)算法如何通過組合數(shù)據(jù)集來識別聚集在一起的蛋白質(zhì)。
該方法類似于查看社區(qū)中所有個(gè)人的活動(dòng)和交互,然后選擇最有意義的交互,其中一些可能非常罕見。研究人員正在尋找兩個(gè)人的生物學(xué)等價(jià)物,這兩個(gè)人可能是整個(gè)社區(qū)中參與重要互動(dòng)的唯一兩個(gè)人。
這不僅有助于研究人員識別蛋白質(zhì)如何執(zhí)行生物功能或執(zhí)行生物過程,該算法還可以應(yīng)用于先前生成的生物數(shù)據(jù)以及潛在的其他科學(xué)領(lǐng)域,以收集新信息。
“這是一種大數(shù)據(jù)分析形式,我們正在應(yīng)用于蛋白質(zhì)組學(xué)數(shù)據(jù)來識別和理解蛋白質(zhì)相互作用網(wǎng)絡(luò),”Stowers蛋白質(zhì)組學(xué)中心主任Michael Washburn博士說。“這是對已經(jīng)使用的許多技術(shù)的補(bǔ)充,因此它可以用來提問和回答新問題。”
蛋白質(zhì)數(shù)據(jù)集可能難以檢查有意義的信息,因?yàn)樗鼈兎浅4蟆?ldquo;你需要看到數(shù)以千計(jì)的蛋白質(zhì),”Stowers的高級研究專家Mihaela Sardiu博士說。了解各種各樣的蛋白質(zhì)如何結(jié)合起來做某些事情,比如修復(fù)DNA,是一個(gè)難題。“我們想簡化這個(gè)問題。”
這意味著他們不是全面了解一切,而是尋求不太常見的事件。研究人員通過尋找誘餌(已知參與感興趣的過程的蛋白質(zhì))和獵物(可與誘餌蛋白相互作用的蛋白質(zhì))來研究它們在人類DNA修復(fù)和酵母染色質(zhì)重塑復(fù)合物中的相互作用。通過TopS,數(shù)據(jù)以并行方式進(jìn)行分析,這意味著同時(shí)考慮來自幾個(gè)生物相關(guān)誘餌的數(shù)據(jù)。TopS的一個(gè)關(guān)鍵屬性是能夠評估獵物蛋白質(zhì)對誘餌相對于其他誘餌的偏好。Sardiu解釋說:“我們現(xiàn)在不是僅通過集中一個(gè)誘餌的信息來計(jì)算得分,而是整合整個(gè)數(shù)據(jù)集中的信息。”
Washburn和Sardiu認(rèn)為,無論是基礎(chǔ)研究還是其他研究,TopS都可以應(yīng)用于蛋白質(zhì)組學(xué)以外的各種數(shù)據(jù)集。Sardiu看到了將其用于醫(yī)療保健數(shù)據(jù)的潛力,醫(yī)生可能能夠?qū)⒒颊叩慕】禒顩r與其他人進(jìn)行比較,例如能夠判斷患者的病情是否“與其他患者相比是否真正先進(jìn)”,她說。
該團(tuán)隊(duì)還在計(jì)算機(jī)代碼庫Github上發(fā)布了這些發(fā)現(xiàn),因?yàn)樗麄兿M麨槠渌芯咳藛T提供測試算法的機(jī)會,并了解他們?nèi)绾螌⑵鋺?yīng)用于自己的項(xiàng)目。
“我們很高興看到這可以走多遠(yuǎn)。這是一個(gè)潛在的高影響力工具,我們希望看到其他創(chuàng)造性和創(chuàng)新人才能想出來,”Washburn說。“我們認(rèn)為這對于很多人來說是一個(gè)非常有價(jià)值的潛在工具,他們正在努力應(yīng)對大規(guī)模數(shù)據(jù)分類的挑戰(zhàn)。”
來自Stowers Institute的其他貢獻(xiàn)者包括Joshua M. Gilmore,博士,Brad D. Groppe,Arnob Dutta博士和Laurence Florens博士。Dutta目前是羅德島大學(xué)的助理教授,Groppe目前在Thermo Fisher Scientific工作,Gilmore是Boehringer Ingelheim的科學(xué)家。
該研究由Stowers研究所資助,并由國立衛(wèi)生研究院國家綜合醫(yī)學(xué)研究所資助,獎(jiǎng)學(xué)金編號為R01GM112639。內(nèi)容完全由作者負(fù)責(zé),并不一定代表美國國立衛(wèi)生研究院的官方觀點(diǎn)。