近期,,我校信息工程學(xué)院李重教授(通訊作者)課題組,,在生物信息領(lǐng)域國際重要期刊《Bioinformatics》(JCR一區(qū)期刊,IF:6.931)上,,以我校為第一單位發(fā)表題為“AFTGAN: prediction of multi-type PPI based on attention free transformer and graph attention network”的最新研究成果,。
蛋白質(zhì)相互作用(PPI)的研究對(duì)于生物醫(yī)學(xué)發(fā)展至關(guān)重要,對(duì)PPI的深入理解可以為正常和疾病狀態(tài)下的細(xì)胞生理學(xué)提供更多的見解,,對(duì)基礎(chǔ)科學(xué)和藥物發(fā)現(xiàn)具有重大意義,。然而,未知PPI預(yù)測(cè)仍然是一個(gè)挑戰(zhàn)性的問題,。為此,,該課題組提出了一種新的神經(jīng)網(wǎng)絡(luò)模型AFTGAN,,用于預(yù)測(cè)多種類型PPI。該方法在特征輸入方面,,除了氨基酸共現(xiàn)相似性和獨(dú)熱編碼以外,,還添加了含有大量蛋白質(zhì)生物學(xué)信息的語言模型ESM-1b嵌入作為蛋白質(zhì)序列特征。在網(wǎng)絡(luò)框架部分,,構(gòu)建了一個(gè)基于Transformer編碼器的集成網(wǎng)絡(luò),,包含Attention Free Transformer (AFT) 模塊和圖注意力網(wǎng)絡(luò)(GAT)。其中,,AFT模塊用于對(duì)重要蛋白質(zhì)序列特征信息進(jìn)行加權(quán)計(jì)算,,而圖注意力網(wǎng)絡(luò)(GAT)主要用于提取蛋白質(zhì)對(duì)的關(guān)系特征。在SHS27K和SHS148K數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果顯示,,AFTGAN優(yōu)于其他使用隨機(jī),、深度優(yōu)先搜索(DFS)和廣度優(yōu)先搜索(BFS)劃分的方法。測(cè)試集tSTRING數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,,AFTGAN模型在預(yù)測(cè)未知PPI方面具有性能優(yōu)勢(shì),。
論文鏈接:https://academic.oup.com/bioinformatics/article/39/2/btad052/7000335
中國·浙江 湖州市二環(huán)東路759號(hào)(313000) 浙ICP備10025412號(hào) 浙公網(wǎng)安備 33050202000195號(hào) 版權(quán)所有:黨委宣傳部