題目:基礎(chǔ)模型驅(qū)動的多模態(tài)行人檢索與可控生成
報告人:葉茫
時間:2024年11月29日(周五),,15:30-16:30
會議地點:31-904
報告摘要:
多模態(tài)行人檢索在智慧城市等領(lǐng)域有重要應(yīng)用,,現(xiàn)有方法通常獨立的去研究單一的跨模態(tài)檢索任務(wù),極大的限制了實際不確定場景的靈活性,,本次報告將介紹如何利用多模態(tài)預(yù)訓(xùn)練模型,,構(gòu)建不確定多模態(tài)場景下的行人檢索基礎(chǔ)模型等相關(guān)工作,同時分享文本引導(dǎo)的可控人像生成相關(guān)研究進展及應(yīng)用,。
報告人簡介:
葉茫,,武漢大學(xué)教授,國家級高層次青年人才,、中國科協(xié)青年托舉人才,。主要研究方向多媒體檢索、多模態(tài)理解、聯(lián)邦學(xué)習(xí)等,,發(fā)表國際期刊會議論文 100 余篇,,其中第一/通訊作者發(fā)表 CCF-A 類論文60余篇,谷歌學(xué)術(shù)引用近萬次,。擔(dān)任CCF-A類期刊IEEE TIFS等SCI期刊編委,,多次擔(dān)任CVPR、ICLR,、ACM MM,、ECCV等學(xué)術(shù)會議領(lǐng)域主席。主持國自科-香港聯(lián)合基金,、湖北省重點研發(fā)計劃等10余項科研項目,。獲谷歌優(yōu)秀獎學(xué)金、ICCV2021 無人機特定行人檢索賽道冠軍,、2021-2024斯坦福排行榜 “全球前2%頂尖科學(xué)家”,、2022年度百度AI華人青年學(xué)者等榮譽。
中國·浙江 湖州市二環(huán)東路759號(313000) 浙ICP備10025412號 浙公網(wǎng)安備 33050202000195號 版權(quán)所有:黨委宣傳部