題目:基礎(chǔ)模型驅(qū)動的多模態(tài)行人檢索與可控生成
報告人:葉茫
時間:2024年11月29日(周五),,15:30-16:30
會議地點(diǎn):31-904
報告摘要:
多模態(tài)行人檢索在智慧城市等領(lǐng)域有重要應(yīng)用,現(xiàn)有方法通常獨(dú)立的去研究單一的跨模態(tài)檢索任務(wù),,極大的限制了實(shí)際不確定場景的靈活性,,本次報告將介紹如何利用多模態(tài)預(yù)訓(xùn)練模型,構(gòu)建不確定多模態(tài)場景下的行人檢索基礎(chǔ)模型等相關(guān)工作,,同時分享文本引導(dǎo)的可控人像生成相關(guān)研究進(jìn)展及應(yīng)用,。
報告人簡介:
葉茫,武漢大學(xué)教授,,國家級高層次青年人才,、中國科協(xié)青年托舉人才。主要研究方向多媒體檢索,、多模態(tài)理解,、聯(lián)邦學(xué)習(xí)等,發(fā)表國際期刊會議論文 100 余篇,,其中第一/通訊作者發(fā)表 CCF-A 類論文60余篇,,谷歌學(xué)術(shù)引用近萬次。擔(dān)任CCF-A類期刊IEEE TIFS等SCI期刊編委,,多次擔(dān)任CVPR,、ICLR、ACM MM,、ECCV等學(xué)術(shù)會議領(lǐng)域主席,。主持國自科-香港聯(lián)合基金,、湖北省重點(diǎn)研發(fā)計(jì)劃等10余項(xiàng)科研項(xiàng)目。獲谷歌優(yōu)秀獎學(xué)金,、ICCV2021 無人機(jī)特定行人檢索賽道冠軍,、2021-2024斯坦福排行榜 “全球前2%頂尖科學(xué)家”、2022年度百度AI華人青年學(xué)者等榮譽(yù),。
中國·浙江 湖州市二環(huán)東路759號(313000) 浙ICP備10025412號 浙公網(wǎng)安備 33050202000195號 版權(quán)所有:黨委宣傳部