題目:基于強化學習的離散時間均值-方差策略
報告人: 李迅
時間:2024年11月22日(周五),,上午10:00-11:00
報告地點: 理學院1-301會議室(騰訊會議:609-272-073)
報告摘要:本報告研究了一種基于強化學習的離散時間均值-方差模型,。與Wang-Zhou (2020)的連續(xù)時間模型相比,,離散時間模型對資產收益分布的假設更為廣泛。通過使用熵來衡量探索成本,,推導出最優(yōu)投資策略,,其密度函數同樣為高斯類型。此外,,設計了相應的強化學習算法,。模擬實驗和實證分析表明,離散時間模型在分析實際數據時,,相較于連續(xù)時間模型具有更好的適用性,。
報告人簡介:
李迅,于1992年獲上??萍即髮W數學系學士學位,,1995年獲上海大學數學系碩士學位。2000年在香港中文大學系統(tǒng)工程與工程管理學系獲得博士學位,,并于2001年在該系擔任博士后研究員,。從2001年至2003年,他在卡爾加里大學數學與計算金融實驗室擔任博士后研究員,。2003年至2007年,,他是新加坡國立大學數學系的訪問學者。2007年起,,他加入香港理工大學應用數學系,擔任助理教授,,2013年晉升為副教授,,目前為教授。其主要研究領域為隨機控制與金融應用中的應用概率,,已在SIAM Journal on Control and Optimization,、Annals of Applied Probability、IEEE Transactions on Automatic Control,、Automatica,、Journal of Differential Equations、Mathematical Finance,、Finance and Stochastics以及Quantitative等期刊發(fā)表論文,。
中國·浙江 湖州市二環(huán)東路759號(313000) 浙ICP備10025412號 浙公網安備 33050202000195號 版權所有:黨委宣傳部