2018年8月29日,应永利集团304am官方入口邀请,微软雷蒙德研究院高级研究院Hongzhi Li博士在永利官网做了题为《Pattern Mining and Concept Discovery for Multimodal Content Analysis》的学术报告。来自学院各个系所的教师、研究生和本科生参加了此次报告会。
Li博士首先回顾了基于视觉模式挖掘的研究发展及代表性工作,指出将多模态进行协同可以有效地提升各种挖掘任务的性能。在此基础上,Li博士介绍了他所在团队开展的两项研究:通过协同图像与文字来发掘大规模视觉信息中的事件、通过构建端到端(end-to-end)深度神经网络来更加高效地协同和融合文字和视觉模态信息。最后,Li博士对未来拟开展的工作进行了介绍,并探讨了其中若干开放问题的解决思路。报告结束后,在座师生就感兴趣的话题和Li博士进行了深入交流。
Li博士是微软雷蒙德研究院高级研究员。他于2012年和2016年获得哥伦比亚大学硕士和博士学位,师从多媒体领域著名学者、ACM/IEEE/AAAS会士Shih-fu Chang教授。Li博士研究领域包括机器学习、多媒体内容分析和云计算。Li博士在ACM Multimedia、IEEE多媒体汇刊等多媒体领域知名学术会议和期刊上发表论文数十篇,并获得ACM ICMR2018最佳海报奖、2012年ACM Multimedia挑战赛第一名等学术奖励。Li博士目前是ACM Multimedia、IJCAI等知名学术会议的领域委员会主席或程序委员会委员,也是多份IEEE汇刊审稿人。