首页 - 讲座报告 - 正文

学术讲座:俞俊《视觉问答-利用深度学习沟通视觉与语言》

作者:       点击数:   更新时间:2021-01-18

报告题目

视觉问答-利用深度学习沟通视觉与语言

报 告 人

俞俊 杭州电子科技大学教授、博导,2016年获国家优青,2017年获教育部长江学者“青年学者”。

报告时间

121日上午10301130

报告地点

椒江校区图书信息大楼746会议室


专家简介:俞俊杭州电子科技大学教授、博士生导师,2016年获国家优青,2017年获教育部长江学者“青年学者”。主要研究方向为跨媒体分析技术。相关工作发表于SCI源期刊论文100余篇,包括ACM汇刊与IEEE汇刊及CCF A类会议40余篇。论文的Google Scholar引用次数6000余次。10余篇论文入选ESI高被引/热点论文;近年来主持科技部重点研发计划、国家自然科学基金重点项目、国家自然科学基金面上项目等,201520162017连续获得IEEE TMMTIPTCYB最佳论文奖,2018年教育部自然科学二等奖。担任多个国际期刊的副主编。

主要内容:视觉问答(Visual Question AnsweringVQA),是一种涉及计算机视觉和自然语言处理的学习任务,系统对视频及图像的内容和问题进行深度理解和推理后,给出相应的回答,相比于其他视频分析手段,视频问答能根据用户的提问,对视频内容进行细粒度语义理解。在面对复杂视频时可有效过滤冗余信息,方便用户进行决策。视频问答被广泛应用在社交媒体监管、智能监控分析、国防智能决策、智慧视频教育等多个领域,本报告将介绍团队近年来在视觉问答方面所作的研究工作。


承办学院

电子与信息工程学院(大数据学院)

发布日期

20210118

欢迎广大教师、学生参加!