王生进 ,男,博士,长聘教授。1997年在东京工业大学获博士学位,2003年至今清华大学电子工程系任教.目前主要研究内容包括人工智能、机器学习和计算机视觉等,主要研究方向包括人脸识别与行人再识别、多模态协同机器人、智能视频安防与智慧校园等。
以负责人和技术骨干身份承担或参与包括973、863、国家自然科学基金、教育部博士点基金、国家科技支撑计划等多个国家项目,并取得出色成果。实验室在国际重要期刊IEEE和学术会议CVPR、ICCV等发表论文90篇以上。申请发明专利15项。
教育及工作经历:
1980/09 – 1985/07,清华大学无线电电子学系,学士学位。
1985/09 – 1988/03,北京广播学院微波系,硕士学位。
1993/09 – 1997/03,东京工业大学智能科学专攻,博士学位。
1988/04 – 1992/08,北京广播学院微波系,讲师。
1992/09 – 1993/08,东京工业大学智能科学专攻,访问学者。
1997/04 – 2003/08,NEC互联网系统研究所,研究员。
2003/09 – 至今,清华大学电子系,教授。
学术兼职及社会任职:
兼任中国图象图形学学会视频监控与安全专委会主任 、北京图象图形学会副理事长 、全国安防标委会人体生物特征识别应用分技术委员会委员 、公安部安全防范技术与风险评估公安部重点实验室学术委员会委员 、自动化学会国防大数据分会副主任委员 、危爆品扫描探测国家工程实验室副主任。
1. 北京图像图形学会副理事长、学术委员会主任。
2. 全国安防标委会人体生物特征识别应用分技术委员会委员。
3. 教育部网上巡查视频标准专家组顾问委员。
4. 十二五国家科技支撑计划社会公共安全(安全防范)领域立项专家组成员。
5. 十二五国家科技支撑计划“公共安全物联网技术研究与应用示范”项目咨询专家组组长。
6. 中国科学院、中国工程院、国家自然科学基金委员会主办的“寻找青年科学之星”评审委员会信息技术领域评委。
7. 《遥测遥控》杂志编委。
8. 公安部安全防范技术与风险评估公安部重点实验室学术委员会委员。
9. 中国安全防范产品行业协会人体生物特征识别应用专业组专家委员会委员。
主讲课程:
主讲两门本科生和一门研究生的专业课程,以及多个专业讲座课程。
本科生课程:《媒体与认知》、《数字图象处理》
研究生课程:《虚拟现实技术与多媒体人机交互》
培养研究生情况:
培养研究生100余名。
招聘情况:
研究条件和实验室环境:
研究室拥有良好的学习与工作环境,活跃的学术气氛,软、硬件资源丰富,现有多个学术研究小组,以促进学术交流,激励学术创新。研究室培养学生的宗旨是,兼备深厚的理论基础和强力的科研能力。从研究室毕业的同学多在国内外著名科研机构和公司深造或工作。
研究室长期从事智能图文信息处理,特别是文字和图像的识别理解研究,致力于赋予计算机视觉感知功能。目前在汉字及多文种文字识别、多模式生物特征身份认证、智能视频监控等方面取得了多项具有国际领先水平的研究成果。
欢迎相关企业和研究机构与我们开展合作研究,欢迎有志于图像处理、模式识别、以及计算机视觉等方面研究的同仁加入我们的研究团队!
研究方向:
主要研究方向为图像处理,计算机视觉,虚拟现实技术,智能交通信息处理,智能视频监控等。
目前的研究重点为特征提取和图像匹配、目标识别与跟踪、智能视频监控、行为分析、基于图像的三维建模等。研究基于视觉感知和统计学习的视频模式识别的理论和方法,并在此基础上,进行图像分析和景物理解的研究、复杂背景下目标检测和定位的研究、图像目标的识别、三维物体识别、行为识别、目标定位与轨迹跟踪、弱小目标检测,以及与计算机视觉秘密切相关的全局优化算法的研究等。这些研究内容均是目前计算机视觉与模式识别领域的热点研究课题。
承担科研项目情况:
以目标检测和识别、目标跟踪、行为分析为基础,构建对于国家安全和公共安全有重大需求的智能视频分析系统。近年来,研究团队获得了包括863、国家自然科学基金、教育部博士点基金等多个国家项目支持,并取得出色成果。
1. “开放场景下基于深度学习的时空信息融合行人再识别方法研究”,国家自然科学基金,在研
2. “动态人脸快速比对技术与装备”,科技部十三五重点研发计划项目(课题),在研
3. “基于新型深度神经网络的图像描述理论与方法研究”,国家自然科学基金
4. “面向人工智能基础技术及应用的检验检测基础服务平台建设”,工信部2019年产业技术基础公共服务平台项目
5. “多源信息关联整合与共享联动技术与系统研发”,国家科技支撑计划项目
6. “海量不确定异构数据的集成管理与分析技术”,国家863计划项目
7. “重现的行人目标数据关联和深度跟踪理论及方法研究”,国家自然科学基金
8. “基于人类视觉感知和认知机理的视频图像模式识别和机器学习”,国家863计划项目
9.基于视觉的,重点研发计划(先进技术)-424 创新特区项目(清华大学牵头)
10.车辆违章二次识别算法技术研究与开发服务,企事业单位委托项目
11.人脸识别算法技术研究与开发服务,企事业单位委托项目
12.行人识别算法技术研究与开发服务,企事业单位委托项目
13.人口信息生物特征识别应用技术研究,企事业单位委托项目
14.面向分类的自学习技术合作项目,企事业单位委托项目
15.清华大学-佛山先进制造研究院电子信息器件与系统联合研究中心,联合机构合作协议
16.体智能AI评量系统,企事业单位委托项目
17.基于计算机视觉技术的人面部三维特征识别对医用防护口罩密合性的应用研究,北京市政府部门其他项目
18.清华大学-商汤科技“感知计算”产学研深度融合专项计划合作协议(第一期),企事业单位委托项目
19.基于局部特征感知深度学习的部分成像ReID与 时空信息感知深度学习的视频ReID方法研究,企事业单位委托项目
20.人工智能与3D打印融合智能计算技术,企事业单位委托项目
21.(丰田AI中心子项目)驾驶员学习模型的研究,联合共建支撑项目
22.典型目标属性识别技术研究,重点研发计划(先进技术)-426 基础加强项目(子课题)
23.样本融合学习算法模块开发,专项-429 重大专项
24.视频图像相机来源聚类证伪技术研究,重点研发计划(国内)-126 子课题
25.(丰田AI中心子项目)场景理解与模仿学习自动驾驶算法研究,联合共建支撑项目
26.智慧工厂关重区域人员进出及工作状态监测技术,企事业单位委托项目
27.生物发酵产程中的智能检测与智控技术研发,企事业单位委托项目
28.清华大学(电子系)-北京华成智云软件股份有限公司视觉计算技术与系统联合研究中心,联合机构合作协议
29.(丰田AI中心子项目)场景理解与模仿学习自动驾驶算法研究, 联合共建支撑项目
30.(丰田AI中心子项目)场景理解与模仿学习自动驾驶算法研究(2023年度),联合共建支撑项目
31.冠脉造影节段机器识别,企事业单位委托项目
32.视频描述与多模态语义获取,重点研发计划(国内)-125 课题牵头(项目校外牵头)
33. 教育部博士点基金项目(20090002110077) 基于在线特征学习的人形表象数据关联方法及其应用研究、主持。
34. 国家863计划项目(2006AA01Z115)基于人类视觉感知和认知机理的视频图像模式识别和机器学习、主持。
35. 国家863计划项目“驾驶人安全状态监测及预警技术”的子课题:驾驶人安全状态识别技术。
36. 国家973计划项目“基于视觉认知的非结构化信息处理理论与关键技术”的子课题:非结构化图文信息理解与检索的关键技术。
37. CNGI示范工程项目:基于IPv6的高性能视频传输和共享虚拟现实。
研究概况:
研究内容包括人工智能、机器学习和计算机视觉等,主要研究方向包括人脸识别与行人再识别、多模态协同机器人、智能视频安防与智慧校园等。
在人脸识别研究中,2004年团队在国家863人脸识别认证评测中获第一;第17届国际模式识别会议(ICPR2004)人脸认证竞赛(FAT2004)中,以全部测试指标第一获“人脸认证算法全面性能最优成就奖”;2018年在国际权威人脸检测测试库FDDB取得国际第一。研究成果已经应用在贵州六盘水市公安局。在行人再识别研究中,2015年行人再识别研究成果被《麻省理工学院技术评论》高度评价。建立并公开了三个本领域权威测试行人数据集iLIDS-VID、Market1501、MARS。到目前为止,成为本领域标准测试集,三个数据集已经有超过13600次的下载量。
多模态协同机器人研究致力于研究与人在共同空间、近距离、协同工作的机器人,实现多模态人机物交互。研究的核心技术包括通用物体检测,语音识别与NLP,视觉图像的多模态语义理解,目标物体位姿估计与抓取点确定,视觉与触觉力反馈融合的物体抓取,持物移动中的平衡策略等。目前研究构建了面向人机交互短语命令的语音识别原型系统引擎,实现由语音指令控制的机器人物体抓取系统。
获得了包括973、863、国家自然科学基金、教育部博士点基金、国家科技支撑计划等多个国家项目支持,并取得出色成果。实验室在国际重要期刊IEEE和学术会议CVPR、ICCV等发表论文90篇以上。申请发明专利15项。获2008年国家科技进步二等奖1项、获2006北京市科学技术一等奖1项,获2019年吴文俊人工智能科学技术自然科学二等奖。
担任中国图象图形学学会视频监控与安全专委会主任、北京图象图形学会副理事长、全国安防标委会人体生物特征识别应用分技术委员会委员、公安部安全防范技术与风险评估公安部重点实验室学术委员会委员、自动化学会国防大数据分会副主任委员、危爆品扫描探测国家工程实验室副主任。
科研成果:
获得了包括973、863、国家自然科学基金、教育部博士点基金、国家科技支撑计划等多个国家项目支持,并取得出色成果。在国际重要期刊IEEE和学术会议发表论文逾200余篇,其中近年发表IEEE Trans等顶级期刊18篇,CVPR/ICCV /ECCV 三大顶会30篇,其他顶会16篇。谷歌单篇引用逾4500次。申请发明专利15项。
发表AAAI2018 oral 1篇, ICCV2023 oral 1篇, ICASSP2023 oral 1篇, ICASSP2024 oral 1篇。王生进连续4年4次入选爱思唯尔中国高被引学者榜单(王生进2020、2021、2022、2023)。
获2008年国家科技进步二等奖1项、获2006北京市科学技术一等奖1项,获2019年吴文俊人工智能科学技术自然科学奖,2019年公安部科学技术奖,DAS最佳论文 1篇,ICPR最佳论文 1篇,2017年度中国人工智能学会优秀博士论文奖,2020年度中国图像图形学会优秀博士论文奖,获2021北京市科学技术奖技术发明一等奖1项。
8.2024年6月5日,王生进、李亚利指导的博士生王振宇的学术论文“UniDetector: Towards Universal Object Detection with Heterogeneous Supervision”,被本领域顶级期刊PAMI接收。这是继去年团队ICCV2023 Oral, ICASSP2024 Oral,ICME2024 Oral之后深度学习与通用视觉感知模型研究领域又一篇高水平论文被接收。
7.2024年4月26日,天津市人民政府颁布了2023年度天津市科学技术奖获奖名单,由天津市眼科医院及清华大学等高校单位共同完成的“人工智能辅助的生物医学新方法在提升视觉精准诊疗中的应用”项目荣获2023年度天津市科技进步一等奖。王生进教授为本次获奖项目的第3排名获奖人。主要贡献:带领团队基于深度学习等方法预测近视并发现视觉规律,开发基于眼底图像的新型智能化视网膜检影系统,实现在非散瞳状态下的精准验光,提升了临床诊疗效率。这是继王生进教授2021年获得北京市科学技术奖技术发明一等奖(排名2)后再次获得省部级科学技术奖励。
6.电子工程系王生进、李亚利团队的博士生刘鑫的论文“基于自监督信息瓶颈的通用视觉表征学习”(Learning Generalizable Visual Representations via Self-Supervised Information Bottleneck) 于2024年3月9日被第49届IEEE国际声学、语音和信号处理会议(2024 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2024)接收为口头报告(Oral)发表。当地时间4月18日,刘鑫在韩国首尔参加该学术会议并作大会口头报告。ICASSP 2024的有效投稿数为5796,共有738篇论文被接收为口头报告发表,接收率约为12.7%。
2024年4月14日至4月19日,第49届IEEE 国际声学、语音和信号处理会议(2024 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2024)在韩国首尔举办。ICASSP是国际规模最大、学科最全面的信号处理及其应用方面的顶会,是IEEE的旗舰会议,展示了信号处理研究和技术的最新进展。电子工程系王生进、李亚利团队在机器学习和计算机视觉研究领域取得了突出成果,多次获得学术奖励,论文单篇引用逾4000次。该篇论文是继该团队在AAAI 2020、ICASSP 2023、ICCV 2023上发表Oral论文之后的又一篇顶级国际学术会议Oral论文。
5.电子工程系王生进、李亚利团队的博士生豆朝鹏的论文《面向域泛化行人再识别的身份导向自监督表征学习》(Identity-Seeking Self-Supervised Representation Learning for Generalizable Person Re-identification)于2023年8月12日被国际计算机视觉大会(IEEE International Conference on Computer Vision, ICCV2023)接收为Oral。当地时间10月6日,豆朝鹏赴法国巴黎参加该学术会议并作大会口头报告。ICCV2023的有效投稿数为8088,最终接收了2160篇文章,接收率约26.7%,共有152篇论文被接收为口头报告(Oral),接收率仅1.9%。
ICCV会议由电气与电子工程师学会(The Institute of Electrical and Electronics Engineers, IEEE)举办,与计算机视觉模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition , CVPR)和欧洲计算机视觉会议(European Conference on Computer Vision, ECCV)并称计算机视觉方向的三大会议,被中国计算机学会等机构评为最高级别的学术会议,在业内具有极高的评价,拥有极高的领域影响力。电子工程系王生进、李亚利团队在机器学习和计算机视觉研究领域取得了突出成果,多次获得学术奖励,论文单篇引用逾4000次。该篇论文是继该团队在国际先进人工智能协会的人工智能会议(AAAI Conference on Artificial Intelligence, AAAI)和国际声学、语音与信号处理会议(International Conference on Acoustics, Speech and Signal Processing, ICASSP)上发表Oral论文之后的又一篇顶级国际学术会议Oral论文。
4.Intel室内机器人学习全球挑战赛决赛在上海市长宁区成功举办。初赛共14支队伍于2022年3-6月相继进行线上测试,本次CV-AI团队共报名识别和操作两个赛道。在识别赛道中,CV-AI团队参与了物体识别与寻找子赛道,最终,CV-AI团队线上测试准确率为7/9,离线测试准确率为100%。清华大学电子工程系CV-AI团队(指导教师:王生进、李亚利, 团队成员:鲁宇豪、智佩渊、陈祖煜、豆朝鹏、樊懿轩、潘明轩)参赛并荣获识别赛道一等奖、操控赛道二等奖、全球挑战赛决赛一等奖。
3.王重道博士论文被评选为2022年度清华大学博士论文,同时,在清华大学研究生毕业典礼上,邱勇校长表彰了全校共96名优秀毕业生。电子系博士毕业生王重道获得2022年度“清华大学优秀博士毕业生”奖项。
2.郑良博士论文被评选为2017年度中国人工智能学会优秀博士论文(全国10篇)。
1.孙奕帆博士论文被评选为2020年度中国图像图形学会优秀博士论文(全国10篇)。
认定成果:
1 非结构光场智能成像关键技术与装备 方璐;王生进;赵严;王滨;袁肖赟;温建伟;金刚 清华大学 2021
2 多源信息关联整合与共享联动技术与系统 张俊业;李跃威;高磊;王生进;孙怡;赵炫;兰玉文;李鹏飞;彭良瑞;马晓红;尹继伟;喻松春;费宝顶;李亚利;戚金清 公安部第一研究所 2016
3 高性能维吾尔文识别与理解系统 丁晓青;彭良瑞;吐尔根·依布拉音;哈力木拉提·买买提;谢旭东;刘长松;吴佑寿;姜志威;苏冰;王生进;王言伟;麦热哈巴·艾力;卡哈尔江·阿比的热西;张岩;刘祥豹;何培新;买合木提·买买提;李宁;努尔艾力·喀迪尔;邵伟;杨敏;闵京松;王琳琬 清华大学 2014
4 TH-IDvs视频监控人脸识别技术与系统 丁晓青;方驰;文迪;黄琛;刘长松;梁亦聪;何智翔;丁镠;洪立俊;申文涛;贾强;吴佑寿;王生进;彭良瑞;李亚利;刘晓春;王贤良;孙庆南;杨春宇;赵元兴 清华大学 2013
5 非结构化信息(图像)的内容理解与语义表征 史忠植;丁晓青;何清;王生进;胡宏;蒙祖强;刘长松;方驰;施智平;刘曦 中国科学院计算技术研究所 2011
6 视频安防监控数字录像设备图像质量评价测试系统 卢玉华;王生进;邵子健;刘琳;芦朋;鹿文浩;陶磊;谭耀麟 公安部第一研究所 2010
7 软件自治愈与自恢复技术 史忠植;丁晓青;何清;王生进;胡宏;蒙祖强;刘长松;方驰;施智平;刘曦 中国科学院计算技术研究所 2009
8 TH-ID多模生物特征(人脸笔迹签字虹膜)身份识别认证系统 丁晓青;方驰;刘长松;彭良瑞;王争儿;薛峰;王贤良;陈彦;吴佑寿;王生进;冯薪桦;马勇;杨琼;李昕;雷云;蒋焰 清华大学 2005
9 TH-ID人脸和笔迹生物特征身份识别认证系统 丁晓青;方驰;刘长松;彭良瑞;王争儿;薛峰;王贤良;陈彦;吴佑寿;王生进;冯薪桦;马勇;杨琼;李昕;雷云;蒋焰 清华大学电机工程与应用电子技术系 2005
10 维哈柯(汉英)阿(英)双向印刷文档识别系统 丁晓青;彭良瑞;靳简明;王华;哈力木拉提;刘长松;方驰;吴佑寿;吐尔根·依布拉音;王生进;李昕;修平平 清华大学 2004
制定标准:
1 公共安全 生物特征识别 术语 现行 GB/T 41786-2022 2023-06-07 国家标准
2 公安视频监控人像/人脸识别应用技术要求 现行 GA/T 1756-2020 2021-06-08 行业标准
3 安全防范 人脸识别应用 程序接口规范 现行 GA/T 1326-2017 2018-05-17 行业标准
4 安防掌静脉识别应用图像技术要求 现行 GA/T 1395-2017 2018-05-17 行业标准
5 甚低频感应入侵探测器技术要求 现行 GA/T 1372-2017 2017-05-27 行业标准
6 安全防范监控数字视音频编解码技术要求 被代替 GB/T 25724-2010 2023-10-20 国家标准
7 安防生物特征识别应用术语 现行 GA/T 893-2010 2017-05-05 行业标准
发明公开:
[1]李亚利, 张济川, 王生进. 一种面向开放环境的多模态人像表情识别方法及装置[P]. 北京市: CN118196854A, 2024-06-14.
[2]彭良瑞, 赵珂萌, 姚刚, 丁宁, 唐沛, 王生进. 基于深度表征学习的车牌图像识别方法及系统[P]. 北京市: CN117373010A, 2024-01-09.
[3]罗常伟, 黄晶, 王生进, 王桂芳, 蔡颖南. 基于面部图像的口罩适合性检测方法及装置[P]. 北京市: CN116631019A, 2023-08-22.
[4]杨舒, 王生进. 一种基于多模板提示学习的视觉分类方法和装置[P]. 北京市: CN116416480A, 2023-07-11.
[5]余盛铭, 王生进. 基于Transformer的两步式领域自适应行人再识别方法[P]. 北京市: CN115497120A, 2022-12-20.
[6]许景焘, 李亚利, 王生进. 一种大场景图像的区域提取方法及装置[P]. 北京市: CN114723718A, 2022-07-08.
[7]王生进, 鲁宇豪, 李亚利. 一种机器手抓取姿势质量的物理度量方法及装置[P]. 北京市: CN114083535A, 2022-02-25.
[8]王羽飞, 王生进. 人脸识别方法、装置及电子设备[P]. 北京市: CN113936308A, 2022-01-14.
[9]彭良瑞, 石浩东, 闫睿劼, 王生进. 场景文字识别模型的训练方法与识别方法及装置[P]. 北京市: CN113762241A, 2021-12-07.
[10]石家赫, 李亚利, 王生进. 人脸图像的情绪确定方法、装置、电子设备及存储介质[P]. 北京市: CN113326762A, 2021-08-31.
[11]王重道, 王生进. 基于无监督学习的行人再识别方法及系统[P]. 北京市: CN113255394A, 2021-08-13.
[12]方璐, 季梦奇, 郑添, 袁肖赟, 王生进. 一种动态光场重建方法、装置及设备[P]. 北京市: CN113192185A, 2021-07-30.
[13]方璐, 季梦奇, 张晋之, 王生进. 一种稀疏光场重建方法及装置[P]. 北京市: CN113129352A, 2021-07-16.
[14]彭良瑞, 肖善誉, 闫睿劼, 姚刚, 王生进, 闵载植, 石宗烨. 基于序列变形的场景文字检测方法及系统[P]. 北京市: CN112926372A, 2021-06-08.
[15]方璐, 王雪扬, 季梦奇, 王生进. 一种动态大场景自适应智能处理方法[P]. 北京市: CN112446379A, 2021-03-05.
[16]方璐, 季梦奇, 毛适, 王生进. 一种场景语义分割方法、装置、电子设备[P]. 北京市: CN112446385A, 2021-03-05.
[17]彭良瑞, 闫睿劼, 肖善誉, 姚刚, 王生进, 闵载植, 石宗烨. 基于多元注意力机制的多方向场景文字识别方法及系统[P]. 北京市: CN112215223A, 2021-01-12.
[18]韩剑, 王生进, 李亚利. 基于半监督学习的行人再识别方法及装置[P]. 北京市: CN111563424A, 2020-08-21.
[19]康凯, 范英, 徐飞, 宰旭昕, 施一琳, 孔宇廉, 王重道, 王生进. 跨年龄人脸识别方法及装置[P]. 北京市: CN111209878A, 2020-05-29.
[20]赵炫, 王生进, 李亚利. 一种基于时空约束的目标聚类方法及系统[P]. 北京市: CN110765863A, 2020-02-07.
[21]江碧涛, 李晓斌, 王生进, 杨渊博, 傅雨泽, 孟钢, 罗江锋, 尹璐, 岳文振, 李阳, 张宇喆, 李志欣. 一种基于人机融合的目标识别方法[P]. 北京市: CN110348296A, 2019-10-18.
[22]江碧涛, 李晓斌, 王生进, 杨渊博, 罗江锋, 张宇喆, 尹璐, 张砚, 李阳, 沈黎. 一种可见光遥感图像候选目标提取与分类方法[P]. 北京市: CN110008899A, 2019-07-12.
[23]李晓斌, 江碧涛, 王生进, 杨渊博, 孟钢, 傅雨泽, 岳文振, 孙晓坤, 邹飞, 李志欣. 一种由区域到目标的可见光遥感图像候选目标提取方法[P]. 北京市: CN110008900A, 2019-07-12.
[24]王生进, 王晗. 行人检测方法和装置[P]. 北京市: CN109871792A, 2019-06-11.
[25]王生进, 舒晗. 用于目标检测的卷积神经网络模型的压缩方法和系统[P]. 北京市: CN108898168A, 2018-11-27.
[26]彭良瑞, 闫睿劼, 陈立人, 刘长松, 丁晓青, 王生进. 基于时间残差长短时记忆网络的阿拉伯文识别方法及系统[P]. 北京: CN107679585A, 2018-02-09.
[27]王生进, 李栋. 一种物体检测方法及装置[P]. 北京: CN107545263A, 2018-01-05.
[28]王生进, 赵炫. 一种大流量通关快速身份核验方法和系统[P]. 北京: CN107066945A, 2017-08-18.
[29]王生进, 赵炫. 一种人脸识别处理方法和系统[P]. 北京: CN107025435A, 2017-08-08.
[30]王生进, 舒晗. 人脸检测方法及装置[P]. 北京: CN106951826A, 2017-07-14.
[31]王生进, 刘紫琼. 一种基于Siamese网络的图像检索方法及系统[P]. 北京: CN106909625A, 2017-06-30.
[32]何建伟, 王大力, 于红洋, 李蒙, 王生进, 陈荡荡. 一种人脸活体检测方法和装置[P]. 北京: CN106897657A, 2017-06-27.
[33]王生进, 刘紫琼. 一种基于区域特征的图像检索方法及系统[P]. 北京: CN106886783A, 2017-06-23.
[34]王生进, 田露. 一种行人识别方法和装置[P]. 北京: CN106529442A, 2017-03-22.
[35]王生进, 陈荡荡. 人脸识别方法及装置[P]. 北京: CN105809154A, 2016-07-27.
[36]王生进, 陈荡荡, 何建伟, 程景春, 王大力, 赵亚丽, 于红洋, 余盛铭, 李蒙. 防止照片攻击的人脸识别方法及装置[P]. 北京: CN105488486A, 2016-04-13.
[37]王生进, 赵亚丽, 何建伟, 陈荡荡, 王大力, 程景春, 于红洋, 余盛铭, 李蒙. 基于眼部信息的活体人脸检测方法及装置[P]. 北京: CN105243378A, 2016-01-13.
[38]王生进, 程景春, 何建伟, 陈荡荡, 王大力, 赵亚丽, 于红洋, 余盛铭, 李蒙. 一种基于虹膜变化的活体识别方法及系统[P]. 北京: CN105139006A, 2015-12-09.
[39]王飞跃, 胡斌, 熊刚, 朱凤华, 王生进. 一种基于视频监控图像的行人检测和计数方法[P]. 北京: CN103646257A, 2014-03-19.
[40]成波, 王文军, 张波, 王生进. 基于路面标识识别违规驾驶行为的方法及系统[P]. 北京: CN103116748A, 2013-05-22.
[41]林源, 王生进, 桂良琰, 丁晓青. 三维头部模型重建方法[P]. 北京: CN102663820A, 2012-09-12.
[42]李亚利, 王生进, 方驰, 丁晓青. 视觉广告效果评估系统及方法[P]. 北京: CN102542492A, 2012-07-04.
[43]何飞, 王生进, 苏亚, 陈晨, 郑良, 丁晓青. 图像采集分析方法[P]. 北京: CN102184405A, 2011-09-14.
[44]丁晓青, 谷军霞, 吴佑寿, 王生进, 方驰, 刘长松. 一种行为描述的方法和装置[P]. 北京: CN101482928, 2009-07-15.
[45]丁晓青, 徐剑, 吴佑寿, 王生进. 一种多视角运动目标检测、定位与对应方法[P]. 北京: CN101144716, 2008-03-19.
[46]丁晓青, 雷云, 王生进, 熊斌, 方驰, 刘长松, 彭良瑞. 图像匹配方法[P]. 北京: CN101140624, 2008-03-12.
[47]丁晓青, 方驰, 舒畅, 刘长松, 蒋焰, 王生进, 彭良瑞. 生物特征融合的身份识别和认证方法[P]. 北京: CN1794266, 2006-06-28.
发明授权:
[1]彭良瑞, 闫睿劼, 肖善誉, 姚刚, 王生进, 闵载植, 石宗烨. 基于多元注意力机制的多方向场景文字识别方法及系统[P]. 北京市: CN112215223B, 2024-03-19.
[2]罗常伟, 黄晶, 王生进, 王桂芳, 蔡颖南. 基于面部图像的口罩适合性检测方法及装置[P]. 北京市: CN116631019B, 2024-02-27.
[3]余盛铭, 王生进. 基于Transformer的两步式领域自适应行人再识别方法[P]. 北京市: CN115497120B, 2023-12-15.
[4]李晓斌, 江碧涛, 王生进, 杨渊博, 孟钢, 傅雨泽, 岳文振, 孙晓坤, 邹飞, 李志欣. 一种由区域到目标的可见光遥感图像候选目标提取方法[P]. 北京市: CN110008900B, 2023-12-12.
[5]杨舒, 王生进. 一种基于多模板提示学习的视觉分类方法和装置[P]. 北京市: CN116416480B, 2023-08-25.
[6]王生进, 鲁宇豪, 李亚利. 一种机器手抓取姿势质量的物理度量方法及装置[P]. 北京市: CN114083535B, 2023-06-13.
[7]彭良瑞, 肖善誉, 闫睿劼, 姚刚, 王生进, 闵载植, 石宗烨. 基于序列变形的场景文字检测方法及系统[P]. 北京市: CN112926372B, 2023-03-10.
[8]韩剑, 王生进, 李亚利. 基于半监督学习的行人再识别方法及装置[P]. 北京市: CN111563424B, 2022-08-30.
[9]方璐, 季梦奇, 郑添, 袁肖赟, 王生进. 一种动态光场重建方法、装置及设备[P]. 北京市: CN113192185B, 2022-05-17.
[10]赵炫, 王生进, 李亚利. 一种基于时空约束的目标聚类方法及系统[P]. 北京市: CN110765863B, 2022-05-17.
[11]江碧涛, 李晓斌, 王生进, 杨渊博, 傅雨泽, 孟钢, 罗江锋, 尹璐, 岳文振, 李阳, 张宇喆, 李志欣. 一种基于人机融合的目标识别方法[P]. 北京市: CN110348296B, 2022-04-12.
[12]王生进, 舒晗. 用于目标检测的卷积神经网络模型的压缩方法和系统[P]. 北京市: CN108898168B, 2021-06-01.
[13]方璐, 季梦奇, 毛适, 王生进. 一种场景语义分割方法、装置、电子设备[P]. 北京市: CN112446385B, 2021-04-30.
[14]方璐, 王雪扬, 季梦奇, 王生进. 一种动态大场景自适应智能处理方法[P]. 北京市: CN112446379B, 2021-04-20.
[15]江碧涛, 李晓斌, 王生进, 杨渊博, 罗江锋, 张宇喆, 尹璐, 张砚, 李阳, 沈黎. 一种可见光遥感图像候选目标提取与分类方法[P]. 北京市: CN110008899B, 2021-02-26.
[16]王生进, 王晗. 行人检测方法和装置[P]. 北京市: CN109871792B, 2020-12-29.
[17]王生进, 李栋. 一种物体检测方法及装置[P]. 北京市: CN107545263B, 2020-12-15.
[18]王生进, 刘紫琼. 一种基于区域特征的图像检索方法及系统[P]. 北京市: CN106886783B, 2020-11-10.
[19]何建伟, 王大力, 于红洋, 李蒙, 王生进, 陈荡荡. 一种人脸活体检测方法和装置[P]. 北京市: CN106897657B, 2020-10-27.
[20]王生进, 赵炫. 一种人脸识别处理方法和系统[P]. 北京市: CN107025435B, 2020-06-23.
[21]王生进, 田露. 一种行人识别方法和装置[P]. 北京市: CN106529442B, 2019-10-18.
[22]王生进, 舒晗. 人脸检测方法及装置[P]. 北京市: CN106951826B, 2019-09-20.
[23]王生进, 赵炫. 一种大流量通关快速身份核验方法和系统[P]. 北京市: CN107066945B, 2019-06-18.
[24]王生进, 赵亚丽, 何建伟, 陈荡荡, 王大力, 程景春, 于红洋, 余盛铭, 李蒙. 基于眼部信息的活体人脸检测方法及装置[P]. 北京市: CN105243378B, 2019-03-01.
[25]王生进, 陈荡荡, 何建伟, 程景春, 王大力, 赵亚丽, 于红洋, 余盛铭, 李蒙. 防止照片攻击的人脸识别方法及装置[P]. 北京市: CN105488486B, 2018-10-30.
[26]王飞跃, 胡斌, 熊刚, 朱凤华, 王生进. 一种基于视频监控图像的行人检测和计数方法[P]. 北京市: CN103646257B, 2017-06-16.
[27]成波, 王文军, 张波, 王生进. 基于路面标识识别违规驾驶行为的方法及系统[P]. 北京市: CN103116748B, 2016-03-23.
[28]李亚利, 王生进, 方驰, 丁晓青. 视觉广告效果评估系统及方法[P]. 北京市: CN102542492B, 2015-02-18.
[29]林源, 王生进, 桂良琰, 丁晓青. 三维头部模型重建方法[P]. 北京市: CN102663820B, 2014-10-22.
[30]何飞, 王生进, 苏亚, 陈晨, 郑良, 丁晓青. 图像采集分析方法[P]. 北京市: CN102184405B, 2012-12-26.
[31]丁晓青, 谷军霞, 吴佑寿, 王生进, 方驰, 刘长松. 一种行为描述的方法和装置[P]. 北京市: CN101482928B, 2011-01-05.
[32]丁晓青, 雷云, 王生进, 熊斌, 方驰, 刘长松, 彭良瑞. 图像匹配方法[P]. 北京市: CN100530222C, 2009-08-19.
[33]丁晓青, 徐剑, 吴佑寿, 王生进. 一种多视角运动目标检测、定位与对应方法[P]. 北京市: CN100513997C, 2009-07-15.
[34]丁晓青, 方驰, 舒畅, 刘长松, 蒋焰, 王生进, 彭良瑞. 生物特征融合的身份识别和认证方法[P]. 北京市: CN100356388C, 2007-12-19.
国外发明专利:
[1] In-spaceviewpointcontroldeviceforuseininformationvisualizationsystem,US Paten t No.6597380,2003
[2] Browsingsystemofe-documentsandbrowsingcontrolmethod,PCT Patent Pending,No.35001106,2002
[3] Browsingsystemandcontrolmethodforscanneddocuments,Japanese Patent Pending No.2001-377987,2001
[4] Informationrepresentationdeviceandrecordingprogrammedia,Japanese Patent No.3246464,2000
[5] Spatialviewpointcontroldevice,Japanese Patent No.3123501,2000.
[6] Imagecapturingdevice,controlmethod,andrecordingmedia,Japanese Patent Pending No.2000-339806,2000
[7] Imagerepresentationdeviceandrecordingmethod,Japanese Patent Pending No.11-164666,1999
[8] Imagecapturingmethodandgenerationdevice,Japanese Patent Pending No.11-367832,1999.
[9] Imagematerialrepresentation,devicerecordingmethod,andmedia,Japanese Patent Pending No.11-313535,1999
[10] Mediarepresentationdeviceandrecordingmediain 3D space,Japanese Patent Pending No.10-205954,1998
在IEEE Trans. SMC、PRL、ACM、自动化学报、中国图像图形学报等国际国内重要刊物和CVPR, 即CVPR,ICPR, ICIP等国际重要学术会议发表论文90篇以上。
出版专著:
1.SunWeidong,WangShengjin,etc.(2007).The Hand book of Image Processing.Intheresea rcharea of Image Processing,Pressof ScientificIndustry,China,2007(inChinese)
代表性英文论文:
[1] Yifan Sun; Liang Zheng; Yali Li; Yi Yang; Qi Tian; Shengjin Wang. Learning Part-based Convolutional Features for Person Re-Identification. IEEE Trans. Pattern Anal. Mach. Intell. 43(3): 902-917 (2021)
[2] Jiahe Shi, Yali Li, Shengjin Wang. Partial Off-policy Learning: Balance Accuracy and Diversity for Human-Oriented Image Captioning. ICCV 2021, accepted.
[3] Xuege Hou, Yali Li, Shengjin Wang. Disentangled Representation for Age-Invariant Face Recognition: A Mutual Information Minimization Perspective. ICCV 2021, accepted.
[4] Takashi Isobe, Dong Li, Lu Tian, Weihua Chen, Yi Shan, Shengjin Wang. Towards Discriminative Representation Learning for Unsupervised Person Re-identification. ICCV 2021, accepted.
[5] Miao Hu, Yali Li, Lu Fang, Shengjin Wang. A2-FPN: Attention Aggregation Based Feature Pyramid Network for Instance Segmentation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. pages 15343-15352, 2021.
[6] Zhenyu Wang, Yali Li, Ye Guo, Lu Fang, Shengjin Wang. Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object Detection. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. pages 4568-4577, 2021.
[7] Takashi Isobe, Xu Jia, Shuaijun Chen, Jianzhong He, Yongjie Shi, Jianzhuang Liu, Huchuan Lu, Shengjin Wang. Multi-Target Domain Adaptation with Collaborative Consistency Learning. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Pages 8187-8196, 2021.
[8] Takashi Isobe, Fang Zhu, Shengjin Wang. Frame-Rate-Aware Aggregation for Efficient Video Super-Resolution. ICASSP 2021: 1430-1434.
[9] Dong Li, Jia-Bin Huang, Yali Li, Shengjin Wang and Ming-Hsuan Yang, Progressive Representation Adaptation for Weakly Supervised Object Localization, IEEE Trans on Pattern Analysis and Machine Intelligence(PAMI), Page(s): 1424 – 1438, Volume: 42, Issue: 6 , June 1 2020. Print ISSN: 0162-8828, Online ISSN: 0162-8828, DOI: 10.1109/TPAMI.2019.2899839.
[10] Zhengshuai Wang, Jianqiang Wang, Yali Li, Shengjin Wang, Traffic Sign Recognition with Lightweight Two-Stage Model in Complex Scenes, IEEE Transactions on Intelligent Transportation Systems, 2020.
[11] Jingchun Cheng, Yuhui Yuan, Yali Li, Jingdong Wang, Shengjin Wang, Learning to Segment Video Object with Accurate Boundaries, IEEE Transactions on Multimedia, 2020.
[12] Isobe, Takashi, Li, Ya-Li and Wang, Shengjin, Intra-clip Aggregation for Video Person Re-identification, BMVC 2020.
[13] Ye Guo, Yali Li, Shengjin Wang. CS-R-FCN: Cross-Supervised Learning for Large-Scale Object Detection ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pages 2553-2557, 2020.
[14] Takashi Isobe, Jian Han, Fang Zhu, Yali Li, Shengjin Wang, Intra-clip Aggregation for Video Person Re-identification, ICIP 2020: 2336-2340.
[15] Takashi Isobe, Xu Jia, Shuhang Gu, Songjiang Li, Shengjin Wang, Qi Tian. Video Super-Resolution with Recurrent Structure-Detail Network In ECCV 2020.
[16] Zhongdao Wang, Liang Zheng, Yixuan Liu, Yali Li, Shengjin Wang. Towards Real-Time Multi-Object Tracking. In ECCV, pages 107-122, 2020.
[17] Zhongdao Wang, Jingwei Zhang, Liang Zheng, Yixuan Liu, Yifan Sun, Yali Li, Shengjin Wang. CycAs: Self-supervised Cycle Association for Re-identifiable Descriptions. In ECCV, pages 72-88, 2020.
[18] Zhengshuai Wang, Yali Li, Shengjin Wang, FIANET: Video Object Detection via Joint Feaure-Level and Instance-Level Aggregation, 2020 IEEE International Conference on Multimedia and Expo (ICME), pages 1-6, London, UK, July 6-10, 2020. Oral.
[19] Takashi Isobe, Songjiang Li, Xu Jia, Shanxin Yuan, Gregory Slabaugh, Chunjing Xu, Ya-Li Li, Shengjin Wang, Qi Tian. Video Super-resolution with Temporal Group Attention In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. pages 8008-8017, 2020.
[20] Lanqing He, Zhongdao Wang, Yali Li, Shengjin Wang, Softmax Dissection: Towards Understanding Intra- and Inter-class Objective for Embedding Learning, AAAI2020, February 7-12, 2020, Hilton New York, USA. Oral.
[21] Jingwei Zhang, Zhongdao Wang, Yali Li, Shengjin Wang, Node-Adaptive Multi-Graph Fusion using Extreme Value Theory, IEEE Signal Processing Letters, pp. 351-355, Print ISSN: 1070-9908, Online ISSN: 1558-2361, Digital Object Identifier: 10.1109/LSP.2020.2970811, 2020
[22] Jian Han, Yali Li, Shengjin Wang. Adaptively Leverage Unlabeled Tracklets Based on Part Attention Model for Few-Example Re-ID. IEEE Signal Processing Letters. Volume 27, pages 2074-2078, 2020.
[23] Xiudong Wang, Yali Li, Shaodi You, Hongdong Li, and Shengjin Wang, Unidirectional Representation-Based Efficient Dictionary Learning, Journal: IEEE Transactions on Circuits and Systems for Video Technology, Issue Date: JANUARY 2020, Volume: 30, Issue:1, On Page(s): 59-74, Print ISSN: 1051-8215, Online ISSN: 1558-2205, Digital Object Identifier: 10.1109/TCSVT.2018.2886600
[24] Han Wang, Yali Li, Shengjin Wang, R Fast Pedestrian Detection with Attention-Enhanced Multi-Scale RPN and Soft-Cascaded Decision Trees, IEEE Transactions on Intelligent Transportation Systems, vol 21, No. 12, pages 5086-5093, 2020.
[25] Xuan Zhao, Yali Li, Shengjin Wang, Face Quality Assessment via Semi-Supervised Learning, ICCPR2019 (2019 8th International Conference on Computing and Pattern Recognition), Beijing, China, 2019. (Best paper Award)
[26] Yali Zhao, Yali Li, Shengjin Wang, Open-World Person Re-identification with Deep Hash Feature Embedding, IEEE Signal Processing Letters, IEEE Signal Processing Letters On page(s): 1758—1762, VOL. 26, NO. 12, DECEMBER 2019
[27] Yali Li, Shengjin Wang, HAR-Net: Joint Learning of Hybrid Attention for Single-stage Object Detection, IEEE Transactions on Image Processing, pp. 3092-3103, Vol. 29, 2020.
[28] Ye Tian, Jingchun Cheng, Yali Li, Shengjin Wang, Secondary Information Aware Facial Expression Recognition, IEEE Signal Processing Letters, IEEE Signal Processing Letters On page(s): 1753—1757, VOL. 26, NO. 12, DECEMBER 2019.
[29] Jiahe Shi, Yali Li, Shengjin Wang, Cascade Attention: Multiple Feature Based Learning for Image Captioning, ICIP2019, Taipei, Taiwan, China, Sept. 22-25, 2019.
[30] Yue Zheng, Yali Li, Shengjin Wang, Intention Oriented Image Captions with Guiding Objects, CVPR2019, Long Beach, CA, USA, June, 2019.
[31] Yifan Sun, Qin Xu, Yali Li, Chi Zhang, Shengjin Wang*, Jian Sun, Learning Visibility-aware Part-level Features with Self-supervision for Partial Person Re-identification, CVPR2019, Long Beach, CA, USA, June, 2019.
[32] Zhongdao Wang, Shengjin Wang, Linkage Based Face Clustering via Graph Convolution Network, CVPR2019, Long Beach, CA, USA, June, 2019.
[33] Yuxuan Zhu, Yali Li, Shengjin Wang, Unsupervised Deep Hashing with Adaptive Feature Learning for Image Retrieval, IEEE Signal Processing Letters, IEEE Signal Processing Letters On page(s): 1—5, 2019. Print ISSN: 1070-9908 Online ISSN: 1558-2361 Digital Object Identifier: 10.1109/LSP.2019.2892233
[34] Jianqiang Wang, Yali Li, Shengjin Wang, A Highly Accurate Feature Fusion Network For Vehicle Detection In Surveillance Scenarios, BMVC2018, September 3, Newcastle, UK.
[35] Yifan Sun, Liang Zheng, Shengjin Wang, Beyond Part Models: Person Retrieval with Refined Part Pooling, ECCV2018, September, 2018. Munich, Germany.
[36] Qin Xu, Yifan Sun, Yali Li, Shengjin Wang, Improving Deep Representations with Feature Alignment Layer for Person Retrieval, ICPR2018, August 2018. (Best Paper Award)
[37] Lingxiao Wang, Yali Li, Shengjin Wang, Feature Learning For One-Shot Face Recognition, ICIP2018, October 7-10, 2018, Athens, Greece.
[38] Jingchun Cheng, Shengjin Wang, Ming-Hsuan Yang, Fast and Accurate Online Video Object Segmentation via Tracking Parts, CVPR2018, Jun 19, 2018 - Jun 21, 2018, Salt Lake City, USA
[39] Shu Han, Chen Dangdang, Li Yali, Wang Shengjin. A highly accurate facial region network for unconstrained face detection[C]// Image Processing(ICIP), 2017 IEEE International Conference on. IEEE, 2017:665-669.
[40] Dangdang Chen, Lanqing He, Shengming Yu, and Shengjin Wang. An Efficient and Accurate Face Verification Method Based on CNN Cascade Architeture. Proc of CAAI, 2017: 534-540.
[41] Jingchun Cheng, Shengjin Wang, Ming-Hsuan Yang, SegFlow: Joint Learning for Video Object Segmentation and Optical Flow, ICCV2017, Venice, Italy, Oct. 2017.
[42] Yifan Sun, Liang Zheng, Shengjin Wang, SVDNet for Pedestrian Retrieval, ICCV2017, Venice, Italy, Oct. 2017. Spotlight.
[43] Zhongdao Wang, Luming Tang, Xihui Liu, Zhuliang Yao, Shuai Yi, Jing Shao, Junjie Yan,Shengjin Wang, Hongsheng Li, Xiaogang Wang, Orientation Invariant Feature Embedding and Spatial Temporal Re-ranking for Vehicle Re-identification, ICCV2017, Venice, Italy, Oct. 2017.
[44] Jingchun Cheng, Sifei Liu, Yi-Hsuan Tsai, Wei-Chih Hung, Shalini De Mello, Jinwei Gu, Jan Kautz, Shengjin Wang, Ming-Hsuan Yang, Learning to Segment Instances in Videos with Spatial Propagation Network, The 2017 DAVIS Challengeon Video Object Segmentation - CVPR 2017 Workshops. Win 6th Place Award.
[45] Ziqiong Liu, Shengjin Wang, Qi Tian, Robust ImageGraph: Rank-Level Feature Fusion for Image Search, IEEE Transactions on Image Processing, pp. 3128-3141, Volume: 26, No.7, 2017.(SCI).
[46] Ruijie Yan, Liangrui Peng, Shanyu Xiao, Gang Yao, Primitive Representation Learning for Scene Text Recognition, CVPR 2021, 284-293
[47] Shanyu Xiao, Liangrui Peng, Ruijie Yan, Keyu An, Gang Yao, Jaesik Min, Sequential Deformation for Accurate Scene Text Detection. ECCV 2020, LNCS, volume 12374, 108-124
[48] Shanyu Xiao&, Liangrui Peng, Ruijie Yan&, Shengjin Wang, Deep Network with Pixel-Level Rectification and Robust Training for Handwriting Recognition, ICDAR 2019, 9-16. (ICDAR 2019 Best Student Paper Runner-Up Award)
[49]Zhaopeng Dou, Zhongdao Wang, Yali Li, Shengjin Wang, Identity-Seeking Self-Supervised Representation Learning for Generalizable Person Re-identification, ICCV2023. (Oral)
[50]Yue Zheng, Yali Li, Shengjin Wang, DivCon: Learning Concept Sequences for Semantically Diverse Image Captioning, ICASSP2023. (Oral)
[51]Peiyuan Zhi, Yali Li, Kaiyue Zhou, Shengjin Wang, Feature Decoupling And Uncertainty Estimation For 3d Object Detection, ICME 2023
[52]Zhenyu Wang, Yali Li, Xi Chen Ser-Nam Lim, Antonio Torralba, Hengshuang Zhao, Shengjin Wang, Detecting Everything in the OpenWorld: Towards Universal Object Detection, CVPR2023
[53]Yixuan Fan, Zhaopeng Dou, Yali Li and Shengjin Wang, Portrait Interpretation and a Benchmark, ICCPR2022
[54]Xin Liu, Yali Li, Shengjin Wang, Self-Supervised Learning via Maximum Entropy Coding, NeurIPS2022
[55]Yue Zheng, Yali Li, Shengjin Wang, Polishing Network for Decoding of Higher-Quality Diverse Image Captions, BMVC2022
[56] Yifan Liu, Yali Li, Shengjin Wang, Disentangling based Environment-Robust Feature Learning for Person ReID, BMVC2022
[57]Shijie Rao, Yidong Huang, Kaiyu Cui, and Yali Li*, Anti-spoofing face recognition using a metasurface-based snapshot hyperspectral image sensor, Optica Vol. 9, Issue 11, pp. 1253-1259 (2022) https://doi.org/10.1364/OPTICA.469653
[58]Zhaopeng Dou, Yali Li, Shengjin Wang, Reliability-Aware Prediction via Uncertainty Learning for Person Image Retrieval, ECCV2022
[59]Xinliu, Yali Li, Shengjin Wang, GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs, ECCV2022
[60]Jintao Xu, Yali Li*, Shengjin Wang. AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large Scenes. IEEE Transactions on Multimedia. 2022
[61]Zhengshuai Wang, Jianqiang Wang, Yali Li, Shengjin Wang, Traffic Sign Recognition with Lightweight Two-Stage Model in Complex Scenes, IEEE Transactions on Intelligent Transportation Systems, Volume: 23, Issue: 2, On Page(s): 1121-1131, Publication Date: FEBRUARY 2022. Print ISSN: 1524-9050, Online ISSN: 1558-0016, Digital Object Identifier: 10.1109/TITS.2020.3020556
[62]Yali Li, Shengjin Wang, R(Det)$^2$: Randomized Decision Routing for Object Detection, CVPR2022, June 21 – 24, 2022, New Orleans, Louisiana, USA
[63]Zhenyu Wang, Yali Li, Shengjin Wang, Noisy Boundaries: Lemon or Lemonade for Semi-supervised Instance Segmentation?, CVPR2022, June 21 – 24, 2022, New Orleans, Louisiana, USA
[64] Dongchen Lu, Dongmei Li, Yali Li, Shengjin Wang, OSKDet: Orientation-sensitive Keypoint Localization for Rotated Object Detection, CVPR2022, June 21 – 24, 2022, New Orleans, Louisiana, USA
[65]Yali Li, Shengjin Wang, BooDet: Gradient Boosting Object Detection with Additive Learning Based Prediction Aggregation, IEEE Trans. On TIP, 2022, 31, 2620-2632
[66]Zhaopeng Dou, Zhongdao Wang, Yali Li, Shengjin Wang, PROGRESSIVE-GRANULARITY RETRIEVAL VIA HIERARCHICAL FEATURE ALIGNMENT FOR PERSON RE-IDENTIFICATION, ICASSP2022, May 22-27, Singapore
[67]Jian Han, Yali Li, Shengjin Wang, FEW-SHOT OBJECT DETECTION WITH LOCAL CORRESPONDENCE RPN AND ATTENTIVE HEAD, ICASSP2022, May 22-27, Singapore
[68]Han Wang, Yali Li, Shengjin Wang, CRPN: DISTINGUISH NOVEL CATEGORIES VIA CLASS-RELEVANT REGION PROPOSAL NETWORK FOR FEW-SHOT OBJECT DETECTION, ICASSP2022, May 22-27, Singapore
[69]Yuhao Lu, Yali Li, Shengjin Wang, Hybrid Physical Metric For 6-DoF Grasp Pose Detection, ICRA2022, May 23-27, 2022, Philadelphia PA, United States
[70]Yunzhong Hou, Zhongdao Wang, Shengjin Wang, Liang Zheng. Adaptive Affinity for Associations in Multi-Target Multi-Camera Tracking, Journal: IEEE Transactions on Image Processing, Publication Date: 2022, Volume: 31, On Page(s): 612-622, Print ISSN: 1057-7149, Online ISSN: 1941-0042, Digital Object Identifier: 10.1109/TIP.2021.3131936
[71]Jian Han, Yali Li, Shengjin Wang, Delving into Probabilistic Uncertainty for Unsupervised Domain Adaptive Person Re-Identification, AAAI2022, Feb.22-March 1, 2022, Virtual
[72]Zhongdao Wang, Yali Li, Shengjin Wang, Do Different Tracking Tasks Require Different Appearance Models?, NIPS2021
[73]Zhenyu Wang, Yali Li, Sehngjin Wang, Combating Noisy Proposals for Semi-supervised Object Detection, NIPS2021
[74]Zhang, Jinzhi; ji, mengqi; Wang, Guangyu; Zhiwei, Xue; Wang, Shengjin; FANG, Lu, SurRF: Unsupervised Multi-view Stereopsis by Learning Surface Radiance Field, PAMI, 2021
[75]Zhengyue, Yali Li, Shengjin Wang. “DivCon: Learning Concept Sequences for Semantically Diverse Image Captioning”;IEEE ICASSP2023, Oral
[76]Zhaopeng Dou, Zhongdao Wang, Yali Li, Shengjin Wang, Identity-Seeking Self-Supervised Representation Learning for Generalizable Person Re-identification, ICCV2023, Oral
[77]Yuhao Lu, Yixuan Fan, Beixing Deng, Fangfu Liu, Yali Li and Shengjin Wang. " VL-Grasp: a 6-Dof Interactive Grasp Policy for Language-Oriented Objects in Cluttered Indoor Scenes." 2023 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) in Detroit, US. IEEE, 2023
[78]Yixuan Fan, Xin Liu, Yali Li and Shengjin Wang. "Look Before You Drive: Boosting Trajectory Forecasting via Imagining Future." 2023 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) in Detroit, US. IEEE, 2023
[79]Zhenyu Wang, Yali Li, Xi Chen, Hengshuang Zhao, Shengjin Wang, Uni3DETR: Unified 3D Detection Transformer, NeurIPS2023, December 8-16, 2023, New Orleans, the USA
[80]Jintao Xu, Yali Li*, Shengjin Wang. AdaZoom: Towards scale-aware large scene object detection. IEEE Transactions on Multimedia. 25: 4598-4609, 2023. DOI: 10.1109/TMM.2022.3178871
[81]Zhongdao Wang, Jinglu Wang, Yali Li, Yan Lu, Shengjin Wang. Unsupervised Temporal Correspondence Learning for Unified Video Object Removal. IEEE Transactions on Image Processing (accepted)
[82]Yujun Cheng, Zhewei Zhang, Shengjin Wang, Fed-SDS: Adaptive Structured Dynamic Sparsity for Federated Learning under Heterogeneous Clients, ICASSP2024, April 14-19, 2024, Seoul, Korea
[83]Yujun Cheng, Zhewei Zhang, Shengjin Wang, RCIF: Towards Robust Distributed DNN Collaborative Inference under Highly Lossy Networks, ICASSP2024, April 14-19, 2024, Seoul, Korea
[84]Yali Li, Shengjin Wang, BooDet: Gradient Boosting Object Detection with Additive Learning Based Prediction Aggregation, IEEE Trans. On TIP, 2022, 31, 2620-2632.
[85]Dongchen Lu, Dongmei Li, Yali Li, Shengjin Wang, OSKDet: Orientation-sensitive Keypoint Localization for Rotated Object Detection, CVPR2022, June 21 – 24, 2022, New Orleans, Louisiana, USA
[86]Zhenyu Wang, Yali Li, Shengjin Wang, Noisy Boundaries: Lemon or Lemonade for Semi-supervised Instance Segmentation?, CVPR2022, June 21 – 24, 2022, New Orleans, Louisiana, USA
[87]Yali Li, Shengjin Wang, R(Det)$^2$: Randomized Decision Routing for Object Detection, CVPR2022, June 21 – 24, 2022, New Orleans, Louisiana, USA
[88]Zhengshuai Wang, Jianqiang Wang, Yali Li, Shengjin Wang, Traffic Sign Recognition with Lightweight Two-Stage Model in Complex Scenes, IEEE Transactions on Intelligent Transportation Systems, Volume: 23, Issue: 2, On Page(s): 1121-1131, Publication Date: FEBRUARY 2022. Print ISSN: 1524-9050, Online ISSN: 1558-0016, Digital Object Identifier: 10.1109/TITS.2020.3020556.
[89]Jintao Xu, Yali Li*, Shengjin Wang. AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large Scenes. IEEE Transactions on Multimedia. 2022.
[90]Xinliu, Yali Li, Shengjin Wang, GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs, ECCV2022
[91]Zhaopeng Dou, Yali Li, Shengjin Wang, Reliability-Aware Prediction via Uncertainty Learning for Person Image Retrieval, ECCV2022
[92]Shijie Rao, Yidong Huang, Kaiyu Cui, and Yali Li*, Anti-spoofing face recognition using a metasurface-based snapshot hyperspectral image sensor, Optica Vol. 9, Issue 11, pp. 1253-1259 (2022) https://doi.org/10.1364/OPTICA.469653
[93]Yifan Liu, Yali Li, Shengjin Wang, Disentangling based Environment-Robust Feature Learning for Person ReID, BMVC2022
[94]Yue Zheng, Yali Li, Shengjin Wang, Polishing Network for Decoding of Higher-Quality Diverse Image Captions, BMVC2022.
[95]Xin Liu, Yali Li, Shengjin Wang, Self-Supervised Learning via Maximum Entropy Coding, NeurIPS2022. Spotlight
[96]Yixuan Fan, Zhaopeng Dou, Yali Li and Shengjin Wang, Portrait Interpretation and a Benchmark, International Conference on Computing and Pattern Recognition 2022 (ICCPR2022). Best oral presentation
[97]Shengming Yu, Shengjin Wang, Consistency Mean-Teaching for Unsupervised Domain Adaptive Person Re-identification, ICIGP2022, 获Best Paper Award
[98] Zhenyu Wang, Yali Li1, Xi Chen Ser-Nam Lim, Antonio Torralba, Hengshuang Zhao, Shengjin Wang, Detecting Everything in the OpenWorld: Towards Universal
[99]Zhengyue, Yali Li, Shengjin Wang. “DivCon: Learning Concept Sequences for Semantically Diverse Image Captioning”. IEEE ICASSP2023, Oral, June 4-9, 2023,Rhodes Island, Greece.
[100]王生进,豆朝鹏,樊懿轩,李亚利,ReID2.0:从行人再识别走向人像态势计算,中国图象图形学报,28(05):1326-1345,2023)[DOI:10. 11834/jig. 220700],文章编号:1006-8961(2023)05-1326-20.
[101]Zhaopeng Dou, Zhongdao Wang, Yali Li, Shengjin Wang, Identity-Seeking Self-Supervised Representation Learning for Generalizable Person Re-identification, ICCV2023, Oral, October 2-6, 2023, Paris, France.
[102]Yuhao Lu, Yixuan Fan, Beixing Deng, Fangfu Liu, Yali Li and Shengjin Wang. " VL-Grasp: a 6-Dof Interactive Grasp Policy for Language-Oriented Objects in Cluttered Indoor Scenes." 2023 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) in Detroit, US. IEEE, 2023.
[103]Yixuan Fan, Xin Liu, Yali Li and Shengjin Wang. "Look Before You Drive: Boosting Trajectory Forecasting via Imagining Future." 2023 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) in Detroit, US. IEEE, 2023
[104]Zhenyu Wang, Yali Li, Xi Chen, Hengshuang Zhao, Shengjin Wang, Uni3DETR: Unified 3D Detection Transformer, NeurIPS2023, December 8-16, 2023, New Orleans, the USA
[105]Jintao Xu, Yali Li*, Shengjin Wang. AdaZoom: Towards scale-aware large scene object detection. IEEE Transactions on Multimedia. 25: 4598-4609, 2023. DOI: 10.1109/TMM.2022.3178871
[106]Zhongdao Wang, Jinglu Wang, Yali Li, Yan Lu, Shengjin Wang. Unsupervised Temporal Correspondence Learning for Unified Video Object Removal. IEEE Transactions on Image Processing (accepted)
[107]Yujun Cheng, Zhewei Zhang, Shengjin Wang, Fed-SDS: Adaptive Structured Dynamic Sparsity for Federated Learning under Heterogeneous Clients, ICASSP2024, April 14-19, 2024, Seoul, Korea
[108]Yujun Cheng, Zhewei Zhang, Shengjin Wang, RCIF: Towards Robust Distributed DNN Collaborative Inference under Highly Lossy Networks, ICASSP2024, April 14-19, 2024, Seoul, Korea
[109] Liang Zheng, Shengjin Wang, Liyue Shen, Lu Tian, Qi Tian, S Scalable Person Re-identification: A Benchmark, ICCV2015, Santiago, Chile, Dec.2015, Accepted
[110] Xu Zhang, Felix Xinnan Yu, Ruiqi Guo, Sanjiv Kumar, Shengjin Wang, Shih-Fu Chang, Fast Orthogonal Projection Based on Kronecker Product, ICCV2015, Santiago, Chile, Dec.2015, Accepted
[111] Ziqiong Liu, Shengjin Wang, Qi Tian, Fine-residual VLAD for image retrieval, Neurocomputing, 2015, Accepted
[112] Dong Li, Yali Li, Shengjin Wang, Selective Parts for Fine-Grained Recognition, In Proceedings of International Conference on Image Processing (ICIP2015), Quebec, Canada, Sept. 2015, will be published.
[113] Taiqing Wang, Shaogang Gong, Xiatian Zhu,Shengjin Wang, Re-Identification by Discriminative Selection in Video Ranking, IEEE Transactions on Pattern Recognition and Machine Intelligence, 2015, submitted to PAMI 2014 (Now Major)
[114] Yali Li, Shengjin Wang, Qi Tian, Xiaoqing Ding, A Boosting Approach to Exploit Instance Correlations for Multi-Instance Classification, IEEE Transactions on Neural Networks and Learning Systems, 2015 (Accepted)
[115] Yali Li, Shengjin Wang, Qi Tian, Xiaoqing Ding, Feature representation for statistical learning based object detection: a review, Pattern Recognition, pp.3542-3559, vol.48, 2015
[116] Yali Li, Shengjin Wang, Qi Tian, Xiaoqing Ding, A survey of recent advances in visual feature detection, Neurocomputing, Pages 736–751, Volume 149, Part B, 3 February 2015
[117] Lu Tian, Shengjin Wang, Person Re-identification as Image Retrieval Using Bag of Ensemble Colors, IEICE Transactions on Information and Systems, Vol.E98-D,No.1,pp. 180-188, Jan. 2015 (SCI)
[118] Liang Zheng, Shengjin Wang, Lu Tian, Fei He, and Qi Tian, "Black Sheep Out: Query Adaptive Fusion for Image Search and Person Re-identification", International Conference on Computer Vision and Pattern Recognition (CVPR2015), pp. 1741-1750, in Boston, USA, June, 2015.
[119] Xu Zhang, Fei He, Lu Tian, Shengjin Wang, Cognitive Pedestrian Detector: Adapting Detector to Specific Scene by Transferring Attributes, Neurocomputing, Pages 800-810, Volume 149, Part B, 3 February 2015
[120] Jie Liu, Shengjin Wang, Salient Region Detection via Simple Local and Global Contrast Representation, Neurocomputing, Pages 435-443, Volume 147, 5 January 2015
[121] Fei He and Shengjin Wang, Beyond χ2 Difference: Learning Optimal Metric for Boundary Detection, IEEE Signal Processing Letters, Vol 22, No. 1, pp. 40-44, Jan. 2015
[122] Yali Li, Shengjin Wang, Qi Tian, Xiaoqing Ding, Learning Cascaded Shared-Boost Classifiers for Part-based Object Detection, IEEE Transactions on Image Processing, pp.1858-1871,Volume:23,No.4, 2014. DOI: 10.1109/ TIP.2014.2307432(SCI)
[123] Taiqing Wang, Shaogang Gong, Shengjin Wang, Discriminative Video Matching for Person Re-Identication, European Conference on Computer Vision (ECCV2014), September 8-12, 2014, pp.688-703, Zurich, Switzerland.
[124] Zheng L, Wang S, Liu Z, Tian Q. Fast Image Retrieval: Query Pruning and Early Termination. IEEE Transactions on Multimedia, 2014, 17(5): 648-659. (SCI源刊,影响因子1.776)
[125] Liang Zheng, Shengjin Wang, Peizhen Guo, Hanyue Liang, and Qi Tian, Tensor Index for Large Scale Image Retrieval, Multimedia Systems, Oct. 2014 (SCI源刊,影响因子0.443;EI收录,检索号:20144300116846)
[126] Ziqiong Liu, Shengjin Wang, Liang Zheng, Qi Tian, Visual Reranking with improved image graph, ICASSP2014(International Conference On Acoustics Speech and Signal Processing), IEEE catalog number: CFP14ICA-USB,pp.6939-6943,4-9 May 2014 in Florence, Italy. ISBN: 978-1-4799-2892-7
[127] Liang Zheng, Shengjin Wang, and Qi Tian, Lp-norm IDF for Scalable Image Retrieval, IEEE Transactions on Image Processing, Vol 23, No. 8, pp. 3604-3617, June, 2014.
[128] Liang Zheng, Shengjin Wang, and Qi Tian, Coupled Binary Embedding for Scalable Image Retrieval, IEEE Transactions on Image Processing, Vol 23, No. 8, pp. 3368-3380, June, 2014.
[129] Yuan LIN, Shengjin Wang, Pose-free Face Swapping Based on a Deformable 3D Shape Morphable Model, IEICE Transactions on Information and Systems, pp. 305-314,Vol.E97-D,No.2, Feb. 2014 (SCI)
[130] Taiqing Wang, Shengjin Wang, Xiaoqing Ding,Detecting Human Action as Spatio-Temporal Tube of Maximum Mutual Information,IEEE Transactions on Circuits and Systems for Video Technology, pp.277-290, Vol.24, No.2, 2014, DOI:10.1109/TCSVT.2013.2276856 (SCI)
[131] Liang Zheng, Shengjin Wang, Ziqiong Liu, Qi Tian,Packing and Padding: Coupled Multi-index for Accurate Image Retrieval, CVPR2014, pp. 1947-1954, in Columbus, Ohio, USA, June, 2014
[132] Liang Zheng, Shengjin Wang, Ziqiong Liu, Qi Tian,Bayes Merging of Multiple Vocabularies for Scalable Image Retrieval, CVPR2014, pp. 1963-1970, in Columbus, Ohio, USA, June, 2014
[133] Liang Zheng, Shengjin Wang, Ziqiong Liu, Qi Tian. Lp-norm IDF for large scale image search. IEEE Conference on Computer Vision and Pattern Recognition (CVPR2013), pp. 1626-1633, June 23-28, 2013,Portland, OR, United states, EI 20134616982674
[134] Liang Zheng, Shengjin Wang. Visual phraselet: refining spatial constraints for large scale image search. IEEE Signal Processing Letters, Vol. 20, No. 4, pp. 391-394, April, 2013.
[135] Gu Junxia, Ding Xiaoqing, Wang Shengjin, Wu Youshou. Action and gait recognition from recovered 3D human joints. IEEE Transactions on Systems, Man, and Cybernetics, Part B,Vol.40, No.4, pp.1021-1033, August, 2010 (SCI源刊). SCI 656PJ
[136] Yali Li, Shengjin Wang, and Xiaoqing Ding, Person-Independent Head Pose Estimation Based On Random Forrest Regression. In Proceedings of International Conference on Image Processing (ICIP2010), pp.1521-1524, September 26-29, 2010, Hong Kong. EI 20110213575002, Inspec 11690716
[137] Yali Li, Shengjin Wang, Xiaoqing Ding, Eye/eyes tracking based on a unified deformable template and particle filtering, Pattern Recognition Letters, Volume: 31, Issue: 11, pp.1377-1387, AUG 2010 . SCI: 000279834800018, or SCI: IDS Number: 624QO。SCI 624QO
[138] Yun Lei, Xiaoqing Ding, and Shengjin Wang. Visual Tracker Using Sequential Bayesian Learning: Discriminative, Generative and Hybrid, IEEE Trans. on Systems, Man And Cybernetics-Part B, Vol.38, No.6, pp.1578-1591, December, 2008。SCI 378GZ
[139]WANGShengjin,HUBin,DINGXiaoqing,LIYali, Eye FeatureExtractionBasedon Modified ParabolicHough Transform,Journal o fTsinghua Univ(Sci&.Tech).2010.pp.101-104,Vol.50,No.1
[140]XuanZhao,ShengjinWang,andXiaoqingDing,“ADynamic Generating GraphicalModelfor Point-SetsMatching,”Applied MathematicsandComputation(AMC),vol.185,issue2,pp.1109-1119,15Feb.2007,Elsevier.ISSN0096-3003
[141]ShengjinWang,YaolinTan,JunZhou,TaoWuandWeiLin,CollaborativeMRWorkspacewithShared3DVisionBasedonStereoVideoTransmission,SceneReconstruction,PoseEstimationandTracking,I-TechEducationandPublishing,Vienna,Austria,pp.133-154,June2007
[142]WenhaoLu,ShengjinWang,XiaoqingDing,Partdetection,descriptionandselectionbasedonhiddenconditionalrandomfields,accepted,willbepublishedinICPR2010.
[143]ChenhuiZhou,ShengjinWang,XiaoqingDing,HumanDetectionBasedonFusionofHistogramsofOrientedGradientsandMainPartialFeatures,inproceedingsofCISP2009,pp.1066-1070.
[144]TaoWu,XiaoqingDing,ShengjinWang,VideoObjectTrackingusingImprovedChamferMatchingandCondensationParticleFilter,ImageProcessing:MachineVisionApplications,SPIE2008,ImageProcessing:MachineVisionApplications,2008,681304-681304-10 (2008).SanJose Marriottand SanJose Convention Center,SanJose,California,USA,Jan27-31,2008
[145]TaoWu,XiaoqingDing,ShengjinWang,VideoTrackingusingImprovedChamferMatchingandParticleFilter,InternationalConferenceonComputationalIntelligenceandMultimediaApplications2007,(ICCIMA2007),Vol.3,Pages169-173,2007。Mepco Schlenk Engineering College,Sivakasi,Tamilnadu,India,Dec13-15,2007
[146]ZhiZeng,ShengjinWang,andXiaoqingDing,“Real-timevehicledetectionandtracking based on trafficsceneanalysis,”Proc.ofSPIE-IS&TElectronicImaging,SPIEVol.6503.MachineVisionApplicationsinIndustrialInspectionXV,pp.65030M-1-65030M-9,Feb.17,2007
[147]XuJian,DingXiaoqing,Wang,Shengjin;Wu,Youshou,“Multi-viewmovinghumandetectionandcorrespondencebasedonobjectoccupancyrandomfield”,4thInternationalSymposiumonNeuralNetworks(ISNN2007),LectureNotesinComputerScience,Jun,2007,Vol.4493,pp.1033-1042
[148]LeiYun,DingXiaoqing,WangShengjin,“Adaptivesparsevector trackingviaonline Bayesianlearning”,IWICPA2006,LectureNotesinComputerScience,Vol.4153LNCS,pp.35-45,2006,Xian,CHINA
[149]ZhiZeng,ShengjinWang,andXiaoqingDing,“Object Detectionvia Fusionof Global Classifierand Part-BasedClassifier,”International Symposiumon NeuralNetworks2006,LNCS,2006,3972:429-435.
[150]YunLei,XiaoqingDing,and ShengjinWang,“AdaBoost Tracker Embeddedin Adaptive Particle Filtering,”ProceedingsofICPR2006,vol.4,pp.939–943,Hongkong,Aug.2006
[151]ShengjinWang,YaolinTan,andXiaoqingDing,“AFramework of Collaborative Workspace Basedon Multi-StereoVisionandSharedMixedReality,”ProceedingsofEdutainment’2006,LNCS,Volume3942/2006,DOI:10.1007/11736639_146,pp.1161–1170,LNCS,ISBN:3-540-33423-8SCI:BEM03,EI:062910004939,ISTP:BEM03
中文期刊论文:
[1]张永飞, 杨航远, 张雨佳, 豆朝鹏, 廖胜才, 郑伟诗, 张史梁, 叶茫, 晏轶超, 李俊杰, 王生进. 行人再识别技术研究进展[J]. 中国图象图形学报, 2023, 28 (06): 1829-1862.
[2]王生进 , 豆朝鹏 , 樊懿轩 , 李亚利 . ReID2.0:从行人再识别走向人像态势计算[J]. 中国图象图形学报, 2023, 28 (05): 1326-1345.
[3]苏光大, 王生进. GB/T 41786-2022《公共安全 生物特征识别 术语》国家标准解读[J]. 中国安全防范技术与应用, 2023, (01): 26-30.
[4]吴晓雨, 蒲禹江, 王生进, 刘子豪. 基于语义嵌入学习的特类视频识别[J]. 电子学报, 2023, 51 (11): 3225-3237.
[5]刘祎璠, 王生进, 赵军, 张来清, 杨旭. 基于自主AI芯片的多算法融合应用全流程处理效率优化及实战应用[J]. 中国安全防范技术与应用, 2021, (06): 14-19.
[6]罗常伟, 於俊, 于灵云, 李亚利, 王生进. 三维人脸识别研究进展综述[J]. 清华大学学报(自然科学版), 2021, 61 (01): 77-88.
[7]刘宏马, 王生进. 基于匹配滤波器和度量学习的脑电信号分类[J]. 清华大学学报(自然科学版), 2021, 61 (03): 248-253.
[8]吴晓雨, 顾超男, 王生进. 多模态特征融合与多任务学习的特种视频分类[J]. 光学精密工程, 2020, 28 (05): 1177-1186.
[9]李晓斌, 江碧涛, 王生进. 光学遥感图像场景分类技术综述和比较[J]. 无线电工程, 2019, 49 (04): 265-271.
[10]杨毅, 颜历, 王生进, 乔飞. 基于媒体认知课程的人工智能人才培养方法探索[J]. 计算机教育, 2018, (06): 163-166.
[11]康凯, 王重道, 王生进, 范英. 面向人口信息人像比对应用的人像比对算法研究[J]. 信息网络安全, 2017, (12): 80-84.
[12]王生进. 计算机视觉的发展之路[J]. 人工智能, 2017, (06): 8-13.
[13]杨毅, 钟娴, 乔飞, 王生进, 丁文浩. 媒体认知课程中的智能感知技术教学方法探究[J]. 计算机教育, 2017, (09): 180-182.
[14]杨毅, 钟娴, 周天宇, 乔飞, 王生进. 媒体认知中的人工智能技术教学方法探究[J]. 计算机教育, 2017, (07): 155-158.
[15]刘杰, 王生进. 基于边界扩展的图像显著区域检测[J]. 清华大学学报(自然科学版), 2017, 57 (01): 72-78.
[16]杨毅, 钟娴, 徐淑正, 乔飞, 王生进. 媒体认知中的感知计算教学方法及平台建设研究[J]. 计算机教育, 2016, (12): 159-162.
[17]张旭, 王生进. 基于自然语言处理的特定属性物体检测[J]. 清华大学学报(自然科学版), 2016, 56 (11): 1137-1142.
[18]刘杰, 王生进. 融合聚类与排序的图像显著区域检测[J]. 清华大学学报(自然科学版), 2016, 56 (09): 913-919.
[19]何友, 朱扬勇, 赵鹏, 柴勇, 廖志成, 周伟, 周向东, 王海鹏, 汪卫, 熊赟, 许舟军, 彭煊, 孟晖, 王生进. 国防大数据概论[J]. 系统工程与电子技术, 2016, 38 (06): 1300-1305.
[20]杨毅, 徐淑正, 乔飞, 王靖淇, 王生进. 媒体认知实验教学理念与实践研究[J]. 计算机教育, 2015, (15): 108-110.
[21]杨毅, 徐淑正, 乔飞, 王靖淇, 王生进. 媒体认知实验教学改革研究与探索[J]. 计算机教育, 2015, (09): 107-109.
[22]王泰青, 王生进. 基于中层时空特征的人体行为识别[J]. 中国图象图形学报, 2015, 20 (04): 520-526.
[23]杨毅, 徐淑正, 乔飞, 王靖淇, 王生进. 媒体认知实验课程改革与实践[J]. 计算机教育, 2015, (05): 103-106.
[24]熊祺, 张旭, 王生进. 基于两级时空随机取样的背景建模算法[J]. 航天医学与医学工程, 2014, 27 (02): 107-112.
[25]林源, 梁舒, 王生进. 基于非刚性ICP的三维人脸数据配准算法[J]. 清华大学学报(自然科学版), 2014, 54 (03): 334-340.
[26]鹿文浩, 王生进. 鲁棒的车载摄像头对向车辆检测与跟踪方法[J]. 清华大学学报(自然科学版), 2013, 53 (11): 1509-1514.
[27]张旭, 李亚利, 陈晨, 王生进, 丁晓青. 嵌入式驾驶员状态检测算法的实现与优化[J]. 自动化学报, 2012, 38 (12): 2014-2022.
[28]王泰青, 王生进, 丁晓青. 基于最大互信息区域跟踪的人体行为检测算法[J]. 自动化学报, 2012, 38 (12): 2023-2031.
[29]林源, 桂良琰, 王生进, 丁晓青. 基于真实感三维头重建的人脸替换[J]. 清华大学学报(自然科学版), 2012, 52 (05): 602-606.
[30]鹿文浩, 李亚利, 王生进, 丁晓青. 基于部件的三维目标检测算法新进展[J]. 自动化学报, 2012, 38 (04): 497-506.
[31]何飞, 李亚利, 鹿文浩, 王生进, 丁晓青. 多方向线积分的梯度特征[J]. 中国图象图形学报, 2011, 16 (12): 2217-2222.
[32]林源, 林茜, 汤锋, 唐亮, 王生进. 匹配图像与3维模型特征点的真实感3维头重建[J]. 中国图象图形学报, 2011, 16 (10): 1876-1882.
[33]熊斌, 丁晓青, 王生进. 基于三维模型的前视红外目标匹配识别方法[J]. 激光与红外, 2011, 41 (03): 344-350.
[34]周晨卉, 王生进, 丁晓青. 基于局部特征级联分类器和模板匹配的行人检测[J]. 中国图象图形学报, 2010, 15 (05): 824-829.
[35]谷军霞, 丁晓青, 王生进. 基于人体行为3D模型的2D行为识别[J]. 自动化学报, 2010, 36 (01): 46-53.
[36]李亚利, 王生进, 胡斌, 丁晓青. 基于改进型抛物线Hough变换的眼睛特征提取[J]. 清华大学学报(自然科学版), 2010, 50 (01): 100-103.
[37]胡斌, 王生进, 丁晓青. 基于部位检测和子结构组合的行人检测方法[J]. 计算机科学, 2009, 36 (11): 242-246.
[38]胡斌, 王生进, 丁晓青. 基于云模型的驾驶员驾驶状态评估方法[J]. 清华大学学报(自然科学版), 2009, 49 (10): 1614-1618.
[39]黄文韵, 马惠敏, 王生进. 海面背景红外目标的识别算法[J]. 清华大学学报(自然科学版), 2009, 49 (10): 1609-1613.
[40]胡斌, 王生进, 丁晓青. 基于云模型的驾驶员驾驶状态评估方法[J]. 清华大学学报(自然科学版)网络.预览, 2009, 49 (10): 39-43.
[41]黄文韵, 马惠敏, 王生进. 海面背景红外目标的识别算法[J]. 清华大学学报(自然科学版)网络.预览, 2009, 49 (10): 34-38.
[42]徐剑, 丁晓青, 王生进, 吴佑寿. 一种融合局部纹理和颜色信息的背景减除方法[J]. 自动化学报, 2009, 35 (09): 1145-1150.
[43]徐剑, 丁晓青, 王生进, 吴佑寿. 多视角多行人目标检测、定位与对应算法[J]. 清华大学学报(自然科学版), 2009, 49 (08): 1139-1143.
[44]徐剑, 丁晓青, 王生进, 吴佑寿. 多视角多行人目标检测、定位与对应算法[J]. 清华大学学报(自然科学版)网络.预览, 2009, 49 (08): 1139-1143.
[45]张应丽, 王建华, 王生进. 驾驶员面部特征点定位方法研究[J]. 北京机械工业学院学报, 2009, 24 (01): 4-7.
[46]谷军霞, 丁晓青, 王生进. 行为分析算法综述[J]. 中国图象图形学报, 2009, 14 (03): 377-387.
[47]包英泽, 王生进, 何飞. 基于聚集疑似目标的快速TBD弱小多目标检测方法[J]. 激光与红外, 2008, (11): 1136-1140+1148.
[48]张洁颖, 王生进, 丁晓青. 基于视频图像处理的交通流检测系统[J]. 电视技术, 2008, (06): 68-70+92.
[49]徐剑, 丁晓青, 王生进. 基于目标存在概率场的多视角运动目标检测与对应算法[J]. 自动化学报, 2008, (05): 609-612.
[50]谷军霞, 丁晓青, 王生进. 基于半监督聚类的3维肢体分割算法[J]. 中国图象图形学报, 2008, (03): 558-565.
[51]李同治, 丁晓青, 王生进. 利用级联SVM的人体检测方法[J]. 中国图象图形学报, 2008, (03): 566-570.
曹[52]雷云, 丁晓青, 王生进. 嵌入粒子滤波中的AdaBoost跟踪器[J]. 清华大学学报(自然科学版), 2007, (07): 1141-1143.[52] 王生进 高临场感空间的实现——从虚拟现实走向复合现实 中国教育网络 2007-03-05
[53]赵炫, 王生进, 丁晓青. 基于概率图模型技术的柱面全景图生成算法[J]. 清华大学学报(自然科学版), 2006, (07): 1263-1266.
[54]黄英,丁晓青,王生进. 基于Markov随机场的三维物体识别算法[J]. 清华大学学报(自然科学版), 2005, (01): 28-32.
中文会议论文:
[1]林源, 王生进 & 丁晓青. (2010). 基于正交图像的全自动三维头部重建. (eds.) 图像图形技术研究与应用(2010) (pp.247-253).
[2]周晨卉, 王生进 & 丁晓青. (2009). 基于组合特征和AdabOost级联分类器的行人检测. (eds.) 图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集 (pp.163-167).
[3]张洁颖, 王生进 & 丁晓青. (2008). 基于车辆轨迹的车道线检测与划分. (eds.) 图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集 (pp.141-145).
[4]周国强, 王生进 & 丁晓青. (2005). 基于区域质量的JPEG2000图像压缩改进方案. (eds.) 第十二届全国图象图形学学术会议论文集 (pp.67-71).
[5]赵炫, 王生进 & 丁晓青. (2005). 一种应用于特征点匹配的改进图模型算法. (eds.) 第十二届全国图象图形学学术会议论文集 (pp.401-404).
2015年6月19日,由北京图像图形学学会主办,清华大学承办的第十届图像图形技术与应用学术会议,在清华大学电子工程系举行,来自全国各地约200名专家学者参加了大会。
开幕式由大会主席清华大学王生进教授主持,北京图像图形学学会理事长、中科院自动化所谭铁牛院士,代表学会对参会代表表示热烈的欢迎。
会议邀请了7个大会报告和6个专题报告,谭铁牛院士率先做了大会报告《大规模视觉计算》;清华大学王生进教授做了《视频监控中的行人再识别》的大会报告;来自微软亚洲研究院的童欣研究员做了《基于数据驱动的图形图像处理》的大会报告。中科院计算所山世光研究员、北京大学袁晓如教授、公安部一所陈朝武副所长、中山大学赖剑煌院长分别做了《人脸识别技术研究现状与展望》、《城市大数据可视分析》、《视频大数据在社会治安和智慧城市中的应用》、《非线性聚类新方法及其在图像处理中应用》的大会报告。会议精心安排了6个专题报告,清华大学马惠敏、北航梁晓辉、厦门大学纪荣嵘、中国传媒大学杨磊、中山大学赖剑煌 、华南理工大学许勇、 四川大学刘怡光,6位专家分别做了《基于图像认知的心理特征提取》、《基于气象数据的天气现象建模研究》、《图像处理技术在文化科技领域中的应用》、《社交多媒体舆情分析现状与挑战》、《一种用于大规模缺失矩阵低秩分解的随机方法》、《MFS技术及其应用》的专题报告。7名优秀论文作者做了大会报告,其他作者做了海报展示。
精彩丰富的报告和论文作者的现场论文展示,使得本次会议学术交流量大大提高,论文作者和参会学者的进行了热烈的讨论交流。会议还特别安排了与会代表参观清华大学汽车系试验场,电子系大型微波暗室,电子系史馆,清华大学的老师和会议代表在现场进行了更深入的交流。
IGTA会议论文集已连续两年由Springer出版并被EI检索。本届论文收录了50余篇英文论文再次由国际著名出版公司springer 为大会的论文集出版,并提交EI检索。收录的近30篇中文论文,被推荐到5-6家国内著名期刊发表。大会组委会对论文质量严格把关,最后经专家听取论文作者报告,评选出7篇优秀论文,并颁发证书。
本届大会得到了北京市科学技术协会、清华大学电子工程系、中科院、北师大、北航、北理工等理事单位,各省、市图像图形学学会以及北京图像图形学学会各会员单位,Springer出版商的大力支持和鼎立协助。
来源: 北京图像图形学学会 2015-06-26
2015年7月14日,上午8点。华慧视公司在天津市滨海新区清华大学天津电子信息研究院大楼前举行开业典礼,标志着在清华大学天津电子信息研究院这个平台上的第一家公司正式成立。
据悉,在今年5月份,天津市滨海新区、中新天津生态城管委会与清华大学(电子工程系)签署了合作协议,清华大学天津电子信息研究院正式落户中新天津生态城。根据合作计划,清华大学天津电子信息研究院将选址生态城科技园,占地面积约150亩,包含总建筑面积为12万平方米的可独立管理的科研办公楼。
清华大学天津电子信息研究院将在生态城建设国际一流的电子信息技术与产品创新基地、电子信息高新技术企业孵化基地、电子信息行业高端人才创业和培养基地,打造中国电子信息行业科技研发及产业孵化基地。项目将对生态城电子信息产业跨越式发展、科技研发能力显著提升、绿色低碳经济体系升级完善起到巨大的推动作用,使生态城逐步成为高端电子信息产业聚集地。电子信息研究院以及相关落户企业将在5年内,力争吸引超过1000名创业、技术人员进驻;并计划在5年内孵化30余个具有社会影响力的高科技科研成果,地,为生态城带来一批成功孵化的电子信息企业。
清华大学电子工程系是清华大学重点院系之一,是学科全、综合性强的电子信息学科教育和科研机构,拥有众多国内外领先的专利技术,以及国内最优秀的专业人才,在业内拥有丰富的产业资源和巨大的行业影响力。院系设置信息与通信工程、电子科学与技术两个一级学科,六个二级学科,下设六个研究所和一个教学实验中心,拥有院士、教授等百余人的高水平师资团队,多位教授入选长江学者、杰出青年等国家优秀人才计划,研发了数字电视国家标准、文字/人脸识别、光通信技术、太阳能热利用等一大批世界级科研成果。
而华慧视公司正是清华大学电子工程系的研发成果产业化的典型代表。电子工程系和佛山市南海区宏乾电子有限公司合作,计划将电子工程系智能图文信息处理研究室王生进教授研发的人脸识别技术产业化,华慧视公司因此而诞生。智能图文信息处理研究室在人脸识别方面已经有超过十年的研发基础,产生了一大批优秀的科研成果,在很多方面都做到了世界先进水平。正是借助于清华大学天津电子信息研究院这个新成立的平台,这项合作才得以成功。
在开业仪式上,王教授代表清华大学电子工程系向出席仪式的来宾介绍了人脸识别技术的研发现状和未来的前景,介绍了人脸识别技术经过10多年的发展,尤其是近年来的互联网和大数据技术的快速发展对人脸识别技术的推动作用。
华慧视公司的创始人施金佑先生在开业庆典上的发言体现了敏锐的商业触感和独到的眼光,他表示:人脸识别是一个非常有前景的技术,在目前和将来的社会生活中将会有很广泛的应用,这是一个很大的市场。在母校清华大学的支持下,我们很有信心将这项技术推广应用,实现产业化,也会带来极大的社会价值。这项技术已经进入了一个鼎盛发展的阶段,正是这项技术进入产业化阶段的黄金时期,这也解释了为什么最近几年很多的公司和资金都开始进入这个领域。但是凭借着清华大学电子工程系在人脸识别技术方面的多年积累,我们有信心站在这个行业的最前沿,在最先进的领域取得突破。这是清华大学这个伟大的学校赋予华慧视公司的底蕴和使命
来源:清华大学电子工程系
荣誉奖励:
1. “TH-ID人脸和笔迹生物特征身份识别认证系统”,北京市科学技术奖一等,2006
2. “TH-ID人脸和笔迹生物特征身份识别认证系统”,国家科学技术进步奖二等,2008
3. “视频安防监控数字录像设备图像质量评价测试系统”,北京企业评价协会科技创新成果奖,2010
4. 优秀博士论文,中国人工智能学会, 2017
5. 国际模式识别学会ICPR2018最佳论文,2018
6. “跨视域行人再识别的特征学习理论与计算方法研究”,吴文俊人工智能科学技术奖自然科学奖二等,2019
7. “基于智能视频的人体动态特征识别技术与系统”,公安部科学技术奖二等,2019
8. ICPR最佳论文奖,2019
9. 优秀博士论文,中国人工智能学会, 2020
北京市科学技术奖技术发明一等奖,2021
10. Intel室内机器人学习全球挑战赛机器人识别赛道一等奖,2023,2023,4,2023-04-30
——记清华大学电子工程系信息认知与智能系统研究所所长王生进
盛夏的北京,炽烈的阳光炙烤着万物,北京西北郊风景秀丽的清华园里,清华大学电子工程系信息认知与智能系统研究所掩映在一片绿茵之中,没有大都市的繁华和喧嚣,随处可见的是大幅科学家的照片、精致的科研会议海报,淡淡的学术气息弥散在四周,连空气中都蔓延着创造和梦想的味道。叩开该所智能图文信息处理研究室的门,迎接我们的正是今天的主角,清华大学电子工程系教授、博导,安防专家王生进。
从一个负笈东瀛求学的青年,一步步成长为安防领域的知名专家,对一个坚定的行走者意味着很多;从求学、治学到授学,对一个执著的探索者也不只是时间的概念。从回国初期的种种不易,到现在的科研教学齐飞,无论是王生进还是信息认知与智能系统研究所都走过了一条“行稳致远”的道路。
选择科研开始不懈的攀登
“1985年在清华大学获工学学士学位、1997年在东京工业大学获工学博士学位。1997-2003年在日本NEC互联网系统研究所任研究员,2003年10月回到清华大学任教。主要从事计算机视觉和视频图像模式识别、多媒体信息处理领域基础研究。现任清华大学电子工程系信息认知与智能系统研究所所长,清华大学信研院汽车电子实验室副主任。并担任清华大学电子工程系学术委员会委员。”短短的简历背后,是一条令人艳羡的成长轨迹,更是一条不断攀登科研高峰的路途。
在日本获得工学博士学位之后,王生进到日本NEC公司工作了五年,主要从事多媒体、信息处理方面的研究和技术开发。出国愈久,回归的念头愈强烈。2003年,王生进主动联系了清华大学洽谈回国事宜。此时,日本NEC公司也开始着手在中国建研究院,希望王生进回国主持相关工作。权衡再三,王生进选择了到清华工作,在电子工程系图像图形技术研究所(现信息认知与智能系统研究所),王生进把研究方向定在了智能信息处理这个方向上,研究成果重点将应用在公共安全领域。
“目前我们研究室主要有三大研究方向,一是文字识别,这是当年吴佑寿院士和丁晓青教授做得时间比较长的方向;二是人脸识别,主要以丁晓青教授为代表,三就是我回来之后负责的智能视频处理这个方向。在这个方向上,我一是做了一些理论研究方面的工作,主要是将智能视频分析技术运用于日常视频监控录像的海量数据分析,特别是对于人、车、物等重点要素及其特征予以识别的算法应用;二是与安防部门合作,和平安城市建设相结合,做了一些应用上的探索。”因为研究内容的重要性,王生进还兼职担任了全国安防标委会人体生物特征识别应用分技术委员会委员、教育部网上巡查视频标准专家组顾问委员、公安部公共安全和安防领域专家、十二五国家科技支撑计划社会公共安全(安全防范)领域立项专家组成员、北京图像图形学会副理事长等职。
非凡智慧成就事业的辉煌
同事们都说,王生进是有大智慧的人。在学术研究领域,他既有远见卓识,更有打破常规的气魄。的确,当年回国加盟清华大学电子工程系图像图形研究所,他选择从事智能视频处理这个新的研究方向,是因为他敏锐地意识到,2000年以后信息化社会发展如此迅速,国内相关领域的技术力量应该是未来的朝阳产业,有着无比广阔的前景。10多年来,信息技术领域的发展充分证实了他当初的判断,而智能视频分析则由于其关键内容是基于视频的人、车、物的检测和分类,是计算机视觉、模式识别和图像处理领域十分具有挑战性的课题,其研究已成为国际上非常活跃的研究领域。
在专业领域,王生进多年从事多媒体信息处理、自动目标识别与跟踪、智能视频分析、生物特征识别等方面的研究工作,做出了一系列创新性的研究成果:研究智能视频图像处理中的高维信息的鉴别问题,提出面向鉴别的维数压缩方法,获得模式识别关键的维数压缩鉴别特征;提出集成学习理论的方法,建立集成识别系统最优的信息融合理论和模型;并以目标检测、目标识别、目标跟踪为基础,构建对于国家安全和公共安全有重大需求的智能视频监控系统。近年来,研究团队获得了包括973、863、国家自然科学基金、教育部博士点基金等多个国家项目支持,并取得出色成果。其中,他在2007-2008年度主持的863计划项目“基于人类视觉感知和认知机理的视频图像模式识别和机器学习”研究中,共发表论文28篇,其中SCI论文6篇,EI论文12篇,在本领域国际著名期刊IEEE Trans.、Pattern Recognition Letters上发表了多篇高水平学术论文,合作翻译出版图像处理专著1本,申请发明专利5项。至今为止,他在国际国内重要期刊和国际重要学术会议上发表论文90篇,已申请发明专利14项(已授权6项),软件著作权3项。作为起草人之一,他还参与制定了中华人民共和国公共安全行业标准《安全防范系统生物特征识别应用术语》和国家标准《安全防范视频监控数字视音频编解码技术要求(SVAC)》。获得国家科技进步二等奖1项、获北京市科学技术一等奖1项、获NEC卓越研究奖1项、获学会优秀论文奖1项等奖励。
在科学研究的内容上,王生进认同清华大学提出的理念——科研应是“顶天立地”的研究,‘顶天’就是要在基础研究方面与世界同步,‘立地’就是研究成果要能运用到实际生活之中。“非常幸运地,我赶上了平安城市建设这个比较好的时机,使得我研究的技术在公共安全领域有了被国家需要的应用前景。”正如王生进所言,由于该项技术将目标检测、特征识别和分类技术结合起来,使得对大范围场所的监控得以实现,可以提供对国家重要安全部门和敏感的公共场合进行全天候、自动的、实时的监控手段,因此能够满足面向国家防恐反恐和公共安全等真实场景的需要,其研发的技术已经应用在了北京东直门交通枢纽监控系统等实际场景中。
但是,目前主要存在的问题是如何进一步提高监控系统的稳定性、适用性,以及智能性,这是智能监控系统实用化的前提。“十一五期间,我们的主要工作是搭建监控系统这个平台,平台搭好之后,现在它的主要功能还是在录像,事件发生之后,需要从海量数据中去甄别和查询,因此,在十二五期间,我们希望把这项技术做得更智能化,最好能事先预知某些危及公共安全事件的苗头,智能分析、感知和提醒防范,让技术‘活’起来。”
集体荣誉彰显工作的价值
“我所从事的事业与公共安全直接挂钩,因此我感到非常幸运。人生最大的幸事就是在实现个人价值的同时,用个人所学、所长、所创,为社会、为人类作出自己的贡献!这些年来,我所有的工作都是为人民大众和社会服务,我觉得这就是我最大的成就。”
王生进在接任所长时,就知道自己踏上了一条任重而道远的道路:要把队伍带成学校一流的科研团队,需要远见卓识的能力和科学发展的眼光。上任之后,王生进首先把各个研究室的力量集中起来,确定了研究所的五个主要研究方向。其次,他努力为所里的科研人员创造和谐的工作环境。近年来该所主要承担了国家科技攻关、973、863项目、自然科学基金重点和面上项目、教育部211和985项目、其他部委以及众多的国际国内横向合作项目。在视频、图像和语音数据的压缩编码与传输、文字识别(OCR)、生物特征识别与视频监控、语音识别、高速图像处理系统、基于内容的视音频信息检索和挖掘、网络信息挖掘和信息安全等研究领域中取得了显著的成果,获得了多项国家和部委奖励。
2011年,电子工程系进行学科调整,将图像图形研究所和网络与人机语音通信研究所合并而成信息认知与智能系统研究所。王生进继续担任所长,团队更大了,任务也更重了,但王生进的信念没有变,他仍坚持着最初的梦想,为信息处理领域添上一笔的梦想。
培养新人竭尽教育的本分
到清华大学电子工程系任职后,科研与教学成为了王生进工作的两大重心。如今的大学里,这两项任务常常有冲突,尤其在严峻的就业形势下培养研究生,必须兼顾到他们的就业,因此要做到科研与教学各不偏废,实属不易。但王生进觉得,个人的科研工作固然重要,但培养新人、壮大科技队伍,是中国由制造业大国走向创造型国家的必要前提。他热爱自己的专业,因此希望更多的学生能够成为自己的同道,成为国家的有用之才,所以他愿意给本科生上课,把进入信息处理研究领域的钥匙交给更多的年轻人。在繁重的科研攻关、团队管理工作之外,王生进目前仍主讲两门本科生和一门研究生的专业课程,以及多个专业讲座课程。对于每一门课程他都要花上大把的时间认真备课。
关心每个学生的未来发展,因材施教,是王生进在教学上的另一种真诚。回国后的2005年,王生进除担任研究所所长,他还是电子工程系的年级主任,肩负着全系2005级11个班的学生管理工作。他根据学生的特长、性格,引导学生们扬长避短制定相应的选课计划和职业规划。在帮助研究生确定课题时,他会综合考虑课题的学术价值与实用价值,因而一些研究生毕业时,由于拥有了市场前景不错的新技术而备受用人单位青睐。
在信息认知与智能系统研究所的科研人才培养方面,王生进将该所的学科发展方向确定为基于云计算的跨媒体海量信息处理与认知,即图像处理与认知、文字识别与语言理解、图形处理与虚拟现实、语音与音频处理、网络信息处理、通信信号处理。研究所发展的指导思想是,在现有学科优势的基础上,向多源多模,智能化,网络化,以及系统集成的方向发展。目前形成9个主要研究方向。同时,研究所致力于培养基础理论坚实,科学学识广博,系统开发能力突出,具有高度科技创新能力的高层次专业人才。
鲁迅先生曾说:“我们自古以来,就有埋头苦干的人,就有拼命硬干的人,有为民请命的人,有舍身求法的人……这就是中国的脊梁。”王生进和信息认知与智能系统研究所这个团队苦干、实干,勇攀信息科技高峰,他们不愧是民族的骄傲、人民的自豪。
专家简介:
王生进,清华大学电子工程系图像图形研究所所长、清华大学信研院汽车电子实验室副主任、清华大学电子工程系学术委员会委员。主要从事多媒体信息处理、自动目标识别与跟踪、智能视频分析、生物特征识别等方面研究工作。近年来在计算机视觉、视频图像模式识别、多媒体信息处理等方面做出一系列创新的研究成果,在IEEE Trans. SMC、PRL、ACM、自动化学报、中国图像图形学报等国际国内重要刊物和CVPR, 即CVPR,ICPR, ICIP等国际重要学术会议发表论文90篇以上。目标检测与跟踪方面的成果被国际同行评价为具有“原创的”、“突破性”。申请发明专利14项(已授权6项),软件著作权3项。作为起草人之一,制定中华人民共和国公共安全行业标准《安全防范系统生物特征识别应用术语》和国家标准《安全防范视频监控数字视音频编解码技术要求(SVAC)》。获国家科技进步二等奖1项、获北京市科学技术一等奖1项、获NEC卓越研究奖1项、获学会优秀论文奖1项。任北京图像图形学会副理事长、公安部公共安全和安防领域专家,全国安防标委会人体生物特征识别应用分技术委员会委员、教育部网上巡查视频标准专家组顾问委员,十二五国家科技支撑计划社会公共安全(安全防范)领域立项专家组成员,十二五国家科技支撑计划“公共安全物联网技术研究与应用示范”项目咨询专家组组长,担任中国科学院、中国工程院、国家自然科学基金委员会主办的“寻找青年科学之星”评审委员会信息技术领域评委。
来源:科学中国人 2013年第11期
中国科技创新人物云平台暨“互联网+”科技创新人物开放共享平台(简称:中国科技创新人物云平台)免责声明:
1、中国科技创新人物云平台是:“互联网+科技创新人物”的大型云平台,平台主要发挥互联网在生产要素配置中的优化和集成作用,将互联网与科技创新人物的创新成果深度融合于经济社会各领域之中,提升实体经济的创新力和生产力,形成更广泛的以互联网为基础设施和实现工具的经济发展新形态,实现融合创新,为大众创业,万众创新提供智力支持,为产业智能化提供支撑,加快形成经济发展新动能,促进国民经济提质增效升级。
2、中国科技创新人物云平台暨“互联网+”科技创新人物开放共享平台内容来源于互联网,信息都是采用计算机手段与相关数据库信息自动匹配提取数据生成,并不意味着赞同其观点或证实其内容的真实性,如果发现信息存在错误或者偏差,欢迎随时与我们联系,以便进行更新完善。
3、如果您认为本词条还有待完善,请编辑词条。
4、如果发现中国科技创新人物云平台提供的内容有误或转载稿涉及版权等问题,请及时向本站反馈,网站编辑部邮箱:kjcxac@126.com。
5、中国科技创新人物云平台建设中尽最大努力保证数据的真实可靠,但由于一些信息难于确认不可避免产生错误。因此,平台信息仅供参考,对于使用平台信息而引起的任何争议,平台概不承担任何责任。