首页    人员   研究   论文    English Homepage

 

   

中心概述

    模式识别与多媒体技术(梯队)研究中心的主要方向包括模式识别、多媒体技术、信息检索、计算机视觉、图像处理等;中心主体为模式识别技术创新实验室。我们关注、研究并构建创新性的、具有实际应用价值的相关技术及系统。经过多年的研究与攻关,本中心已经在自然场景/网络图片/视频多媒体文本检测、提取和识别,金融票据与表格图像识别应用系统,社会图书搜索与推荐,人脸识别及OCR等领域取得了国内领先、世界先进的创新与应用技术。

    当前,本中心的研究重点主要包括,自然场景、网络图片、通用文档及视频的智能文本挖掘(检测、识别与检索);社会海量多媒体内容理解与检索(网络图书及海量视频);网络 内容安全与社交网络中的在线生物特征认证(人脸、签名等)。

    我们的目标是,在3-5年内把本研究中心建设成为在模式识别、多媒体技术、智能信息检索等方面具有鲜明特色、并且在国内外具有一定知名度的学术研究与技术应用团队。

中心新闻

  • 2017-04: 实验室学术论文被第40届ACM SIGIR (SIGIR'17) 接收。SIGIR是国际顶级的计算机信息检索领域学术会议,同时也是中国计算机学会推荐国际会议(A类)(Bo-Wen Zhang, Xu-Cheng Yin*, Fang Zhou, and Jianlin Jin, "Building your own reading list anytime via embedding relevance, quality, timeliness and diversity," ACM SIGIR 2017, accepted (short paper).)。

  • 2017-04: 实验室殷绪成教授团队在网络场景视频文本检测与识别领域取得重要研究进展(参见学院新闻),近期有两篇论文被IEEE TPAMI 和 IEEE TIP接收([1] Shu Tian, Xu-Cheng Yin*, Ya Su, and Hong-Wei Hao, "A unified framework for tracking based text detection and recognition from web videos," IEEE TPAMI, accepted, 2017;  [2] Xu-Cheng Yin, Chun Yang, Wei-Yi Pei, Shu Tian, Ze-Yu Zuo, Chao Zhu and Junchi Yan, "Tracking based multi-orientation scene text detection: A unified framework with dynamic programming," IEEE TIP, accepted, 2017.)。 IEEE TPAMI 和 IEEE TIP是模式识别、计算机视觉、图像处理领域的国际顶级杂志,都为中国计算机学会推荐的A类国际期刊。

  • 2017-03: 实验室殷绪成教授研制了开放环境下(交通卡口、视频监控、行车纪录性等)的车牌识别技术,并计划提供嵌入式及芯片级技术解决方案(Online Demo)。

  • 2016-12: 受《情报工程》杂志邀请,实验室殷绪成教授信息检索与推荐技术团队于《情报工程》2016年第5期(双月刊)刊出“信息检索专题”,通过有关文本分类、社会图书检索、生物医学文献检索与问答系统等方面的三篇论文,总结了近三年来团队在文本分析与信息检索领域的一些研究成果和竞赛成绩。

  • 2016-11: 11月5日-7日在电子科技大学召开的第七届全国模式识别学术会议(CCPR'16)上,实验室共有两篇论文被接收为Oral论文,其中论文“Robust Segmentation for Video Captions with Complex Backgrounds”(邢纵横、周芳、田澍、殷绪成)荣获本次大会“最佳学生论文奖”(Best Student Paper Award)。本次大会接收221篇论文,共评出“最佳论文奖”、“最佳学生论文奖”和“最佳海报奖”三个奖项(每项1篇论文)。

  • 2016-10: 我们实验室的博士生张博文同学由于在学习与科研上的突出成果,荣获北京科技大学2016年研究生国家奖学金;硕士生晋赞霞同学荣获北京科技大学2016年“三晋”奖学金。

  • 2016-10: 2016年国际生物医学语义检索与问答技术挑战平台BioASQ Challenge 第四届竞赛结果揭晓,我实验室殷绪成教授团队("USTB")在Biomedical Semantic QA单元表现出色,获得多个数据集评测的最佳性能。

  • 2016-07: 欢迎田澍博士加入实验室。田澍博士本科、博士均毕业于北京科技大学计算机系。田博士的研究方向主要包括模式识别、 目标跟踪、多媒体内容理解等。

  • 2016-06: 欢迎朱超博士加入 实验室。朱超博士毕业于法国里昂中央理工大学,并在北京大学计算技术研究所完成了3年博士后研究工作,于今年加入我校。朱博士的研究方向主要包括模式识别、 目标检测、计算机视觉等。

  • 2016-05: 实验室信息检索与推荐技术团队荣获国际信息检索技术评测平台CLEF 2016年社会图书检索与推荐任务竞赛(CLEF 2016 Social Book Search Suggestion Task)冠军;同时,我们提交的6个结果全部位居于竞赛前6名。

  • 2016-04:实验室殷绪成教授与中科院自动化所刘成林研究员合作的综述论文“Text Detection, Tracking and Recognition in Video: A Comprehensive Survey”被IEEE Transactions on Image Processing (IEEE TIP)接收。IEEE TIP是图像处理领域的国际顶级杂志(中国计算机学会推荐国际期刊(A类))。

  • 2016-04:实验室殷绪成教授团队学术论文(“Scene Text Detection in Video by Learning Locally and Globally”)被第25届国际联合人工智能大会(International Joint Conference on Artificial Intelligence, IJCAI'16)接收。IJCAI是国际顶级的计算机人工智能领域学术会议,同时也是中国计算机学会推荐国际会议(A类)。

  • 2016-03:近期获悉,实验室殷绪成教授在2014年 IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE TPAMI)发表的论文“Robust Text Detection in Natural Scene Images”被评为ESI高被引论文。该论文提出了创新性的复杂环境(自然场景、网络图片等)中图像文本检测与提取技术;同时,该技术也荣获2013年国际文档分析与识别大会技术大赛“自然场景文本检测”和“网络图片文本检测”双料冠军(参见学校新闻)。

  • 2016-01:1月15日,实验室殷绪成教授作为导师代表,在我校2016年春季研究生毕业典礼上进行发言;其发言主题为:“专注、坚持、突破”,与189名博士毕业生、1929名硕士毕业生及青年学子共勉(参见学校内容链接)。

  • 2015-12:12月3日,国际知名生物医学语义检索与问答技术挑战平台BioASQ Challenge 第三届竞赛结果刚刚揭晓,我实验室殷绪成教授团队在Biomedical Semantic QA单元表现出色,获得多个数据集评测的最佳性能;参加比赛的队伍还包括了美国CMU、Toyota美国芝加哥研究所、德国University of Potsdam、复旦大学等近10支高水平研究团队。

  • 2015-12:12月1日下午,中国科学院深圳先进技术研究院黄伟林博士应我实验室殷绪成教授的邀请,在我实验室做了题为“Scene Text Detection and Recognition with Deep Learning”的学术报告。黄伟林博士同时也是香港中文大学多媒体实验室成员,在计算机视觉和模式识别国际顶级的会议(ICCV、CVPR、ECCV等)上发表了多篇场景文本检测与识别、人脸识别及目标识别等相关的高水平学术论文。

  • 2015-11:11月17日下午,华南理工大学电子与信息学院信息工程系主任金连文教授应我实验室殷绪成教授的邀请,在北京科技大学计算机系做了题为“深度学习及路径积分特征图在大类别文字识别与分析中的应用”的学术报告。金连文教授是国际国内知名的文字识别、人机智能交互等技术研究及应用专家,广东省高校“音视频图文智能信息处理”工程研究中心主任,2006年入选教育部新世纪优秀人才,2011 年入选广东省“珠江学者”特聘教授。

  • 2015-11:《科技纵览》(IEEE Spectrum中文版)对我实验室殷绪成教授团队科研成果(“复杂文档/图像/视频文本识别新技术” )进行了技术介绍和深度报道(参见学校新闻)。

  • 2015-10:我们实验室的博士生裴唯一同学、硕士生左泽雨同学由于在学习与科研上的突出成果,双双荣获北京科技大学2015年研究生国家奖学金。

  • 2015-10:模式识别技术创新实验室以应用基础研究和技术创新为导向,以国际主流技术为标尺,持续研究和攻克,重点建设复杂图像与网络视频文本识别、互联网及社交媒体文本检索、动态人车识别与网络内容安全等三个高水平研究组;因教学与科研需要,现面向国内外同行(模式识别与计算机视觉、信息检索与自然语言处理等领域)招聘(特聘)教授/(特聘)副教授/讲师/师资博士后数名(详见招聘启事)。

  • 2015-08:8月26日2015年国际文档分析与识别大会(International Conference on Document Analysis and Recognition, ICDAR 2015)在法国南锡市闭幕,国际文档分析与识别技术竞赛结果也同时揭晓,我实验室殷绪成教授团队获得本届大赛最受关注的“鲁棒阅读竞赛”(Robust Reading Competition)中“自然场景文本端到端识别(通用类)”(Focused End-to-End Text Recognition (Generic))、“网络图片文本端到端识别(通用类)”(Born-Digital End-to-End Text Recognition (Generic))、“网络图片文本端到端识别(限制类)”(Born-Digital End-to-End Text Recognition (Weak))、“视频文本检测提取”(Video Text Detection)等四项冠军。本届国际文档分析与识别技术竞赛包括了图像与视频文本识别、历史文档图像理解、多语言文字识别与手写鉴别等相关的十一个竞赛单元,吸引了来自中国、美国、德国、法国、英国、日本、韩国、印度等几十个国家一百多支模式识别、文档分析与识别、计算机视觉等领域高水平参赛队伍;我实验室殷绪成教授团队是本届赛事夺冠的唯一中国团队 (参见学校新闻)。

  • 2015-08:8月3日上午,美国麻省大学医学院(University of Massachusetts Medical School)教授/BioNLP实验室主任、麻省大学计算机学院(School of Computer Science, University of Massachusetts Amherst)兼职教授 Hong YU 博士应我中心殷绪成教授的邀请,在北京科技大学计算机系做了题为“Biomedical Natural Language Figure Processing Assisting High-Throughput Data Analysis”的学术报告。Hong YU教授是面向生物医学及医疗保健领域信息检索和自然语言处理方向的国际知名学者。

  • 2015-07:研究中心研制了融合信息检索和推荐系统等相关方法的社会图书搜索系统测试版。在该系统中,用户输入自然语言描述的查询内容,不仅能够像豆瓣图书(http://book.douban.com/)和亚马逊图书(http://www.bookdepository.com/)一样,而且还考虑了图书本身所关联的各类社会信息(如标签/评论/打分等),查找自己想要的图书。

  • 2015-06:研究中心殷绪成博士(博导)荣获北京科技大学第二届“研师益友——我最喜爱的导师”,在最终的评选活动中排名第一。

  • 2015-05:研究中心殷绪成博士与Erik Learned-Miller教授(Computer Vision Lab, School of Computer Science, University of Massachusetts Amherst, USA)、Hong YU教授(BioNLP Lab, University of Massachusetts Medical School, USA)共同合作研究项目的论文“DeTEXT: A Database for Evaluating Text Extraction from Biomedical Literature Figures”发表在国际著名开源学术期刊PLoS ONE上。

  • 2015-01:我们又一篇论文,“Multi-orientation scene text detection with adaptive clustering”,被 IEEE Trans. Pattern Analysis and Machine Intelligence (TPAMI, 2013 SCI impact factor: 5.696) 接收。IEEE TPAMI是人工智能、模式识别、计算机视觉和机器学习等领域的国际顶级杂志(JCR一区,中国计算机学会推荐国际期刊 (A类))。

  • 2014-10:我们实验室的博士生杨春同学、硕士生张博文同学由于在学习与科研上的突出成果,双双荣获北京科技大学2014年研究生国家奖学金。

  • 2014-09:研究中心殷绪成博士受VALSE在线讨论组邀请,参加“专题侠客群论剑”之“自然场景文字检测与识别 ”活动,在线主讲和推介我们中心世界领先的自然场景文本检测与识别技术。视觉与学习青年学者研讨会(Vision And Learning SEminar, 简称VALSE)的是计算机视觉、图像处理、模式识别与机器学习等研究领域内的华人青年学者学术交流的国内国际知名平台。

  • 2014-08:我们的论文,“Social book reranking with generalized content-based filtering”,被今年的ACM International Conference on Information and Knowledge Management (CIKM'14) 接收(ORAL paper)。CIKM是国际信息检索、知识管理和数据库领域顶级学术会议之一。

  • 2014-05:我们的信息检索与推荐创新技术荣获国际两大信息检索大赛(美国TREC和欧洲CLEF/INEX)之一的CLEF/INEX 2014年最热门的社会图书检索与推荐任务竞赛(CLEF/INEX Social Book Search Suggestion Task)冠军;同时,我们提交的6个结果全部位居于竞赛前7名(参见学校新闻)。

  • 2014-04:研究中心殷绪成博士团队与科大讯飞股份有限公司讯飞研究院在复杂图文检测与识别技术方面达成合作研究协议,以推进复杂文档分析与识别技术在教育等行业的技术攻关和创新应用。

  • 2014-03:研究中心殷绪成博士因其团队荣获2013年国际文档分析与识别大会(ICDAR 2013)技术竞赛Robust Reading Competition 单元“自然场景文本检测”、“网络图片文本检测”、和“网络图片文本提取”三项冠军,喜获北京科技大学2013年度十大新闻人物

  • 2014-01:研究中心殷绪成博士团队与三星电子中国研究院在自然场景文本检测新技术方面达成合作研究与应用协议,以推动智能手机与平板电脑在自然场景文本理解领域的创新应用。

  • 2013-12:我们的论文,“Convex ensemble learning with sparsity and diversity”,被 Information Fusion (INFFUS, 2013 SCI impact factor: 3.472) 接收。Information Fusion是智能信息处理、数据挖掘和模式识别等领域的国际知名杂志(JCR二区)。

  • 2013-12:我研究中心硕士研究生尹绪旺荣膺我校“第九届研究生十佳学术之星”。这是全校唯一一名获得该项荣誉的硕士研究生,也是我校信息相关学科研究生首次获此殊荣。

  • 2013-10:欢迎苏亚博士加入我们研究中心。苏亚博士本科、硕士、博士均毕业于西安电子科技大学,并在清华大学电子系完成了3年博士后研究工作,于今年加入我校。苏博士的研究方向主要包括模式识别、人脸识别及多媒体内容理解等。

  • 2013-09:我们的论文,“Robust text detection in natural scene images”,被 IEEE Trans. Pattern Analysis and Machine Intelligence (TPAMI, 2013 SCI impact factor: 5.696) 接收。IEEE TPAMI是人工智能、模式识别、计算机视觉和机器学习等领域的国际顶级杂志(JCR一区,中国计算机学会推荐国际期刊 (A类))。

  • 2013-09:国内多个国家级知名媒体报道了我研究中心自然场景与网络图片文本检测与提取技术(“USTB_TexStar”和“USTB_FuStar”)荣获ICDAR 2013 Robust Reading Competition竞赛“自然场景文本检测”、“网络图片文本检测”、和“网络图片文本提取”三项冠军(例如,科技日报中国科学报(科学时报)新华网人民网等)。

  • 2013-08:在2013 年国际文档分析与识别大会(ICDAR 2013)技术竞赛上,我们的创新技术(“USTB_TexStar”和“USTB_FuStar”)获得本届大赛最受关注的Robust Reading Competition 竞赛“自然场景文本检测”、“网络图片文本检测”、和“网络图片文本提取”三项冠军。其中,“网络图片文本提取”和“网络图片文本检测”获胜结果性能比第二名分别提高了19.36%和8.37%;在“自然场景文本检测”中,我们取得了十年来该项竞赛的最好性能,也是中国研究机构首次问鼎该项冠军。

©2013~2015 模式识别与多媒体技术(梯队)研究中心,计算机科学与技术系, 计算机与通信工程学院北京科技大学大学

北京市海淀区学院路30号机电信息楼1005,北京 100083。