人机交互与媒体集成研究所

人机交互与媒体集成研究所简称“媒体所” 在媒体信息智能处理、人机交互、普适计算等方面开展高水平研究。建有多个学术基地,如“清华信息科学与技术国家实验室普适计算研究部(普适计算教育部重点实验室)”、“清华大学计算机系-腾讯互联网创新技术联合实验室、“网络多媒体北京市重点实验室”等。近年主持多项本学科领域重要项目(973 、863重点、NSFC重点等),创新求实,顶级刊会发表大量学术论文并获多篇最佳论文奖,获得国家级科技奖励5项,技术成果行业影响重大。本所现有19名教师,其中工程院院士1名、长江学者2名、千人计划教授1名、杰青2名、IEEE fellow 2名、优青1名、新世纪优秀人才3名,拥有长江创新团队,现任所长史元春教授。在读百余研究生人中70%是博士生,已培养获得全国优秀博士论文3篇。本所还与美术学院共同负责信息艺术设计交叉学科研究生培养项目。媒体所2013年曾被评为清华大学先进集体。

主要研究方向:

  • 1)智能信息处理:计算机视觉、图形学、多媒体编码与检索、视听觉的对象识别与合成、多媒体普适化访问等。

  • 2)和谐人机交互:情感计算、语音交互、大幅表面交互、脑机接口、穿戴交互、交互效率与优化、社会网络等。

  • 3)普适计算环境:普适计算模式、主动服务、嵌入式系统、情境感知、智能空间、家庭网关、物联网等。

主要研究进展:

一、智能媒体处理方面

  • 1) 提出可视媒体智能处理的理论与方法,在特征敏感的几何计算、真实感绘制、图像与视频内容处理等方面取得关键性的理论与技术突破,可有效加快可视媒体获取与传播的速度。

  • 2) 深入持续开展图像中人脸对象的研究,包括人脸的检测、配准、标注和检测方法。

  • 3) 多媒体高效编码、对等网络流媒体传输协议与系统等网络多媒体关键技术。

二、和谐人机交互方面:

  • 1) 提出跨平台的多语种可视表现力语音生成方法并建立可视化语音合成系统,支持多语种的参数化语音合成、表现力语音与情感脸像生成。

  • 2) 研制出大幅面桌面交互原型系统,支持基于多触点的手势和实物交互、多用户界面管理和新型应用。

三、普适计算环境方面:

  • 1) 提出透明计算理论,在网络环境中扩展冯诺伊曼结构,实现信息服务与用户终端的存储分离和在线访问,充分提高软件的共享程度和信息服务的安全性、降低管理的复杂性和使用成本。

  • 2) 提出普适计算架构,基于泛在设备互联互通互操作和情境感知,主动提供用户在包括有移动、嵌入式设备的普适计算环境中连续、个性化的服务。

重要科研项目:

  • 1) NSFC重大计划项目:多人多方对话中的语音分离、内容分析与理解(2009-2011)

  • 2) 973项目:可视媒体智能处理的理论与方法(2007-2010)

  • 3) 863重点项目:普适计算软硬件关键技术与系统(2009-2010)

欢迎访问人机交互与媒体集成研究所主页:http://media.cs.tsinghua.edu.cn