姓名:张悠慧

职称:教授

邮箱:zyh02@tsinghua.edu.cn

URL:http://cs.tsinghua.edu.cn/

电话:010-62785592转8003

传真:010-62771138

教育背景

工学学士 (计算机科学与技术), 清华大学, 中国, 1998;

工学博士 (计算机体系结构), 清华大学, 中国, 2002.

社会兼职

高性能计算技术研究所副所长(2012~);

中国计算机学会: 普及工作委员会委员(2014~);

《计算机研究与发展》编委(2014~);

下列会议的程序委员会成员或Session Chair:PAAP2011、ASC 2012、ASC 2013、全国高性能计算学术年会(HPC China 2013)、HPC China 2014等.

研究领域

研究领域

高性能计算与微体系结构设计;云计算虚拟化技术。

讲授课程

汇编语言程序设计(本科生课程,国家级精品课、国家级精品资源共享课立项支持、校精品课);计算机组成与系统结构(本科生,教育部-英特尔精品课程支持);存储技术基础 (本科生)。

教学概况

目前我是三门本科课程的主讲教师,年学时为128。这些课程都是面向本科生的计算机体系结构方面的专业课程,我的教学理念是帮助学生建立一个计算机底层框架和语言的系统性概念。

在“汇编语言程序设计”中,强化汇编语言 “承上启下”的特点,帮助学生形成计算机系统的整体思维,该课程已经获得教育部的国家级精品资源共享课建设的立项支持。

在“计算机组成与系统结构”中,采用了以程序员的角度来进行计算机体系结构等的讲解的方式,获得了教育部-英特尔精品课程项目支持。

研究课题

863课题:云计算测试与评估系统研制(2013-2015);

重要横向课题:新型计算机体系结构研究(2013-2016);

教育部-英特尔信息技术专项:对现有教学软件透明的‘软件即服务’使用模式研究(2011-2013);

973二级课题:多计算系统资源虚拟化方法研究(2007-2011);

国家自然科学基金课题:支持对象数据与动态功能扩展的存储片上多处理器体系结构研究(2008-2010);

863课题:高端容错计算机总体技术研究(2008-2011);

863课题:基于虚拟服务网络的可迁移个人计算模式研究与示范应用 (2006-2008);

863课题:集群服务器功能软件 (2002-2004);

863课题:32位高性能嵌入式CPU研发(2002-2004);

 

研究概况

我的主要研究领域包括高性能计算与微体系结构设计、虚拟化技术等方面,博士毕业后曾主持研究了面向科学计算的集成软件环境核心技术,并作为软件开发联盟Gelato的初创成员(其它成员包括Intel、HP)发布了若干个集群计算核心软件系统(包括并行容错计算环境、集群服务器并行开发环境等),具备国际领先水平;曾作为清华微处理器-THUMP的体系结构主要设计者,设计了该处理器的微体系结构,主频可达500MHz(TSMC 180nm工艺)。

近五年来,主要开展面向云计算模式的的应用虚拟化技术研究。在国际上较早提出运行环境与存储位置相分离的分布式软件架构与云端融合使用模式,基于应用层虚拟化技术,将现有软件转化为网络服务,从而能够有效实现云计算模式与现有桌面软件的兼容,虚拟化引入的性能损失不到1%。相关成果发表在LISA2008、服务计算领域最好的期刊之一IEEE Transaction on Services Computing、Future Generation of Computer Systems(FGCS,期刊)、中国科学(英文版)等重要会议与期刊上;其中LISA2008的论文是国内机构首次在该大规模系统管理领域顶级会议上独立发表成果,被SIGCOMM 2010论文引用,认为我们的工作“显著缩小了应用镜像文件”;FGCS论文也被并行计算领域的重要国际会议Euro-Par 2013等所引用,认为是多用户软件部署技术的一个新兴方向。同时开展了面向应用的定制处理器设计,主要采用软件模拟以及FPGA仿真的方式,选取了“全球气候变化数值模拟”这一代表性关键应用为目标,实现了定制处理器内核的FPGA原型,显著提升了应用的效能比。并与日本奈良尖端科技大学院大学合作,将该设计方法用于针对天气预报系统定制的线性阵列(多核)处理器设计,仿真结果表明每周期指令数是同工艺通用多核处理器的2.3倍,而功耗仅为其12%;合作方认为我们“在定制化设计领域做出了前沿的技术贡献”。

目前,在虚拟化研究方面主要集中于显示层虚拟化等技术,即设计支持“云”上各类应用的客户端远程虚拟显示(包括3D渲染、视频、图像、音频、输入反馈等),解决传统桌面云环境下服务端3D应用等无法在远程的异构客户端上高效使用的问题。从应用角度来看,即设计实现应用视频流模式——应用在“云”上运行并渲染画面但在客户端显示;支持现有桌面、游戏(包括3D等)、视频播放等应用,无需重新开发与移植;“云游戏”即属于这一模式。这是一个综合性的研究课题,除了虚拟化技术本身外,还包括资源隔离、资源优化分配与调度策略、网络传输优化等关键技术。在微体系结构方面则提出“以数据为中心”的体系结构研究。主要采用软件模拟方法,面向大数据处理等关键算法,结合新型元器件与封装技术,提出“计算趋近通信”的片上网络结构以及“计算趋近数据”的Active片上内存结构,从而降低数据传输量、提升计算效率并均衡硬件资源。

已在国内外重要会议及杂志上发表论文40余篇,获得专利10项,是若干国际期刊(包括IEEE Transactions on Computers、The Journal of Supercomputing等)的审稿人。

 

奖励与荣誉

国家科技进步二等奖: 高性能集群计算机与海量存储系统 (2007);

教育部科技进步一等奖: 高性能计算机性能测试技术 (2009);

电子学会科学技术一等奖: 高性能计算机性能测试技术 (2009);

国家级精品课、国家级精品资源共享课(立项支持)“汇编语言程序设计”负责人。 

学术成果

[1] Hongwei Wang, Siyu Lu, Youhui Zhang*, Guangwen Yang, Weimin Zheng. Customized Network-on-Chip for Message Reduction. ICA3PP 2014. 

[2] Li Yanhua, Zhang Youhui*, Jianfeng Yang, Wayne Luk, Guangwen Yang, Weimin Zheng. An Approach of Processor Core Customization for Stencil Computation (Poster). ASAP 2014. 

[3] Youhui Zhang*, Peng Qu, Yanhua Li, Hongwei Wang, Weimin Zheng. Cache Optimizations of Distributed Storage for Software Streaming Services. ICA3PP 2013: 458-467. 

[4] Fan Jie, Jiang Song, Shu Jiwu, Zhang Youhui*, Zhen Weimin. Aegis: Partitioning Data Block for Efficient Recovery of Stuck-at-Faults in Phase Change Memory. Proceedings of the 46th Annual IEEE/ACM International Symposium on Microarchitecture (Micro 2013). 2013. 

[5] 王为,张悠慧*,姚俊,李艳华,郑纬民。基于线性阵列处理器的GRAPES核心代码优化. 《计算机学报》2013年10月刊。(中国计算机大会2013最佳论文).

[6] Zhang Youhui*, Peng Qu, Ziqiang Qian, Hongwei Wang, Weimin Zheng. Software / hardware Hybrid Network-on-Chip Simulation on FPGA. 10th IFIP International Conference on Network and Parallel Computing (NPC 2013).Sept. 2013.

[7] Wang Wei, Yao Jun, Zhang Youhui*, Xue Wei, Nakashima Yasuhiko, Zheng Weimin. HW/SW approaches to accelerate GRAPES in an FU array. Proceedings for 2013 COOL Chips XVI (IEEE Symposium on Low-Power and High-Speed Chips). April 2013. 

[8] Zhang Youhui*, Qian Ziqiang, Zheng Weimin. Employing Intelligence in Object-based Storage Devices to Provide Attribute-based File Access. SCIENCE CHINA-INFORMATION SCIENCES, Vol.56, No.3. Mar 2013. 

[9] Zhang Youhui*, Yang Jianfeng, Zheng Weimin. Customizing a Processor-core for Stencil Computation. Proceedings of Workshop of HPCA 2013(4th Workshop on SoCs, Heterogeneous Architectures and Workloads). Feb. 2013.

[10] Youhui Zhang*, Yanhua Li, Weimin Zheng. Automatic Software Deployment Using User-level Virtualization for Cloud-Computing. Future Generation Computer Systems(FGCS),Vol.29 N0.1. Jan 2013. 323-329. 

[11] Zhang Youhui*, Xiaoguo Dong, Siqing Gan, Weimin Zheng. A Performance Model for Network-on-Chip Wormhole Routers. Journal of Computers, 7(1): 76-84.2012. 

[12] 张悠慧*, 李艳华, 郑纬民. Cloudow: 一种基于用户层虚拟化的支持现有Windows应用的软件即服务模式运行系统及其性能优化。《中国科学:信息科学》 2012年03期。(第二届中国云计算与SaaS大会最佳论文) 

[13] Zhang Youhui*, Wang Hongyi, Wang Dongsheng, Zheng Weimin. Employing Object-based Storage Device to Embed File Access Control in Storage, INTELLIGENT AUTOMATION AND SOFT COMPUTING, Vol.17, No.1, 2011. 1-11.

[14] Youhui Zhang*, Li, Yanhua, Zheng, Weimin. Using user-level virtualization in desktop grid clients for application delivery and sandboxing. 4th International Symposium on Parallel Architectures, Algorithms and Programming, 2011. 289-293.

[15] Zhang Youhui*, Xiaoguo Dong, Siqing Gan, Weimin Zheng. Model of Network-on-Chip Routers and Performance Analysis. IEICE Electron. Express ,Vol.8, No.13, 2011. 986-993.

[16] Youhui Zhang*, Gelin Su&, Weimin Zheng. A User-space File System for On-demand Legacy Desktop Software, SCIENCE CHINA-INFORMATION SCIENCES, Vol.54,No.6,2011. 1142-1150. 

[17] Zhang Youhui*, Weimin Zheng, Xiaoguo Dong, Siqing Gan. A performance analytical approach based on queuing model for network-on-chip. 3rd International Symposium on Parallel Architectures, Algorithms and Programming. 2010. 

[18] Liu Li, Zhang YouHui*, Liu Li, Yang Guangwen, and Zheng WeiMin. Efficient Monte Carlo-based Options Pricing on Graphics Processors and Its Optimizations. SCIENCE CHINA Information Sciences, Vol.53, No.9, 2010. 1703-1712. 

[19] Youhui Zhang*, Gelin Su, Weimin Zheng. Converting Legacy Desktop Applications into On-Demand Personalized Software, IEEE Transactions on Services Computing, Vol.3, No.4, 2010. 306-321. 

[20] Zhang Youhui*, Xie Yue Jian, Zheng Weimin. Optimized mapping of pixels into memory for H.264/AVC decoding. IEICE Electron. Express, Vol.6, No.6, 2009. 283-289. 

[21] Youhui Zhang*, Weimin Zheng. Codec-on-Demand Based on User-Level Virtualization. IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, Vol.E92-D, No.12, 2009. 2422-2429. 

[22] Youhui Zhang*, Xiaoling Wang, and Liang Hong, Portable Desktop Applications Based on P2P Transportation and Virtualization. Proceedings of the 22nd Large Installation System Administration Conference (LISA '08), San Diego, CA, 2008, pp. 133–144. 

[23] Youhui Zhang*, Xiaoling Wang, Liang Hong, Gelin Su, Dongsheng Wang. Portable desktop applications based on user-level virtualization. 13th IEEE Asia-Pacific Computer Systems Architecture Conference, 2008. 

[24] Youhui Zhang*, Yu Gu, Hongyi Wang, and Dongsheng Wang. Virtual-Machine-based Intrusion Detection on File-aware Block Level Storage. Proc.18th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD'06), Ouro Preto, Brazil, pp. 185-192. 

[25] Youhui Zhang*, Dongsheng Wang. Research on object-storage-based intrusion detection. Proceedings of the 12th International Conference on Parallel and Distributed Systems (ICPADS'06). 2006.