姓名:唐杰

职称:副教授

邮箱:jietang@tsinghua.edu.cn

教育背景

工学博士 (计算机科学与技术), 清华大学, 中国, 2006.

社会兼职

ACM TKDD, TIST: 特邀编辑;

JSW, SWJ, JAIT: 编委;

Web Intelligence 2010: 程序委员会副主席 (2010);

KDD-LDMTA 2010, ICDM-LDMTA 2009-2010, WWW-SWSM 2008, CIKM-SWSM 2009: 联合主席 (2008-2010);

KDD 2010, SIGIR 2009-2010, WWW 2010, ACL 2010, COLING 2010: 程序委员会委员 (2009-2010).

研究领域

社会网络挖掘, 社会影响力分析, 异构网络中的机器学习

数据挖掘, 语义Web

研究概况

我的研究兴趣主要包括社会网络分析、数据挖掘和语义Web。具体的来说,我针对社会网络的建模、用户行为跟踪和网络结构演化进行了深入研究。我曾在伊利诺伊香槟分校、香港中文大学、香港科技大学、鲁汶大学进行学术访问,目前是多个国家级项目和多个国际合作项目的负责人。

我的主要创新性研究包括:1)语义信息抽取,针对不同类型的数据源提出多种信息抽取方法,并将其成功应用于多个系统中;2)基于话题的信息搜索,和传统的关键词搜索以及对象搜索不同,我研究的话题搜索主要侧重于如何理解文档和查询的话题语义信息,以及如何基于话题分布进行相关匹配;3)网络行为建模和影响力分析,我提出了针对社会网络的微观动态分析方法,并首次提出了社会影响力的量化分析方法,以及社会网络行为和社会影响力关联关系的分析方法。

应用上述研究成果,我研发了研究者社会网络ArnetMiner系统 (http://arnetminer.org),该系统收集了100多万名研究者、300万篇论文信息、3700多万引用关系以及8000多个会议信息。从2006年运行以来,该系统吸引了189个国家73万个独立IP的访问(>6千960万访问日志),访问量还在以每月10%左右的速度增长。ArnetMiner系统在国际顶级会议WWW、KDD、ISWC、ICDM中进行了演示,得到一致好评,系统数据还被广泛应用于科学研究,在国际上具有一定的影响力。我曾被邀请访问美国IBM TJ Watson研究院、美国UIUC大学、香港科技大学、香港中文大学、鲁汶大学、Google China、MSRA、IBM CRL进行学术交流。我已申请相关技术专利7项,研究成果还在与IBM、Google、Nokia、国际最大的石油公司、搜狐和中国科学技术信息研究所的多个国际合作和企业合作项目中得到推广应用。在标准制定方面,我参加了国家中文新闻置标语言和分类标准的制定。

研究课题

国家自然科学基金课题: 统一的语义内容标注模型研究 (2008-2010);

国家自然科学基金重点课题: 面向Web的社会网络理论与方法研究 (2010-2013);

863课题: 基于概率图模型的异构XML数据集成与检索 (2009-2010);

IBM国际合作项目: 社会网络搜索和挖掘 (2007-2011);

Nokia国际合作项目: 基于移动终端的本体场景建模和管理 (2009-2011).

奖励与荣誉

国际SIMagine开发大赛: Telcel Award (2007).

学术成果

[1] J. Tang, J. Zhang, R. Jin, Z. Yang, K. Cai, L. Zhang, and Z. Su. Topic Level Expertise Search over Heterogeneous Networks. Machine Learning Journal, (to appear).

[2] J. Tang, L. Yao, D. Zhang, and J. Zhang. A Combination Approach to Web User Profiling. ACM Transactions on Knowledge Discovery from Data, (to appear).

[3] J. Li, J. Tang, Y. Li, and Q. Luo. RiMOM: A Dynamic Multi-Strategy Ontology Alignment Framework. IEEE Transaction on Knowledge and Data Engineering. August 2009 (vol. 21 no. 8) pp. 1218-1232.

[4] J. Tang, J. Li, B. Liang, X. Huang, Y. Li, and K. Wang. Using Bayesian Decision for Ontology Mapping. Journal Web Semantics, Vol., no. 4, pp.243-262, Dec. 2006.

[5] C. Tan, J. Tang, J. Sun, Q. Lin, and F. Wang. Social Action Tracking via Noise Tolerant Time-varying Factor Graphs. Proc. of 16th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2010), Washington, DC, 2010.

[6] C. Wang, J. Han, Y. Jia, D. Zhang, Y. Yu, J. Tang, and J. Guo. Mining Advisor-Advisee Relationships from Research Publication Networks. Proc. of 16th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2010), Washington, DC, 2010.

[7] J. Tang, J. Sun, C. Wang, and Z. Yang. Social Influence Analysis in Large-scale Networks. Proc. of 15th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2009).Paris, France, 2009, pp. 807-816.

[8] J. Tang, J. Zhang, L. Yao, J. Li, L. Zhang, and Z. Su. ArnetMiner: Extraction and Mining of Academic Social Networks. Proc. of 14th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2008). Henderson, Nevada, 2008, pp.990-998.

[9] J. Tang, H. Li, Y. Cao, and Z. Tang. Email Data Cleaning. Proc. of 11th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2005), Chicago, Illinois, USA, 2005, pp. 489-499.

[10] J. Tang, H. Leung, Q. Luo, D. Chen, and J. Gong. Towards Ontology Learning from Folksonomies. Proc. of 21st Intl. Conf. on Artificial Intelligence (IJCAI 2009), Pasadena, California, pp. 2089-2095.

[11] Q. Zhong, H. Li, J. Li, G. Xie, J. Tang, and L. Zhou. A Gauss Function based Approach for Unbalanced Ontology Matching. Proc. of 21st Intl. Conf. on Management of Data (SIGMOD 2009), Providence, Rhode Island, 2009, pp.669-680.

[12] C. Zhu, J. Tang, H. Li, H. T. Ng, and T. Zhao. A Unified Tagging Approach to Text Normalization. Proc. of 45th Intl. Conf. of the Association of Computational Linguistics (ACL 2007), Prague, Czech Republic, 2007 pp. 688-695