详细资料
Details
教师头像
王文轩
王文轩,博士,中国人民大学信息学院讲师。2024年博士毕业于香港中文大学计算机系,师从ACM/IEEE Fellow吕荣聪教授。曾先后前往斯坦福大学、哈佛大学、加州大学洛杉矶分校、加州大学伯克利分校访问合作,并长期在腾讯AI Lab实习。研究方向为大模型及其应用的可靠性和安全性。近五年发表CCF A论文三十余篇,发表论文获ACM杰出论文奖,谷歌学术引用三千余次。指导本科生经验丰富,曾指导十余名本科生发表CCF A论文,并先后四次获得港中文本科生暑研最佳论文奖。

个人主页:jarviswang94.github.io

邮箱:wangwenxuan@ruc.edu.cn

更多

教育经历

2020年10月-2024年8月 香港中文大学计算机系,博士(导师:吕荣聪教授)

2013年9月-2017年6月 华中科技大学大学,计算机科学与技术,学士

工作经历

2025年5月-至今 中国人民大学,信息学院,讲师

2024年9月-2025年4月 香港科技大学,计算机系,博士后

研究方向

大模型及其应用的可靠性和安全性,包括

1.        大语言模型、多模态大模型、智能体的安全性评测与治理

2.        大模型在心理健康、软件工程、医疗、金融、体育等领域的应用

课题组长期招收优秀本科生和研究生进行科研实习合作,指导本科生经验丰富,曾指导超过十名本科生发表CCF A论文,并先后四次获得港中文本科生暑研最佳论文奖。

欢迎同学们邮件联系 wangwenxuan@ruc.edu.cn

讲授课程

1.      程序设计

2.      人工智能安全

科研成果

更多成果见个人主页:https://jarviswang94.github.io/

代表性论文:

*表示共同一作,表示通讯作者

[1] Can't See the Forest for the Trees: Benchmarking Multimodal Safety Awareness for Multimodal LLMs. (ACL 2025, CCF A)

Wenxuan Wang, Xiaoyuan Liu, Kuiyi Gao, Jen-tse Huang, Youliang Yuan, Shuai Wang, Zhaopeng Tu

 

[2] A Spectrum Evaluation Benchmark for Medical Multi-Modal Large Language Models. (ACL 2025, CCF A)

Jie Liu*, Wenxuan Wang*, Yihang Su, Jingyuan Huang, Wenting Chen, Xiaohan Xing, Linlin Shen, Michael Lyu

 

[3] On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents. (ICML 2025, CCF A)

Jen-tse Huang, Jiaxu Zhou, Tailin Jin, Xuhui Zhou, Zixi Chen, Wenxuan Wang, Youliang Yuan, Michael R. Lyu, Maarten Sap

 

[4] Competing Large Language Models in Multi-Agent Gaming Environments. (ICLR 2025, CAAI A)

Jen-tse Huang, Eric John Li, Man Ho Lam, Tian Liang, Wenxuan Wang, Youliang Yuan, Wenxiang Jiao, Xing Wang, Zhaopeng Tu, Michael R. Lyu

 

[5] Apathetic or Empathetic? Evaluating LLMs' Emotional Alignment with Humans. (NeurIPS 2024, CCF A)

Jen-tse Huang, Man Ho Lam, Eric John Li, Shujie Ren, Wenxuan Wang, Wenxiang Jiao, Zhaopeng Tu, Michael R. Lyu

 

[6] New Job, New Gender? Measuring the Social Bias in Image Generation Models. (ACM MM 2024, CCF A)

Wenxuan Wang, Haonan Bai, Jen-tse Huang, Yuxuan Wan, Youliang Yuan, Haoyi Qiu, Nanyun Peng, Michael R. Lyu

 

[7] Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in Large Language Models. (ACL 2024, CCF A)

Wenxuan Wang, Wenxiang Jiao, Jingyuan Huang, Ruyi Dai, Jen-tse Huang, Zhaopeng Tu, Michael R. Lyu

 

[8] On the Reliability of Psychological Scales on Large Language Models. (EMNLP 2024, CAAI A)

Jen-tse Huang, Wenxiang Jiao, Man Ho Lam, Eric John Li, Wenxuan Wang, Michael R. Lyu

 

[9] LogicAsker: Evaluating and Improving the Logical Reasoning Ability of Large Language Models (EMNLP 2024, CAAI A)

Yuxuan Wan*, Wenxuan Wang*, Yiliu Yang, Youliang Yuan, Jen-tse Huang, Pinjia He, Wenxiang Jiao, Michael R. Lyu

 

[10] An Image is Worth a Thousand Toxic Words: A Metamorphic Testing Framework for Content Moderation Software (ASE 2023, CCF A)

Wenxuan Wang, Jingyuan Huang, Jen-tse Huang, Chang Chen, Jiazhen Gu, Pinjia He, Michael R. Lyu

 

[11] Validating Multimedia Content Moderation Software via Semantic Fusion. (ISSTA 2023, CCF A)

Wenxuan Wang, Jingyuan Huang, Chang Chen, Jiazhen Gu, Jianping Zhang, Weibin Wu, Pinjia He, Michael Lyu

 

[12] MTTM: Metamorphic Testing for Textual Content Moderation Software. (ICSE 2023, CCF A)

Wenxuan Wang, Jen-tse Huang, Weibin Wu, Jianping Zhang, Yizhan Huang, Shuqing Li, Pinjia He, Michael Lyu

 

[13] BiasAsker: Measuring the Bias in Conversational AI System (FSE 2023, CCF A)

Yuxuan Wan*, Wenxuan Wang*, Pinjia He, Jiazhen Gu, Haonan Bai, Michael Lyu

 

[14] Understanding and Improving Sequence-to-Sequence Pretraining for Neural Machine Translation (ACL 2022, CCF A)

Wenxuan Wang, Wenxiang Jiao, Yongchang Hao, Xing Wang, Shuming Shi, Zhaopeng Tu, Michael Lyu

 

[15] FPETS : Fully Parallel End-to-End Text-to-Speech System (AAAI 2020, CCF A)

Dabiao Ma*, Zhiba Su*, Wenxuan Wang*, Yuhao Lu


社会兼职

国际会议/期刊审稿人:ICMLNeurIPSICLRACLCVPRACM MM

荣誉获奖

1.      深圳市科协优秀论文奖 (2024)

2.      ACM杰出论文奖(ASE 2023

3.      腾讯犀牛鸟精英人才奖(2021