Daixuan Cheng - Personal Homepage

Education & Experience

Education

Ph.D. in Artificial Intelligence, Gaoling School of AI, Renmin University of China (2025 – Present)

Advisor: Xin Zhao

M.S. in Computer Science, Beijing University of Posts and Telecommunications (2020 – 2023)

Advisor: Haifeng Sun

B.S. in Communication Engineering, Beijing University of Posts and Telecommunications (2016 – 2020)

Research Experience

Research Student, GenAI Group, Microsoft Research (2021 – Present)

Advisors: Shaohan Huang & Furu Wei

Research Assistant, CoAI Group, Tsinghua University (2023 – 2024)

Advisors: Yuxian Gu & Minlie Huang

Research Engineer (Full-Time), Beijing Institute for General Artificial Intelligence (2023 – 2025)

Collaborator: Xuekai Zhu

Selected Papers

View Full List on Google Scholar →

LLM-in-Sandbox Elicits General Agentic Intelligence

Daixuan Cheng, Shaohan Huang, Yuxian Gu, Huatong Song, Guoxin Chen, Li Dong, Wayne Xin Zhao, Ji-Rong Wen, Furu Wei

arXiv preprint, 2026 — General/Code Agent
Code Agents are General Agents · 🤗 #1 Paper of the Day · YouTube 300K+ views

PDF Project Code 🤗 Hugging Face Report by 机器之心 (Jiqizhixin) YouTube by Parthknowsai

Reasoning with Exploration: An Entropy Perspective

Daixuan Cheng, Shaohan Huang, Xuekai Zhu, Bo Dai, Wayne Xin Zhao, Zhenliang Zhang, Furu Wei

AAAI 2026 — Exploration of RL in LLM Reasoning
Earliest Research on Entropy and Exploration · Significant Pass@K Gain

PDF 知乎 (Zhihu) by tomsheep

Adapting Large Language Models via Reading Comprehension

Daixuan Cheng, Shaohan Huang, Furu Wei

ICLR 2024 — Domain Adaption (Continual Pre-Training) of LLMs
Earliest Research on Domain LLMs · 500K+ Downloads · #1 Trending of ALL Domain LLMs · 🤗 #2 Paper of the Day

PDF Code 🤗 Hugging Face X/Twitter by Rohan Paul

Instruction Pre-Training: Language Models are Supervised Multitask Learners

Daixuan Cheng, Yuxian Gu, Shaohan Huang, Junyu Bi, Minlie Huang, Furu Wei

EMNLP 2024 (Main, Long Paper) — LLM Pre-training and Mid-training
Earliest Research on Mid-Training · 200K+ Downloads · #2 Trending of ALL HF Datasets · 🤗 #2 Paper of the Day

PDF Code 🤗 Hugging Face Blog by Sebastian Raschka

UPRISE: Universal Prompt Retrieval for Improving Zero-Shot Evaluation

Daixuan Cheng, Shaohan Huang, Junyu Bi, Yuefeng Zhan, Jianfeng Liu, Yujing Wang, Hao Sun, Furu Wei, Denvy Deng, Qi Zhang

EMNLP 2023 (Main, Long Paper) — Early Research on RAG for LLMs
Top ML Papers of the Week (along with GPT-4)

PDF Code X/Twitter by AK

FlowRL: Matching Reward Distributions for LLM Reasoning

Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, Hengli Li, Kaiyan Zhang, Che Jiang, Youbang Sun, Ermo Hua, Yuxin Zuo, Xingtai Lv, Qizheng Zhang, Lin Chen, Fanghao Shao, Bo Xue, Yunchong Song, Zhenjie Yang, Ganqu Cui, Ning Ding, Jianfeng Gao, Xiaodong Liu, Bowen Zhou, Hongyuan Mei, Zhouhan Lin

ICLR 2026 — Exploration of RL in LLM Reasoning
🤗 #1 Paper of the Day

PDF Code VERL Recipe X/Twitter by Aran Komatsuzaki

On Domain-Adaptive Post-Training for Multimodal Large Language Models

Daixuan Cheng, Shaohan Huang, Ziyu Zhu, Xintong Zhang, Wayne Xin Zhao, Zhongzhi Luan, Bo Dai, Zhenliang Zhang

EMNLP 2025 (Findings, Long Paper) — Earliest Research on Domain MLLMs

PDF Code 🤗 Hugging Face

How to Synthesize Text Data without Model Collapse?

Xuekai Zhu, Daixuan Cheng, Hengli Li, Kaiyan Zhang, Ermo Hua, Xingtai Lv, Ning Ding, Zhouhan Lin, Zilong Zheng, Bowen Zhou

ICML 2025 — Synthetic Data for LLMs

PDF Code

VL-Match: Enhancing Vision-Language Pretraining with Token-Level and Instance-Level Matching

Junyu Bi, Daixuan Cheng, Ping Yao, Bochen Pang, Yuefeng Zhan, Chuanguang Yang, Yujing Wang, Hao Sun, Weiwei Deng, Qi Zhang

ICCV 2023 — Pre-training of Vision-Language Models

PDF

Snapshot-guided Domain Adaptation for ELECTRA

Daixuan Cheng, Shaohan Huang, Jianfeng Liu, Yuefeng Zhan, Hao Sun, Furu Wei, Denvy Deng, Qi Zhang

EMNLP 2022 (Findings, Short Paper) — Domain Adaptation of LM

PDF

Daixuan Cheng 成岱璇

Research Interests

General & Code Agent

Reasoning & RL

Pre-Training & Mid-Training

Continual Pre-Training

Synthetic Data

Retrieval Augmented Generation

Education & Experience

Education

Research Experience

Selected Papers

Honors & Awards