Daixuan Cheng - Personal Homepage

Selected Papers

Computer Environments Elicit General Agentic Intelligence in LLMs

Daixuan Cheng, Shaohan Huang, Yuxian Gu, Huatong Song, Guoxin Chen, Li Dong, Wayne Xin Zhao, Ji-Rong Wen, Furu Wei

arXiv preprint, 2026 — General/Code Agent
Coding Agents are General Agents · 🤗 #1 Paper of the Day · YouTube 300K+ views

PDF Project Code 🤗 Hugging Face Report by 机器之心 (Jiqizhixin) YouTube by Parthknowsai

ClawGym: A Scalable Framework for Building Effective Claw Agents

Fei Bai*, Huatong Song*, Shuang Sun*, Daixuan Cheng, Yike Yang, Chuan Hao, Renyuan Li, Feng Chang, Yuan Wei, Ran Tao, Bryan Dai, Jian Yang, Wayne Xin Zhao, Ji-Rong Wen

arXiv preprint, 2026 — Agentic data collection, training infra and evaluation benchmark
My role: built the black-box agentic RL pipeline for OpenClaw

PDF Code WeChat Report

Reasoning with Exploration: An Entropy Perspective

Daixuan Cheng, Shaohan Huang, Xuekai Zhu, Bo Dai, Wayne Xin Zhao, Zhenliang Zhang, Furu Wei

AAAI 2026 — Exploration of RL in LLM Reasoning
Earliest Research on Entropy and Exploration · No. 1 Most Influential Paper of AAAI 2026

PDF 知乎 (Zhihu) by tomsheep Review by Paper Digest

Adapting Large Language Models via Reading Comprehension

Daixuan Cheng, Shaohan Huang, Furu Wei

ICLR 2024 — Domain Adaptation (Continual Pre-Training) of LLMs
Earliest Research on Domain LLMs · 500K+ Downloads · #1 Trending of All Domain LLMs · 🤗 #2 Paper of the Day

PDF Code 🤗 Hugging Face X/Twitter by Rohan Paul

Instruction Pre-Training: Language Models are Supervised Multitask Learners

Daixuan Cheng, Yuxian Gu, Shaohan Huang, Junyu Bi, Minlie Huang, Furu Wei

EMNLP 2024 (Main, Long Paper) — LLM Pre-training and Mid-training
Earliest Research on Mid-Training · 300K+ Downloads · #2 Trending of All HF Datasets · 🤗 #2 Paper of the Day

PDF Code 🤗 Hugging Face Blog by Sebastian Raschka

UPRISE: Universal Prompt Retrieval for Improving Zero-Shot Evaluation

Daixuan Cheng, Shaohan Huang, Junyu Bi, Yuefeng Zhan, Jianfeng Liu, Yujing Wang, Hao Sun, Furu Wei, Denvy Deng, Qi Zhang

EMNLP 2023 (Main, Long Paper) — Retrieval Augmented Generation
Early Research on RAG · Top ML Papers of the Week (along with GPT-4)

PDF Code X/Twitter by AK

FlowRL: Matching Reward Distributions for LLM Reasoning

Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, Hengli Li, Kaiyan Zhang, Che Jiang, Youbang Sun, Ermo Hua, Yuxin Zuo, Xingtai Lv, Qizheng Zhang, Lin Chen, Fanghao Shao, Bo Xue, Yunchong Song, Zhenjie Yang, Ganqu Cui, Ning Ding, Jianfeng Gao, Xiaodong Liu, Bowen Zhou, Hongyuan Mei, Zhouhan Lin

ICLR 2026 — Exploration of RL in LLM Reasoning
GFlowNet for LLM Reasoning · 🤗 #1 Paper of the Day

PDF Code VERL Recipe X/Twitter by Aran Komatsuzaki

On Domain-Adaptive Post-Training for Multimodal Large Language Models

Daixuan Cheng, Shaohan Huang, Ziyu Zhu, Xintong Zhang, Wayne Xin Zhao, Zhongzhi Luan, Bo Dai, Zhenliang Zhang

EMNLP 2025 (Findings, Long Paper) — Domain Adaptation of MLLMs
Earliest Research on Domain MLLMs

PDF Code 🤗 Hugging Face

How to Synthesize Text Data without Model Collapse?

Xuekai Zhu, Daixuan Cheng, Hengli Li, Kaiyan Zhang, Ermo Hua, Xingtai Lv, Ning Ding, Zhouhan Lin, Zilong Zheng, Bowen Zhou

ICML 2025 — Synthetic Data
Semi-Synthetic Data Avoids Model Collapse

PDF Code

VL-Match: Enhancing Vision-Language Pretraining with Token-Level and Instance-Level Matching

Junyu Bi, Daixuan Cheng, Ping Yao, Bochen Pang, Yuefeng Zhan, Chuanguang Yang, Yujing Wang, Hao Sun, Weiwei Deng, Qi Zhang

ICCV 2023 — Pre-Training of Vision-Language Models
ELECTRA-VL

PDF

Snapshot-guided Domain Adaptation for ELECTRA

Daixuan Cheng, Shaohan Huang, Jianfeng Liu, Yuefeng Zhan, Hao Sun, Furu Wei, Denvy Deng, Qi Zhang

EMNLP 2022 (Findings, Short Paper) — Domain Adaptation of LM
Continual Pre-Training for Encoder-based LMs

PDF

Daixuan Cheng 成岱璇

Current focus: agentic LLM training

Agent harness

Agentic RL infra

RL algorithms

Other directions

Pre-training & Mid-training

Post-training & Adaptation

Synthetic data

Education & Experience

Education

Experience

Selected Papers

Honors & Community Impact