Reinforcement Learning with Promising Tokens for Large Language Models

Published: May 26, 2026

Recommended citation: Jing-Cheng Pang*, Liang Lu, Xian Tang, Kun Jiang, Sijie Wu, Kai Zhang and Xubin Li. Reinforcement Learning with Promising Tokens for Large Language Models. ICML 2026 Workshop on Foundations of Deep Generative Models.

Direct Link

Share on

Twitter Facebook LinkedIn