Reinforcement Learning with Promising Tokens for Large Language Models

Published: February 03, 2026

Recommended citation: Jing-Cheng Pang, Liang Lu, Xian Tang, Kun Jiang, Sijie Wu, Kai Zhang and Xubin Li. Reinforcement Learning with Promising Tokens for Large Language Models. CoRR abs/2602.03195, 2026.

Direct Link

Share on

Twitter Facebook LinkedIn