Ganqu Cui

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (2)Inference & Quantization (1)Reasoning & Chain-of-Thought (1)Code Generation & Program Synthesis (1)

Frequent co-authors

Qingyang Zhang (1)Xinke Kong (1)Haitao Wu (1)Qinghua Hu (1)

Papers (3)

Apr 21, 2026

Qingyang Zhang +95d ago

TEMPO: Scaling Test-time Training for Large Reasoning Models

Test-time training can finally scale for large reasoning models: TEMPO unlocks sustained performance gains by interleaving policy refinement with periodic critic recalibration, boosting accuracy by over 18% on challenging benchmarks.

Qingyang Zhang, Xinke Kong, Haitao Wu +7

Inference & Quantization Reasoning & Chain-of-Thought Training Efficiency & Optimization

Mar 17, 2026

Mar 17, 2026·also USTC

InCoder-32B: Code Foundation Model for Industrial Scenarios

A new 32B code LLM trained specifically for industrial tasks crushes existing models on specialized domains like chip design and GPU kernel optimization, while remaining competitive on general coding benchmarks.

Jian Yang, Wei Zhang, Jiajun Wu +28

Code Generation & Program Synthesis Distributed Systems & Hardware Open-Source Models & Weights

Mar 9, 2026

Tsinghua AIMar 9, 2026

How Far Can Unsupervised RLVR Scale LLM Training?

Intrinsic reward signals in unsupervised RL for LLMs inevitably collapse due to sharpening of the model's prior, but external rewards grounded in computational asymmetries offer a path to sustained scaling.

Bingxiang He, Bingxiang He, Yuxin Zuo +30

RLHF & Preference Learning Scalable Oversight & Alignment Theory Training Efficiency & Optimization

Search

Ganqu Cui

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)