Qingpeng Cai

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Recommendation & Information Retrieval (2)Inference & Quantization (1)Natural Language Processing (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Jiaju Chen (1)Chongming Gao (1)Chenxiao Fan (1)Haoyan Liu (1)

Papers (2)

Apr 30, 2026

Zhongguancun AcademyApr 30, 2026·also USTC

Position-Aware Drafting for Inference Acceleration in LLM-Based Generative List-Wise Recommendation

LLMs can generate recommendations up to 3.1x faster by explicitly modeling token position within items and speculation depth during speculative decoding.

Jiaju Chen, Chongming Gao, Chenxiao Fan +4

Inference & Quantization Natural Language Processing Recommendation & Information Retrieval

Mar 5, 2026

Mar 5, 2026·also NTU

LBM: Hierarchical Large Auto-Bidding Model via Reasoning and Acting

LLMs can master auto-bidding in dynamic ad environments, but only if you give them a hierarchical architecture and offline RL fine-tuning to avoid hallucinating suboptimal decisions.

Yewen Li, Zhiyi Lyu, Peng Jiang +3

Reasoning & Chain-of-Thought Recommendation & Information Retrieval Tool Use & Agents

Search

Qingpeng Cai

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)