Chenxiao Fan

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (1)Natural Language Processing (1)Recommendation & Information Retrieval (1)

Frequent co-authors

Jiaju Chen (1)Chongming Gao (1)Haoyan Liu (1)Qingpeng Cai (1)

Papers (1)

Apr 30, 2026

Zhongguancun AcademyApr 30, 2026·also USTC

Position-Aware Drafting for Inference Acceleration in LLM-Based Generative List-Wise Recommendation

LLMs can generate recommendations up to 3.1x faster by explicitly modeling token position within items and speculation depth during speculative decoding.

Jiaju Chen, Chongming Gao, Chenxiao Fan +4

Inference & Quantization Natural Language Processing Recommendation & Information Retrieval

Search

Chenxiao Fan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)