Zelin Li

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (1)Training Efficiency & Optimization (1)Natural Language Processing (1)Recommendation & Information Retrieval (1)

Frequent co-authors

Caiwen Ding (1)Zihao Tang (1)Ziyu Xiao (1)Zengxuan Wen (1)

Papers (2)

May 27, 2026

Zelin Li +12w ago·also Corresponding author

LLM Zeroth-Order Fine-Tuning is an Inference Workload

Zeroth-order fine-tuning can be sped up by over 8x by reframing it as an inference workload and executing it within a serving runtime.

Zelin Li, Caiwen Ding

Inference & Quantization Training Efficiency & Optimization

Feb 17, 2026

Zihao Tang +9Feb 17, 2026·also Microsoft Research, Georgia Tech

Mnemis: Dual-Route Retrieval on Hierarchical Graphs for Long-Term LLM Memory

LLMs can now leverage a hierarchical graph structure for memory retrieval, enabling global reasoning and boosting performance on long-term memory benchmarks beyond what's achievable with similarity search alone.

Zihao Tang, Ziyu Xiao, Zengxuan Wen +7

Natural Language Processing Recommendation & Information Retrieval Tool Use & Agents

Search

Zelin Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)