Lattice AI Research

Research focus

Distributed Systems & Hardware (2)Inference & Quantization (2)Training Efficiency & Optimization (1)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Xiaowen Chu (2)Wenxiang Lin (1)Xinglin Pan (1)Ruibo Fan (1)

Papers (2)

Apr 30, 2026

ZipCCL: Efficient Lossless Data Compression of Communication Collectives for Accelerating LLM Training

LLM training bottlenecks? ZipCCL achieves up to 1.18x end-to-end speedups by losslessly compressing communication collectives, without sacrificing model quality.

Wenxiang Lin, Xinglin Pan, Ruibo Fan +3

Distributed Systems & Hardware Inference & Quantization Training Efficiency & Optimization

Oct 21, 2025

Oct 21, 2025·also Tsinghua AI, HKUST

Reasoning Language Model Inference Serving Unveiled: An Empirical Study

Naive application of LLM inference optimizations can *hurt* the performance of smaller reasoning models, highlighting the need for RLLM-specific serving strategies.

Qi Li, Junpan Wu, Xiang Liu +6

Distributed Systems & Hardware Inference & Quantization Reasoning & Chain-of-Thought

Search

S. Shi

Research focus

Frequent co-authors

Papers (2)