Xing Sun

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Distributed Systems & Hardware (1)Tool Use & Agents (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Mingqi Han (1)Yufei Xu (1)Fanxu Meng (1)Fan Jiang (1)

Papers (2)

Apr 23, 2026

Mingqi Han +1Apr 23, 2026

A Task Decomposition and Planning Framework for Efficient LLM Inference in AI-Enabled WiFi-Offload Networks

Forget simple offloading – this framework intelligently decomposes LLM tasks across devices and edge servers, slashing latency and boosting rewards in congested WiFi networks.

Mingqi Han, Xing Sun

Distributed Systems & Hardware Inference & Quantization Tool Use & Agents

Mar 30, 2026

Yufei Xu +14Mar 30, 2026

HISA: Efficient Hierarchical Indexing for Fine-Grained Sparse Attention

Scanning every token to focus attention is now passé: HISA prunes irrelevant context blocks *before* token-level scoring, slashing compute without sacrificing selection fidelity.

Yufei Xu, Fanxu Meng, Fan Jiang +12

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Search

Xing Sun

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)