Yuchen Xie

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Distributed Systems & Hardware (1)Inference & Quantization (1)Multimodal Models (1)Natural Language Processing (1)

Frequent co-authors

Xunliang Cai (2)Yuxuan Hu (1)Jianchao Tan (1)Jiaqi Zhang (1)

Papers (2)

Apr 9, 2026

Apr 9, 2026·also Corresponding author

AsyncTLS: Efficient Generative LLM Inference with Asynchronous Two-level Sparse Attention

Achieve full-attention accuracy with 10x operator speedup and 4.7x throughput improvement in long-context LLM inference by overlapping KV cache transfers with computation.

Yuxuan Hu, Jianchao Tan, Jiaqi Zhang +6

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Mar 29, 2026

Meituan LongCat Team +86Mar 29, 2026·also Independent researchers *Equally, LongCat Team, Meituan

LongCat-Next: Lexicalizing Modalities as Discrete Tokens

LongCat-Next shatters the language-centric paradigm by unifying text, vision, and audio into a single autoregressive model with minimal modality-specific design, finally reconciling understanding and generation in discrete vision modeling.

Meituan LongCat Team, Mei Xiao, Chao Wang +84

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Natural Language Processing

Search

Yuchen Xie

Research focus

Frequent co-authors

Papers (2)