Xunliang Cai

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (5)Training Efficiency & Optimization (4)Natural Language Processing (3)Eval Frameworks & Benchmarks (3)

Frequent co-authors

Yerui Sun (3)Pingwei Sun (2)Yuxuan Hu (2)Jianchao Tan (2)

Papers (10)

Apr 21, 2026

Corresponding authorApr 21, 2026·also RAE Decode

FG$^2$-GDN: Enhancing Long-Context Gated Delta Networks with Doubly Fine-Grained Control

Channel-wise adaptive learning rates in Gated Delta Networks unlock superior long-context recall, rivaling softmax attention without the quadratic cost.

Pingwei Sun, Yuxuan Hu, Jianchao Tan +5

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Training Efficiency & Optimization

Apr 20, 2026

Wentao Shi +13Apr 20, 2026·also Zhongguancun Academy

AJ-Bench: Benchmarking Agent-as-a-Judge for Environment-Aware Evaluation

Agent-as-a-Judge can outperform LLM-as-a-Judge in complex environments, but still struggles to reliably verify agent behavior, revealing a critical gap in current LLM-based agent evaluation.

Wentao Shi, Yu Wang, Yuyang Zhao +11

Eval Frameworks & Benchmarks Tool Use & Agents

Apr 15, 2026

Apr 15, 2026·also Corresponding author, Meituan

SparseBalance: Load-Balanced Long Context Training with Dynamic Sparse Attention

Training long-context sparse attention models doesn't have to be a slow, imbalanced mess: SparseBalance achieves 1.33x speedup while *improving* accuracy.

Hongtao Xu, Jianchao Tan, Yuxuan Hu +8

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Apr 13, 2026

Dujun Nie +5Apr 13, 2026

LARY: A Latent Action Representation Yielding Benchmark for Generalizable Vision-to-Action Alignment

Surprisingly, general-purpose vision models already contain better action representations for robotic control than specialized embodied models trained explicitly for that purpose.

Dujun Nie, Fengjiao Chen, Qi Lv +3

Eval Frameworks & Benchmarks Multimodal Models Robotics & Embodied AI

Apr 13, 2026

General365: Benchmarking General Reasoning in Large Language Models Across Diverse and Challenging Tasks

LLMs that ace math and physics still struggle with general reasoning, achieving only 63% accuracy on a new K-12 level benchmark.

Junlin Liu, Shengnan An, Shuang Zhou +7

Eval Frameworks & Benchmarks Reasoning & Chain-of-Thought

Apr 12, 2026

Apr 12, 2026·also Fudan, Meituan, NJU

SCOPE: Signal-Calibrated On-Policy Distillation Enhancement with Dual-Path Adaptive Weighting

Stop uniformly distilling your LLMs: SCOPE selectively amplifies teacher guidance on incorrect trajectories and reinforces student uncertainty on correct ones, leading to significant gains in reasoning performance.

Binbin Zheng, Xing Ma, Yiheng Liang +6

Inference & Quantization RLHF & Preference Learning Training Efficiency & Optimization

Apr 9, 2026

Apr 9, 2026·also Corresponding author

AsyncTLS: Efficient Generative LLM Inference with Asynchronous Two-level Sparse Attention

Achieve full-attention accuracy with 10x operator speedup and 4.7x throughput improvement in long-context LLM inference by overlapping KV cache transfers with computation.

Yuxuan Hu, Jianchao Tan, Jiaqi Zhang +6

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Apr 2, 2026

Zhengxi Lu +13Apr 2, 2026·also Tsinghua AI

SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization

LLM agents can internalize skills via in-context RL, achieving zero-shot autonomous behavior without the token overhead and retrieval noise of traditional methods.

Zhengxi Lu, Zhiyuan Yao, Zhiyuan Yao +11

RLHF & Preference Learning Tool Use & Agents Training Efficiency & Optimization

Mar 31, 2026

Detai Xin +8Mar 31, 2026

LongCat-AudioDiT: High-Fidelity Diffusion Text-to-Speech in the Waveform Latent Space

Ditching mel-spectrograms unlocks SOTA text-to-speech with a surprisingly simple diffusion model operating directly on waveform latents.

Detai Xin, Shujie Hu, Chen Yang +6

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Speech & Audio

Mar 29, 2026

Meituan LongCat Team +89Mar 29, 2026·also Central South University, LongCat Team, Meituan

LongCat-Next: Lexicalizing Modalities as Discrete Tokens

LongCat-Next shatters the language-centric paradigm by unifying text, vision, and audio into a single autoregressive model with minimal modality-specific design, finally reconciling understanding and generation in discrete vision modeling.

Meituan LongCat Team, Mei Xiao, Chao Wang +87

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Natural Language Processing

Search

Xunliang Cai

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (10)