Yan Xie

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (4)Multimodal Models (2)Inference & Quantization (2)Training Efficiency & Optimization (2)

Frequent co-authors

Fengfa Li (2)Lei Ren (2)Guoyang Xia (1)Hongjin Ji (1)

Papers (6)

Jul 2, 2026

Guoyang Xia +73w ago·also CUHK, Li Auto

VLAFlow: A Unified Training Framework for Vision-Language-Action Models via Co-training and Future Latent Alignment

Combining language supervision with future latent alignment in VLA models leads to unprecedented stability and transfer performance across diverse robotic tasks.

Guoyang Xia, Fengfa Li, Hongjin Ji +5

Multimodal Models Robotics & Embodied AI

May 27, 2026

Tao Feng +5May 27, 2026·also UIUC

LRanker: LLM Ranker for Massive Candidates

LLMs can now rank millions of candidates with significant accuracy gains thanks to a novel K-means clustering and graph-based ensemble approach that overcomes context length limitations.

Tao Feng, Zijie Lei, Zhigang Hua +3

Architecture Design (Transformers, SSMs, MoE)Natural Language Processing Recommendation & Information Retrieval

May 25, 2026

Tsinghua AIMay 25, 2026·also Li Auto, Southwest Jiaotong University

AnyScene: Towards Highly Controllable Driving Scene Generation at Anywhere and Beyond

Unlock scalable autonomous driving simulation with AnyScene, a framework that generates controllable, high-fidelity driving scenes from arbitrary BEV layouts and camera configurations.

Haiming Zhang, Junfei Zhou, Feng Jiang +6

Computer Vision Data Curation & Synthetic Data World Models & Planning

Apr 23, 2026

Yilong Chen +12Apr 23, 2026·also CAS

Beyond N-gram: Data-Aware X-GRAM Extraction for Efficient Embedding Parameter Scaling

By dynamically injecting frequency-aware n-gram features, X-GRAM achieves state-of-the-art accuracy with smaller embedding tables, offering a practical path to scaling memory-augmented architectures.

Yilong Chen, Yan Xie, Zitian Gao +10

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Apr 20, 2026

Tsinghua AIApr 20, 2026·also SCUT

M100: An Orchestrated Dataflow Architecture Powering General AI Computing

Ditching caches for compiler-managed data streams, Li Auto's M100 architecture achieves higher utilization than GPUs on autonomous driving tasks, hinting at a new path for efficient AI inference.

Yan Xie, Changkui Mao, Changsong Wu +39

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Training Efficiency & Optimization

Feb 10, 2026

AI LabFeb 10, 2026·also CAS, Imperial, Kuaishou, Li Auto +3

Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs

Forget months of architecture search: this hardware co-design framework slashes the time to days and beats Qwen2.5-0.5B's perplexity by 19% at the same latency on NVIDIA Jetson Orin.

Luoyang Sun, Jiwen Jiang, Yifeng Ding +14

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization+2

Search

Yan Xie

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (6)