Xu-Yao Zhang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Inference & Quantization (2)Computer Vision (2)Multimodal Models (2)Architecture Design (Transformers, SSMs, MoE) (1)Training Efficiency & Optimization (1)

Frequent co-authors

Fanhu Zeng (2)Siqing Song (1)Yong Lang (1)Yichen Shi (1)

Papers (3)

Apr 21, 2026

Siqing Song +2Apr 21, 2026

LBLLM: Lightweight Binarization of Large Language Models via Three-Stage Distillation

LLMs can be aggressively quantized to W(1+1)A4 without significant performance degradation using a surprisingly simple three-stage distillation approach.

Siqing Song, Yong Lang, Xu-Yao Zhang

Architecture Design (Transformers, SSMs, MoE)Inference & Quantization Training Efficiency & Optimization

Apr 1, 2026

Yichen Shi +4Apr 1, 2026·also Tsinghua AI, CAS

CL-VISTA: Benchmarking Continual Learning in Video Large Language Models

Continual learning methods for Video-LLMs face a fundamental trade-off: mitigating catastrophic forgetting often comes at the cost of generalization or prohibitive computational overhead.

Yichen Shi, Hongbo Zhao, Fanhu Zeng +2

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Mar 18, 2026

Mar 18, 2026·also Tsinghua AI, Beihang, Beijing National Research Center for Information

Fine-Grained Post-Training Quantization for Large Vision Language Models with Quantization-Aware Integrated Gradients

Quantizing large vision-language models just got a whole lot better: a new token-level sensitivity metric closes the accuracy gap with full-precision models by up to 1.6% in 3-bit weight-only quantization.

Ziwei Xiang, Fanhu Zeng, Hongjian Fang +5

Computer Vision Inference & Quantization Multimodal Models

Search

Xu-Yao Zhang

Research focus

Frequent co-authors

Papers (3)