Kaicheng Yu

Westlake University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Computer Vision (2)Multimodal Models (2)Inference & Quantization (1)

Frequent co-authors

Tianhang Wang (2)Wei Song (1)Tong Zhang (1)Zuxuan Wu (1)

Papers (3)

May 25, 2026

3w ago·also CAS, Fudan, Westlake, ZJU

Channel-wise Vector Quantization

Forget patch-based image tokenization: channel-wise quantization unlocks better codebook utilization and text-to-image generation by representing images as discrete levels of visual detail.

Wei Song, Tianhang Wang, Tong Zhang +2

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

Mar 2, 2026

Mar 2, 2026·also HKU, Li Auto, Waymo

DriveCombo: Benchmarking Compositional Traffic Rule Reasoning in Autonomous Driving

MLLMs that ace simple traffic rules still struggle when multiple rules interact, especially when they conflict, revealing a critical gap in their ability to handle real-world driving complexity.

Enhui Ma, Jiahuan Zhang, Guantian Zheng +8

Eval Frameworks & Benchmarks Multimodal Models Robotics & Embodied AI

Feb 12, 2026

Feb 12, 2026·also Li Auto, Qingdao University Hospital, School of Computing and Artificial Intelligence, Shanghai Innovation +3

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

A 5B model just crushed the image generation and editing performance of models 5-16x larger, thanks to smarter feature fusion and a novel RL training strategy.

Ruihang Li, Feng Han, Wei Song +14

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Search

Kaicheng Yu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)