Boyang Zheng

Papers on Lattice

Total citations

Topics

h-index

Research focus

Architecture Design (Transformers, SSMs, MoE) (2)Computer Vision (2)Inference & Quantization (1)Multimodal Models (1)

Frequent co-authors

Xiaofeng Mao (1)Shaohao Rui (1)Kaining Ying (1)Chuanhao Li (1)

Papers (2)

Mar 26, 2026

Xiaofeng Mao +6Mar 26, 2026

PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference

Forget training on long videos – PackForcing achieves state-of-the-art long-video generation by cleverly compressing the KV-cache into Sink, Mid, and Recent tokens, enabling 24x temporal extrapolation from short-video training.

Xiaofeng Mao, Shaohao Rui, Kaining Ying +4

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

Mar 3, 2026

Meta AIMar 3, 2026·also NYU

Beyond Language Modeling: An Exploration of Multimodal Pretraining

Vision models are far more data-hungry than language models, but Mixture-of-Experts can harmonize this asymmetry for truly unified multimodal models.

Shengbang Tong, David Fan, John Nguyen +18

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Search

Boyang Zheng

Research focus

Frequent co-authors

Papers (2)