Haoran Li

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Multimodal Models (2)Computer Vision (1)Training Efficiency & Optimization (1)

Frequent co-authors

Zeyue Xue (2)Siming Fu (2)Jie Huang (2)Yuming Li (2)

Papers (3)

Apr 28, 2026

Zeyue Xue +113d ago

A Systematic Post-Train Framework for Video Generation

Unlock the full potential of your pretrained video diffusion models with a surprisingly simple four-stage post-training framework that drastically improves visual quality, temporal coherence, and instruction following.

Zeyue Xue, Siming Fu, Jie Huang +9

Computer Vision Inference & Quantization Training Efficiency & Optimization

Apr 22, 2026

D observations into1w ago·also NUS, Tsinghua AI, CAS, DGS-based methods [47 +2

PokeVLA: Empowering Pocket-Sized Vision-Language-Action Model with Comprehensive World Knowledge Guidance

Pocket-sized VLA models can now achieve state-of-the-art robot manipulation performance by pre-training on a curated multimodal dataset and injecting manipulation-relevant representations into the action space.

Yupeng Zheng, Songen Gu, Yuhang Zheng +10

Multimodal Models Robotics & Embodied AI

Mar 12, 2026

NVIDIAMar 12, 2026·also SJTU, ZJU

OmniForcing: Unleashing Real-time Joint Audio-Visual Generation

Achieve real-time, synchronized audio-visual generation at 25 FPS by distilling a bidirectional diffusion model into a fast, autoregressive architecture, overcoming training instability with novel alignment and token handling techniques.

Yaofeng Su, Yaofeng Su, Yuming Li +10

Inference & Quantization Multimodal Models Speech & Audio

Search

Haoran Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)