Jie Huang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (3)Inference & Quantization (2)Training Efficiency & Optimization (2)Architecture Design (Transformers, SSMs, MoE) (2)

Frequent co-authors

Zeyue Xue (2)Siming Fu (2)Haoran Li (2)Yuming Li (2)

Papers (4)

Apr 28, 2026

Zeyue Xue +11Apr 28, 2026

A Systematic Post-Train Framework for Video Generation

Unlock the full potential of your pretrained video diffusion models with a surprisingly simple four-stage post-training framework that drastically improves visual quality, temporal coherence, and instruction following.

Zeyue Xue, Siming Fu, Jie Huang +9

Computer Vision Inference & Quantization Training Efficiency & Optimization

Apr 21, 2026

K while prior methods are limited toApr 21, 2026·also Intelligent Creation, University of Science and Technology, USTC

IR-Flow: Bridging Discriminative and Generative Image Restoration via Rectified Flow

Linear transport flows between degraded and clean image domains enable fast, adaptable image restoration that outperforms existing methods in distortion-perception balance.

Zihao Fan, Xin Lu, Jie Huang +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision

Apr 8, 2026

Apr 8, 2026·also DAMO, ZJU

MAR-GRPO: Stabilized GRPO for AR-diffusion Hybrid Image Generation

RL fine-tuning of hybrid autoregressive-diffusion models can be made significantly more stable and effective by averaging gradients across multiple diffusion trajectories and filtering autoregressive tokens for consistency.

Xiaoxiao Ma, Tianfei Ren, Jie Huang +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision Training Efficiency & Optimization

Mar 12, 2026

Mar 12, 2026·also NVIDIA, SJTU, ZJU

OmniForcing: Unleashing Real-time Joint Audio-Visual Generation

Achieve real-time, synchronized audio-visual generation at 25 FPS by distilling a bidirectional diffusion model into a fast, autoregressive architecture, overcoming training instability with novel alignment and token handling techniques.

Yaofeng Su, Yuming Li, Yuming Li +8

Inference & Quantization Multimodal Models Speech & Audio

Search

Jie Huang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)