Jiwen Lu

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (4)Architecture Design (Transformers, SSMs, MoE) (3)Robotics & Embodied AI (3)Multimodal Models (3)Inference & Quantization (2)

Frequent co-authors

Lei Chen (2)Jie Zhou (2)Yu Zheng (2)Sicheng Zuo (2)

Papers (7)

Apr 23, 2026

Yixuan Zhu +7Apr 23, 2026

VARestorer: One-Step VAR Distillation for Real-World Image Super-Resolution

VARestorer distills a text-to-image VAR model into a one-step super-resolution network, achieving state-of-the-art image quality with a 10x speedup.

Yixuan Zhu, Haolin Wang, Ao Li +5

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

Tsinghua AIApr 23, 2026

UniGenDet: A Unified Generative-Discriminative Framework for Co-Evolutionary Image Generation and Generated Image Detection

By unifying generative and discriminative approaches, UniGenDet achieves superior image generation and detection, suggesting that these tasks benefit from a symbiotic relationship previously hindered by architectural divergence.

Yanran Zhang, Wenzhao Zheng, Yifei Li +5

Architecture Design (Transformers, SSMs, MoE)Computer Vision Data Curation & Synthetic Data

Apr 8, 2026

Tsinghua AIApr 8, 2026

CMP: Robust Whole-Body Tracking for Loco-Manipulation via Competence Manifold Projection

Legged robots can now recover from sensor noise and crazy user commands with 10x greater reliability, thanks to a new method that respects the robot's competence boundaries.

Ziyang Cheng, Haoyu Wei, Xiuwei Xu +1

Robotics & Embodied AI

Apr 5, 2026

Xianglong Liu +2Apr 5, 2026

BWTA: Accurate and Efficient Binarized Transformer by Algorithm-Hardware Co-design

Binarizing weights and ternarizing activations in Transformers can deliver 16-24x kernel speedup and comparable accuracy to full-precision models, finally making ultra-low-bit quantization practical.

Xianglong Liu, Shenghao Jin, Jiwen Lu

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Apr 1, 2026

Sicheng Zuo +8Apr 1, 2026

DVGT-2: Vision-Geometry-Action Model for Autonomous Driving at Scale

Ditch language descriptions: this new driving model leverages dense 3D geometry for superior autonomous driving performance and cross-camera generalization.

Sicheng Zuo, Zixun Xie, Wenzhao Zheng +6

Multimodal Models Robotics & Embodied AI World Models & Planning

Mar 19, 2026

Weijia Dou +4Mar 19, 2026

Measuring 3D Spatial Geometric Consistency in Dynamic Generated Videos

Generative videos might look great, but a new metric reveals they often suffer from jarring 3D spatial inconsistencies that existing metrics miss.

Weijia Dou, Weiliang Chen, Yu Zheng +2

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Dong Zhuo +8Mar 19, 2026·also Huawei

DriveTok: 3D Driving Scene Tokenization for Unified Multi-View Reconstruction and Understanding

DriveTok achieves unified multi-view reconstruction and understanding by learning scene tokens that integrate semantic, geometric, and textural information, outperforming existing 2D tokenizers in autonomous driving scenarios.

Dong Zhuo, Dong Zhuo, Sicheng Zuo +6

Computer Vision Multimodal Models Robotics & Embodied AI

Search

Jiwen Lu

Research focus

Frequent co-authors

Papers (7)