Tianhang Wang

Shanghai Innovation Institute, Zhejiang University

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (4)Architecture Design (Transformers, SSMs, MoE) (3)Multimodal Models (2)Inference & Quantization (1)

Frequent co-authors

Wei Song (2)Zuxuan Wu (2)Kaicheng Yu (2)Tong Zhang (1)

Papers (4)

May 25, 2026

3w ago·also CAS, Fudan, Westlake, ZJU

Channel-wise Vector Quantization

Forget patch-based image tokenization: channel-wise quantization unlocks better codebook utilization and text-to-image generation by representing images as discrete levels of visual detail.

Wei Song, Tianhang Wang, Tong Zhang +2

Architecture Design (Transformers, SSMs, MoE)Computer Vision Inference & Quantization

May 21, 2026

3w ago·also Fudan, HUST, Westlake, ZJU

DecQ: Detail-Condensing Queries for Enhanced Reconstruction and Generation in Representation Autoencoders

Freezing your vision foundation model doesn't have to mean sacrificing fine-grained detail: DecQ unlocks improved reconstruction and faster generative convergence with just 8 extra queries and minimal overhead.

Tianhang Wang, Wei Song, Zuxuan Wu +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision Training Efficiency & Optimization

Apr 14, 2026

Sunyao Zhou +8Apr 14, 2026·also Fudan, Shanghai Innovation, ZJU

DeCoNav: Dialog enhanced Long-Horizon Collaborative Vision-Language Navigation

Forget static coordination – robots that chat and dynamically re-plan can achieve a whopping 69% improvement in collaborative navigation success.

Sunyao Zhou, Yunzi Wu, Tianhang Wang +6

Computer Vision Multimodal Models Robotics & Embodied AI

Feb 12, 2026

Feb 12, 2026·also Li Auto, Qingdao University Hospital, School of Computing and Artificial Intelligence, Shanghai Innovation +3

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

A 5B model just crushed the image generation and editing performance of models 5-16x larger, thanks to smarter feature fusion and a novel RL training strategy.

Ruihang Li, Feng Han, Wei Song +14

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Search

Tianhang Wang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)