Jiaqi Wang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (5)Multimodal Models (5)Inference & Quantization (4)RLHF & Preference Learning (3)

Frequent co-authors

Qingyi Si (5)Naibin Gu (3)Chenxu Yang (3)Chuanyu Qin (3)

Papers (10)

Jun 29, 2026

NUS2w ago·also Explore Academy

DOPD: Dual On-policy Distillation

DOPD reveals that intelligently routing supervision based on advantage gaps can significantly enhance capability transfer in distillation, outperforming conventional methods.

Xinlei Yu, Gen Li, Qingyi Si +17

Inference & Quantization Training Efficiency & Optimization

Jun 17, 2026

3w ago·also CUHK

Beyond the Current Observation: Evaluating Multimodal Large Language Models in Controllable Non-Markov Games

Forgetting earlier observations, not decision-making flaws, is the primary source of errors in multimodal LLMs navigating complex tasks.

Shengyuan Ding, Xilin Wei, Xinyu Fang +3

Eval Frameworks & Benchmarks Multimodal Models

Jun 15, 2026

Jun 15, 2026·also Stanford HAI, CUHK, NTU, Shanghai Innovation

PermaVid: Consistent Video Generation Across Edits via Disentangled Context Memory

PermaVid achieves unprecedented long-term consistency in video generation, even after significant edits, by intelligently disentangling appearance and geometry in memory.

Bingjie Gao, Ziwei Liu, Jiaqi Wang +1

Computer Vision Multimodal Models

Jun 10, 2026

Dingyu Yao +13Jun 10, 2026

JoyAI-VL-Interaction: Real-Time Vision-Language Interaction Intelligence

Human raters overwhelmingly prefer JoyAI-VL-Interaction over existing video-call assistants, showcasing a leap in real-time interaction capabilities.

Dingyu Yao, Junhao Zhou, Chenxu Yang +11

Multimodal Models Tool Use & Agents

Jun 8, 2026

Microsoft ResearchJun 8, 2026·also DAMO, CUHK, Shanghai AI Lab, Shanghai Innovation +1

CapRL++: Unified Reinforcement Learning with Verifiable Rewards for Dense Image and Video Captioning

CapRL++ redefines caption quality through utility, enabling models to produce high-fidelity descriptions without the constraints of traditional supervised fine-tuning.

Penghui Yang, Long Xing, Xiaoyi Dong +8

Computer Vision Multimodal Models RLHF & Preference Learning

Jun 6, 2026

Ziang Li +7Jun 6, 2026

Light-WAM: Efficient World Action Models with State-Fusion Action Decoding

Light-WAM achieves high-performance robot manipulation with just 0.44B parameters, revolutionizing the efficiency of World Action Models.

Ziang Li, Dongzhou Cheng, Yibin Wang +5

Robotics & Embodied AI Training Efficiency & Optimization World Models & Planning

Apr 29, 2026

Co-Evolving Policy Distillation

By co-evolving experts through bidirectional policy distillation, CoPD achieves all-in-one integration of text, image, and video reasoning, outperforming domain-specific experts and suggesting a new training paradigm.

Naibin Gu, Chenxu Yang, Qingyi Si +7

Inference & Quantization Training Efficiency & Optimization

Apr 22, 2026

Apr 22, 2026·also BAAI

Near-Future Policy Optimization

Forget external teachers – the best way to boost your RL model's performance is to learn from its future self.

Chuanyu Qin, Chenxu Yang, Chen Yang +9

RLHF & Preference Learning Training Efficiency & Optimization

Apr 3, 2026

Chenxu Yang +9Apr 3, 2026

Self-Distilled RLVR

Self-distillation in LLMs can leak information and destabilize training, but combining it with verifiable rewards yields a sweet spot for improved convergence and stability.

Chenxu Yang, Chuanyu Qin, Qingyi Si +7

Inference & Quantization RLHF & Preference Learning Training Efficiency & Optimization

Mar 18, 2026

Zhou Fang +5Mar 18, 2026

ProbeFlow: Training-Free Adaptive Flow Matching for Vision-Language-Action Models

Robot control gets a whole lot faster: ProbeFlow slashes action decoding latency by 14.8x in Vision-Language-Action models, all without retraining.

Zhou Fang, Jiaqi Wang, Yi Zhou +3

Inference & Quantization Multimodal Models Robotics & Embodied AI

Search

Jiaqi Wang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (10)