Zhen Li

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Inference & Quantization (2)Training Efficiency & Optimization (2)Computer Vision (2)Reasoning & Chain-of-Thought (1)

Frequent co-authors

Dengyang Jiang (2)Peng Gao (2)Xin Jin (1)Huanqia Cai (1)

Papers (5)

Jun 8, 2026

Eastern Institute of Technology2d ago·also DAMO, QFNU

Beyond Scalar Rewards by Internalizing Reasoning into Score Distributions

Z-Reward achieves nearly 90% human preference accuracy by transforming subjective visual preferences into nuanced score distributions, outperforming traditional reward models.

Xin Jin, Huanqia Cai, Zhen Li +8

Reasoning & Chain-of-Thought RLHF & Preference Learning

May 25, 2026

Zhen Li +22w ago·also Shanghai AI Lab

Joint Optimization of Training and Inference in Federated Edge Learning via Constrained Multi-Objective Deep Reinforcement Learning

Resource-constrained edge devices can achieve Pareto-optimal trade-offs between inference accuracy, latency, and energy consumption in federated learning by using a constrained multi-objective reinforcement learning approach.

Zhen Li, Jun Cai, Chao Yang

Distributed Systems & Hardware Inference & Quantization Training Efficiency & Optimization

May 6, 2026

DAMOMay 6, 2026·also CUHK, HKUST, QFNU

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

Fine-tuning efficient few-step diffusion models no longer requires sacrificing their speed, thanks to a self-distillation approach that preserves inference capabilities.

Dengyang Jiang, Dongyang Liu, Zanyi Wang +8

Computer Vision Inference & Quantization Training Efficiency & Optimization

Apr 9, 2026

Zhen Li +1Apr 9, 2026

A Direct Approach for Handling Contextual Bandits with Latent State Dynamics

Forget reward function dependencies – this new approach to contextual bandits with latent state dynamics achieves stronger regret bounds by directly modeling hidden state dependencies and adaptively estimating HMM parameters.

Zhen Li, Gilles Stoltz

Recommendation & Information Retrieval

Apr 1, 2026

Yiyao Zhu +8Apr 1, 2026

DLWM: Dual Latent World Models enable Holistic Gaussian-centric Pre-training in Autonomous Driving

Pre-training with Dual Latent World Models unlocks significant performance gains in autonomous driving tasks by learning holistic Gaussian-centric representations.

Yiyao Zhu, Ying Xue, Haiming Zhang +6

Computer Vision Robotics & Embodied AI World Models & Planning

Search

Zhen Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)