Zhenhua Dong

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (3)Inference & Quantization (2)Natural Language Processing (2)Recommendation & Information Retrieval (2)

Frequent co-authors

Yu-Yang Qian (1)Yuanpan Qian (1)Hao Wu (1)Hao-Cong Wu (1)

Papers (5)

Jul 21, 2026

5d ago

AdaFlash: Adaptive Speculative Decoding via On-Policy Distilled Diffusion Drafters

High variance in draft quality is tackled head-on, leading to a remarkable 66% increase in throughput for speculative decoding in large language models.

Yu-Yang Qian, Yuanpan Qian, Hao Wu +7

Inference & Quantization Natural Language Processing Training Efficiency & Optimization

Jun 22, 2026

Yuanzi Li +6Jun 22, 2026

Towards Fast Domain Adaptation and Fine-Grained User Simulation for Evaluating Conversational Recommender Systems

AdaptSim transforms CRS evaluation by generating realistic dialogues that adapt to diverse user styles and preferences, overcoming traditional simulator limitations.

Yuanzi Li, Quanyu Dai, Xueyang Feng +4

Natural Language Processing Recommendation & Information Retrieval

Mar 17, 2026

Ji-Fu Li +6Mar 17, 2026·also Corresponding author. Preprint

BATQuant: Outlier-resilient MXFP4 Quantization via Learnable Block-wise Optimization

MXFP4 quantization just got a whole lot better: BATQuant recovers up to 96.43% of full-precision performance in LLMs and MLLMs, even under aggressive W4A4KV16 settings, by preventing outlier propagation across quantization blocks.

Ji-Fu Li, Manyi Zhang, Xiaobo Xia +4

Inference & Quantization Multimodal Models Training Efficiency & Optimization

Feb 23, 2026

Feb 23, 2026·also Huawei, Kuaishou

FairFS: Addressing Deep Feature Selection Biases for Recommender System

Existing deep feature selection methods for recommender systems suffer from layer, baseline, and approximation biases, leading to suboptimal feature selection, which FairFS effectively mitigates.

Zhaocheng Du, Qinglin Jia, Zhenhua Dong

Constitutional AI & AI Ethics Recommendation & Information Retrieval Training Efficiency & Optimization

Jan 7, 2026

Xing Li +5Jan 7, 2026

What Matters For Safety Alignment?

User-defined response prefixes in LLMs are a major safety risk, enabling CoT attacks to achieve near-perfect success rates on some models.

Xing Li, Hui-Ling Zhen, Lihao Yin +3

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness

Search

Zhenhua Dong

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)