Xiaoyang Qu

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (1)RLHF & Preference Learning (1)Architecture Design (Transformers, SSMs, MoE) (1)Multimodal Models (1)

Frequent co-authors

Minghui Zheng (1)Hongxu Chen (1)Huimin Ren (1)Hongsheng Xin (1)

Papers (2)

Jun 1, 2026

Minghui Zheng +10Jun 1, 2026·also HKUST, HUST

HMPO: Hybrid Median-length Policy Optimization for Chain-of-Thought Compression

Achieving up to 46% token compression without sacrificing accuracy, HMPO revolutionizes the efficiency of chain-of-thought reasoning in large language models.

Minghui Zheng, Hongxu Chen, Huimin Ren +8

Reasoning & Chain-of-Thought RLHF & Preference Learning

May 25, 2026

Ping An Technology (Shenzhen) Co.May 25, 2026·also USTC

DIVA: Harnessing the Representation Divergence in Unified Multimodal Models for Mutual Reinforcement

Unified multimodal models suffer from internal conflict, but this work shows how to turn that interference into a surprisingly effective source of performance gains.

Renjie Lu, Xulong Zhang, Xiaoyang Qu +2

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Training Efficiency & Optimization

Search

Xiaoyang Qu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)