Qingyi Si

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Training Efficiency & Optimization (4)Multimodal Models (4)Inference & Quantization (3)RLHF & Preference Learning (3)

Frequent co-authors

Jiaqi Wang (5)Naibin Gu (4)Chenxu Yang (4)Chuanyu Qin (4)

Papers (9)

Jun 29, 2026

NUS3w ago·also AI Laboratory, JD.com, NJU

DOPD: Dual On-policy Distillation

DOPD reveals that intelligently routing supervision based on advantage gaps can significantly enhance capability transfer in distillation, outperforming conventional methods.

Xinlei Yu, Qingyi Si, Qingyi Si +16

Inference & Quantization Training Efficiency & Optimization

Jun 10, 2026

Dingyu Yao +13Jun 10, 2026·also Joy Future Academy

JoyAI-VL-Interaction: Real-Time Vision-Language Interaction Intelligence

Human raters overwhelmingly prefer JoyAI-VL-Interaction over existing video-call assistants, showcasing a leap in real-time interaction capabilities.

Dingyu Yao, Junhao Zhou, Chenxu Yang +11

Multimodal Models Tool Use & Agents

Jun 4, 2026

Jun 4, 2026·also Beihang, JD.com, UVA

Evaluating Stochastic Collapse and Implicit Bias in Multimodal Large Language Models

MLLMs exhibit alarming Stochastic Collapse, failing to maintain randomness even under explicit random instructions, which could undermine their utility in diverse applications.

Huiyuan Zheng, Houtao Zhang, Boyang Wang +2

Eval Frameworks & Benchmarks Multimodal Models Recommendation & Information Retrieval

Jun 1, 2026

Haowen Hou +10Jun 1, 2026

AdaCodec: A Predictive Visual Code for Video MLLMs

AdaCodec cuts time-to-first-token from 9.26 seconds to just 1.62 seconds while outperforming traditional per-frame RGB encoding methods.

Haowen Hou, Zheng-Ting Huang, Zheming Liang +8

Computer Vision Multimodal Models

May 27, 2026

May 27, 2026·also Fudan, Tongji, UC Merced, UCSB +1

GUI Agents for Continual Game Generation

Frontier models can't build playable games in one shot, but a closed-loop system using GUI agents to playtest and refine code achieves a 66.8% success rate, proving that game generation needs to be a conversation, not a translation.

Zhe Wang, Haonan Ge, Qingyi Si +3

Code Generation & Program Synthesis Eval Frameworks & Benchmarks Tool Use & Agents

Apr 29, 2026

Co-Evolving Policy Distillation

By co-evolving experts through bidirectional policy distillation, CoPD achieves all-in-one integration of text, image, and video reasoning, outperforming domain-specific experts and suggesting a new training paradigm.

Naibin Gu, Chenxu Yang, Qingyi Si +7

Inference & Quantization Training Efficiency & Optimization

Apr 22, 2026

Apr 22, 2026·also BAAI

Near-Future Policy Optimization

Forget external teachers – the best way to boost your RL model's performance is to learn from its future self.

Chuanyu Qin, Chenxu Yang, Chen Yang +9

RLHF & Preference Learning Training Efficiency & Optimization

Apr 18, 2026

EasyVideoR1: Easier RL for Video Understanding

EasyVideoR1 achieves a 1.47 times throughput improvement in video understanding tasks by eliminating redundant video decoding and leveraging a comprehensive task-aware reward system.

Chuanyu Qin, Chenxu Yang, Qingyi Si +4

Computer Vision Multimodal Models RLHF & Preference Learning

Apr 3, 2026

Chenxu Yang +9Apr 3, 2026

Self-Distilled RLVR

Self-distillation in LLMs can leak information and destabilize training, but combining it with verifiable rewards yields a sweet spot for improved convergence and stability.

Chenxu Yang, Chuanyu Qin, Qingyi Si +7

Inference & Quantization RLHF & Preference Learning Training Efficiency & Optimization

Search

Qingyi Si

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (9)