Xiaojie Li

ByteDance Seed

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Computer Vision (3)Multimodal Models (3)RLHF & Preference Learning (3)Speech & Audio (1)

Frequent co-authors

Ming Li (1)Jie Wu (1)Justin Cui (1)Rui Wang (1)

Papers (4)

Apr 27, 2026

4d ago·also UCF

ViPO: Visual Preference Optimization at Scale

Scaling visual preference optimization hinges on data quality, as demonstrated by the finding that standard DPO suffices for a sufficiently large and clean dataset, while a novel Poly-DPO objective is crucial for noisy data.

Ming Li, Jie Wu, Justin Cui +2

Computer Vision Multimodal Models RLHF & Preference Learning

Apr 15, 2026

Team Seedance +1512w ago·also Arizona, ByteDance, Central South University, HKU +5

Seedance 2.0: Advancing Video Generation for World Complexity

Seedance 2.0 leapfrogs existing models by unifying multi-modal inputs (text, image, audio, video) into a single architecture for generating high-quality, longer-duration audio-video content.

Team Seedance, De Chen, Liyang Chen +149

Computer Vision Multimodal Models Speech & Audio

Apr 1, 2026

Huaiyang Wang +6Apr 1, 2026·also ByteDance

Policy Improvement Reinforcement Learning

RLHF can be made more stable and effective by explicitly verifying and reinforcing policy improvements against a historical baseline, rather than relying solely on instantaneous reward signals.

Huaiyang Wang, Xiaojie Li, Deqing Wang +4

Reasoning & Chain-of-Thought RLHF & Preference Learning

Feb 27, 2026

Feb 27, 2026·also ByteDance

Enhancing Spatial Understanding in Image Generation via Reward Modeling

A reward model trained on spatial relationship preferences beats proprietary models at spatial understanding in text-to-image generation, and unlocks better RL-based image generation.

Zhenyu Tang, Chaoran Feng, Yufan Deng +2