Yibo Chen

Xiaohongshu Inc.

Papers on Lattice

Total citations

Topics

h-index

Research focus

Computer Vision (3)Multimodal Models (3)Open-Source Models & Weights (1)Data Curation & Synthetic Data (1)

Frequent co-authors

Changhao Qiao (2)Haohua Chen (1)Wei Zhu (1)Runqi Wang (1)

Papers (3)

Mar 12, 2026

Mar 12, 2026·also Beihang

PROMO: Promptable Outfitting for Efficient High-Fidelity Virtual Try-On

Flow-matching transformers with latent multi-modal conditioning and self-reference can leapfrog existing virtual try-on methods in both visual fidelity and inference speed.

Haohua Chen, Wei Zhu, Runqi Wang +7

Computer Vision Multimodal Models

Mar 2, 2026

Mar 2, 2026·also BAIR, Xiaohongshu

FireRed-OCR Technical Report

VLMs can be transformed into pixel-precise structural document parsing experts, achieving state-of-the-art OCR performance by enforcing syntactic validity and structural integrity through reinforcement learning.

Zuodong Zhong, Zhaojun Sun, Phellon Chen +10

Computer Vision Multimodal Models Open-Source Models & Weights

Feb 12, 2026

Feb 12, 2026·also ByteDance, Georgia Tech

FireRed-Image-Edit-1.0 Techinical Report

Instruction-based image editing just got a whole lot better: FireRed-Image-Edit leapfrogs existing systems with a massive, meticulously curated dataset and a suite of training innovations.

Super Intelligence Team, Changhao Qiao, Chao Hui +6

Computer Vision Data Curation & Synthetic Data Multimodal Models

Search

Yibo Chen

Research focus

Frequent co-authors

Papers (3)