Yongji Wu

UC Berkeley

Papers on Lattice

Total citations

Topics

Research focus

Architecture Design (Transformers, SSMs, MoE) (1)Distributed Systems & Hardware (1)Inference & Quantization (1)Computer Vision (1)Multimodal Models (1)

Frequent co-authors

Xueshen Liu (1)Yuncheng Yao (1)Yuncheng Yao (1)Danyang Zhuo (1)

Papers (2)

Apr 8, 2026

Apr 8, 2026·also BAIR, Duke

Foundry: Template-Based CUDA Graph Context Materialization for Fast LLM Serving Cold Start

Cut LLM cold starts from minutes to seconds by pre-materializing CUDA graph execution contexts, sidestepping brittle kernel patching and heavyweight checkpointing.

Xueshen Liu, Yongji Wu, Yuncheng Yao +6

Architecture Design (Transformers, SSMs, MoE)Distributed Systems & Hardware Inference & Quantization

Mar 2, 2026

Humanoid Robot (Shanghai) Co.Mar 2, 2026·also BAIR, ByteDance, Xiaohongshu

FireRed-OCR Technical Report

VLMs can be transformed into pixel-precise structural document parsing experts, achieving state-of-the-art OCR performance by enforcing syntactic validity and structural integrity through reinforcement learning.

Xinyue Li, Zuodong Zhong, Zhaojun Sun +11

Computer Vision Multimodal Models Open-Source Models & Weights

Search

Yongji Wu

Research focus

Frequent co-authors

Papers (2)