Yan Bai

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (2)Architecture Design (Transformers, SSMs, MoE) (1)Natural Language Processing (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Meituan LongCat Team (1)Mei Xiao (1)Chao Wang (1)Bin Xiao (1)

Papers (2)

Mar 29, 2026

Meituan LongCat Team +1003d ago

LongCat-Next: Lexicalizing Modalities as Discrete Tokens

LongCat-Next shatters the language-centric paradigm by unifying text, vision, and audio into a single autoregressive model with minimal modality-specific design, finally reconciling understanding and generation in discrete vision modeling.

Meituan LongCat Team, Mei Xiao, Chao Wang +98

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Natural Language Processing

Mar 16, 2026

Xuanyu Zhu +122w ago

VTC-Bench: Evaluating Agentic Multimodal Models via Compositional Visual Tool Chaining

Today's best multimodal models can only solve half of compositional visual tool-use tasks, revealing a critical gap in their ability to plan and execute complex, multi-step visual reasoning.

Xuanyu Zhu, Yuhao Dong, Rundong Wang +10

Eval Frameworks & Benchmarks Multimodal Models Tool Use & Agents

Search

Yan Bai

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)