Lattice AI Research

Research focus

Multimodal Models (3)Open-Source Models & Weights (2)Computer Vision (1)RLHF & Preference Learning (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Changyao Tian (2)Erfei Cui (2)Haomin Wang (2)Jiaye Ge (2)

Papers (3)

Mar 12, 2026

Mar 12, 2026·also NTU

Trust Your Critic: Robust Reward Modeling and Reinforcement Learning for Faithful Image Editing and Generation

Hallucinations in RL-based image editing and generation are tamed with FIRM, a new framework that trains robust reward models on curated datasets to provide more accurate guidance.

Xiangyu Zhao, Peiyuan Zhang, Junming Lin +8

Computer Vision Multimodal Models RLHF & Preference Learning

Mar 10, 2026

Mar 10, 2026·also AGI Research Center, BUPT, CUHK, Fudan +5

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

A 4B-parameter model, InternVL-U, outperforms 14B-parameter models in multimodal generation and editing, proving that size isn't everything.

Changyao Tian, Danni Yang, Guanzhou Chen +26

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Open-Source Models & Weights

Apr 14, 2025

Tsinghua AIApr 14, 2025·also NUS, CUHK, Deakin, Fudan +9

InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

Open-source multimodal models just leveled up: InternVL3 rivals closed-source titans like GPT-4o by pre-training vision and language together from the start.

Jinguo Zhu, Weiyun Wang, Zhe Chen +45901

Multimodal Models Open-Source Models & Weights Training Efficiency & Optimization

Search

Yuchen Duan

Research focus

Frequent co-authors

Papers (3)