Lattice AI Research

Research focus

Computer Vision (1)Multimodal Models (1)Natural Language Processing (1)Architecture Design (Transformers, SSMs, MoE) (1)Open-Source Models & Weights (1)

Frequent co-authors

Songhe Deng (2)Danxiang Zhu (2)Yishu Lei (2)Xianlong Luo (2)

Papers (2)

May 26, 2026

ERNIE TeamMay 26, 2026

CodecCap: High-Fidelity Codec-Inspired Residual Modeling for Dense Video Captioning

Keyframe-residual captioning unlocks high-fidelity video-language supervision, surpassing direct VLM captioning in capturing fine-grained visual details.

Zihan Lin, Songhe Deng, Shuwei He +4

Computer Vision Multimodal Models Natural Language Processing

Feb 15, 2026

ERNIE TeamFeb 15, 2026·also Baidu

Eureka-Audio: Triggering Audio Intelligence in Compact Language Models

A 1.7B parameter model can now rival much larger audio language models, thanks to a novel architecture and data synthesis pipeline.

Yishu Lei, Jing Hu, Shuwei He +5

Architecture Design (Transformers, SSMs, MoE)Open-Source Models & Weights Speech & Audio

Search

Shuwei He

Research focus

Frequent co-authors

Papers (2)