Zihan Lin

ERNIE Team

Papers on Lattice

Total citations

Topics

Research focus

Computer Vision (1)Multimodal Models (1)Natural Language Processing (1)

Frequent co-authors

Songhe Deng (1)Shuwei He (1)Danxiang Zhu (1)Yishu Lei (1)

Papers (1)

May 26, 2026

ERNIE TeamMay 26, 2026

CodecCap: High-Fidelity Codec-Inspired Residual Modeling for Dense Video Captioning

Keyframe-residual captioning unlocks high-fidelity video-language supervision, surpassing direct VLM captioning in capturing fine-grained visual details.

Zihan Lin, Songhe Deng, Shuwei He +4

Computer Vision Multimodal Models Natural Language Processing

Search

Zihan Lin

Research focus

Frequent co-authors

Papers (1)