Xinyan Liu

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (3)Computer Vision (2)Architecture Design (Transformers, SSMs, MoE) (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Weidong Chen (2)Dexiang Hong (1)Yutao Cheng (1)Xinyu Geng (1)

Papers (3)

Apr 21, 2026

Weidong Chen +3Apr 21, 2026

CreatiParser: Generative Image Parsing of Raster Graphic Designs into Editable Layers

Decomposing rasterized graphic designs into editable layers is now significantly more faithful and controllable thanks to a hybrid generative approach that combines vision-language models and multi-branch diffusion.

Weidong Chen, Dexiang Hong, Yutao Cheng +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Apr 5, 2026

Xinyu Geng +5Apr 5, 2026

GeoBrowse: A Geolocation Benchmark for Agentic Tool Use with Expert-Annotated Reasoning Traces

Current multimodal agents still struggle to combine ambiguous visual cues with open-web verification, highlighting a critical gap in their ability to perform complex geolocation tasks.

Xinyu Geng, Yanjing Xiao, Yuyang Zhang +3

Eval Frameworks & Benchmarks Multimodal Models Tool Use & Agents

Mar 18, 2026

FACE-net: Factual Calibration and Emotion Augmentation for Retrieval-enhanced Emotional Video Captioning

By adaptively calibrating facts and augmenting emotions, FACE-net overcomes the factual-emotional bias that plagues emotional video captioning.

Weidong Chen, Cheng Ye, Xinyan Liu

Computer Vision Multimodal Models Natural Language Processing

Search

Xinyan Liu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (3)