Lixin Su

City University of Hong Kong, Baidu Inc

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (2)Computer Vision (1)Natural Language Processing (1)Architecture Design (Transformers, SSMs, MoE) (1)

Frequent co-authors

Jiancheng Dong (1)Derong Xu (1)Jiawei Cheng (1)Jingyu Peng (1)

Papers (2)

Mar 17, 2026

Department of Data ScienceMar 17, 2026·also Baidu, College of Computer Science and Technology, HKU, Information System +2

How to Utilize Complementary Vision-Text Information for 2D Structure Understanding

A lightweight architecture that distills long textual sequences using visual tokens as dynamic queries boosts LLM performance on 2D table understanding by 23.9%.

Jiancheng Dong, Derong Xu, Jiawei Cheng +4

Computer Vision Multimodal Models Natural Language Processing

Mar 2, 2026

Mar 2, 2026·also CAS, HKU, State Key Laboratory of AI Safety

Reconstructing Content via Collaborative Attention to Improve Multimodal Embedding Quality

Multimodal embeddings get a serious upgrade with CoCoA, a new pre-training method that forces models to compress all input information into a single token for reconstruction, leading to substantial quality gains.

Jiahan Chen, Jiahan Chen, Da Li +9

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Recommendation & Information Retrieval

Search

Lixin Su

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)