Shengqiong Wu

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (4)Computer Vision (2)Constitutional AI & AI Ethics (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Mong-Li Lee (2)Hao Fei (2)Mong Li Lee (2)Wynne Hsu (2)

Papers (4)

Jul 16, 2026

1w ago·also NUS, Oxford, SDU

HoloGeo: Mitigating Landmark Bias in Geo-localization via Evidence-Driven Reasoning

Landmark bias can lead to significant inaccuracies in geo-localization, but HoloGeo effectively mitigates this issue through evidence-driven reasoning, outperforming existing models.

Xuanyu Liu, Shengqiong Wu, Mong-Li Lee

Constitutional AI & AI Ethics Multimodal Models

Mar 5, 2026

Microsoft ResearchMar 5, 2026·also NUS

UniM: A Unified Any-to-Any Interleaved Multimodal Benchmark

Forget unimodal tasks—UniM throws down the gauntlet for truly unified multimodal AI, demanding models juggle any combination of text, image, audio, video, code, documents, and 3D inputs and outputs in a single, interleaved stream.

Yanling Li, Minghui Guo, Kaiwen Zhang +13

Eval Frameworks & Benchmarks Multimodal Models Natural Language Processing

MiLM PlusMar 5, 2026

Orthogonal Spatial-temporal Distributional Transfer for 4D Generation

Overcome the scarcity of 4D training data by cleverly borrowing spatial understanding from 3D models and temporal dynamics from video models.

Wei Liu, Shengqiong Wu, Bobo Li +4

Computer Vision Data Curation & Synthetic Data Multimodal Models

Feb 22, 2026

NUSFeb 22, 2026·also Huawei, UofT

JavisDiT++: Unified Modeling and Optimization for Joint Audio-Video Generation

Achieve SOTA joint audio-video generation with JavisDiT++ using just 1M public training examples, rivaling performance of models trained on proprietary datasets.

Kai Liu, Yanhao Zheng, Yanhao Zheng +12

Computer Vision Multimodal Models Speech & Audio

Search

Shengqiong Wu

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (4)