Irene Li

The University of Tokyo

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Multimodal Models (2)Speech & Audio (1)Computer Vision (1)Eval Frameworks & Benchmarks (1)

Frequent co-authors

Haoyu Zhang (1)Chunfeng Wang (1)Yue Xun (1)Junyu Liu (1)

Papers (2)

Jun 7, 2026

Jun 7, 2026·also Rochester, USTC, UTokyo

SMC-ITA: Sequential Monte Carlo Inference-Time Alignment for Video-to-Audio Generation

SMC-ITA achieves a remarkable 55.67% reduction in audio-video desynchronization, setting a new standard for inference-time alignment in video-to-audio generation.

Haoyu Zhang, Chunfeng Wang, Irene Li

Multimodal Models Speech & Audio

May 21, 2026

May 21, 2026·also Hohai, Kyoto, UofT, USTC +1

JMed48k: A Multi-Profession Japanese Medical Licensing Benchmark for Vision-Language Model Evaluation

Medical-specific vision-language models surprisingly underutilize visual information in Japanese medical licensing exams, often performing well even when images are removed, highlighting a critical gap in their multimodal reasoning capabilities.

Yue Xun, Junyu Liu, Qian Niu +6

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Search

Irene Li

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (2)