Lattice AI Research

Papers (5)

Apr 9, 2026

Daichi Yashima +5Apr 9, 2026

ABMAMBA: Multimodal Large Language Model with Aligned Hierarchical Bidirectional Scan for Efficient Video Captioning

Achieve 3x faster video captioning without sacrificing accuracy by swapping quadratic attention for a linear Mamba backbone and hierarchical bidirectional scanning.

Daichi Yashima, Shuhei Kurita, Yusuke Oda +3

Architecture Design (Transformers, SSMs, MoE)Multimodal Models Training Efficiency & Optimization

Apr 2, 2026

Sakana AIApr 2, 2026·also Aichi Institute of Technology, Institute of Science Tokyo, Kyoto, NII +2

Jagle: Building a Large-Scale Japanese Multimodal Post-Training Dataset for Vision-Language Models

Training VLMs on Jagle, the largest Japanese multimodal dataset, not only crushes existing models on Japanese tasks, but *also* boosts English performance when combined with English data.

Issa Sugiura, Keito Sasagawa, Keisuke Nakao +8

Computer Vision Data Curation & Synthetic Data Multimodal Models

Apr 1, 2026

Apr 1, 2026·also Institute of Science Tokyo, NII, Waseda

JAMMEval: A Refined Collection of Japanese Benchmarks for Reliable VLM Evaluation

Japanese VQA benchmarks are riddled with issues that lead to misleading model comparisons, but JAMMEval fixes this with a rigorous, two-stage refinement process.

Yusuke Oda, Naoaki Okazaki

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Mar 18, 2026

Xuyang Cao +8Mar 18, 2026

ShapleyLaw: A Game-Theoretic Approach to Multilingual Scaling Laws

Optimizing multilingual training? Shapley values reveal the hidden cross-lingual transfer effects that current scaling laws miss, leading to better language mixture ratios.

Xuyang Cao, Qianying Liu, Chuan Xiao +6

Data Curation & Synthetic Data Natural Language Processing Scaling Laws & Emergent Abilities

Feb 18, 2026

Feb 18, 2026·also OpenAI

ReMoRa: Multimodal Large Language Model based on Refined Motion Representation for Long-Video Understanding

Key contribution not extracted.

Daichi Yashima, Shuhei Kurita, Yusuke Oda +1

Architecture Design (Transformers, SSMs, MoE)Computer Vision Multimodal Models

Yusuke Oda

Research focus

Frequent co-authors

Papers (5)

Search

Yusuke Oda

Research focus

Frequent co-authors

Papers (5)