Mrinmaya Sachan

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Reasoning & Chain-of-Thought (5)Eval Frameworks & Benchmarks (5)Natural Language Processing (4)Multimodal Models (2)

Frequent co-authors

Yifan Hou (2)Xingzhou Pang (1)Junling Wang (1)Johannes Zenn (1)

Papers (7)

May 28, 2026

ETH2w ago

Unveiling the Visual Counting Bottleneck in Vision-Language Models

VLMs don't lack visual understanding of quantity, they just can't connect what they see to symbolic number representations, revealing a fractured magnitude space.

Xingzhou Pang, Yifan Hou, Junling Wang +1

Computer Vision Interpretability & Mechanistic Interp Multimodal Models

Apr 22, 2026

Apr 22, 2026·also ETH, AI Center Tübingen, ELLIS, Tübingen +1

Efficient Test-Time Inference via Deterministic Exploration of Truncated Decoding Trees

Deterministic decoding can outperform stochastic self-consistency in constrained domains by systematically exploring high-probability reasoning traces, leading to better performance with less computation.

Johannes Zenn, Guinan Su, Mrinmaya Sachan +1

Code Generation & Program Synthesis Inference & Quantization Reasoning & Chain-of-Thought

Apr 1, 2026

Misconception Acquisition Dynamics in Large Language Models

Training LLMs to simulate student misconceptions can backfire, degrading overall reasoning accuracy unless you provide detailed, step-by-step feedback during training.

Naiming Liu, Xinghe Chen, Richard Baraniuk +1

Eval Frameworks & Benchmarks Natural Language Processing Reasoning & Chain-of-Thought

Mar 16, 2026

Yanick Zengaffinen +3Mar 16, 2026

Can LLMs Model Incorrect Student Reasoning? A Case Study on Distractor Generation

LLMs surprisingly mimic human strategies for generating plausible student misconceptions, but their success hinges on first solving the problem correctly.

Yanick Zengaffinen, Donya Rooein, Kv Aditya Srivatsa +1

Eval Frameworks & Benchmarks Natural Language Processing Reasoning & Chain-of-Thought

Mar 4, 2026

Mar 4, 2026·also Groningen, UvA

Optimizing Language Models for Crosslingual Knowledge Consistency

Multilingual LLMs can be made significantly more reliable by directly optimizing for crosslingual consistency using a DPO-inspired method that requires no explicit reward model.

Jirui Qi, Mrinmaya Sachan, Raquel Fernández +1

Eval Frameworks & Benchmarks Natural Language Processing RLHF & Preference Learning

Sep 28, 2025

M-A-PSep 28, 2025·also ETH

Compose and Fuse: Revisiting the Foundational Bottlenecks in Multimodal Reasoning

Multimodal LLMs often perform worse with more modalities because they struggle to jointly recognize and reason across modalities, a problem solvable with simple prompting strategies.

Yucheng Wang, Yifan Hou, Aydin Javadov +2

Eval Frameworks & Benchmarks Multimodal Models Reasoning & Chain-of-Thought

Feb 26, 2025

ETHFeb 26, 2025·also MBZUAI, TU Darmstadt

MathTutorBench: A Benchmark for Measuring Open-ended Pedagogical Capabilities of LLM Tutors

LLMs that excel at math don't necessarily make good math tutors, revealing a surprising trade-off between subject matter expertise and pedagogical skill.

Jakub Macina, Nico Daheim, Ido Hakimi +324

Eval Frameworks & Benchmarks Natural Language Processing Reasoning & Chain-of-Thought

Search

Mrinmaya Sachan

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (7)