Diji Yang

Papers on Lattice

Total citations

Topics

h-index

Research focus

Eval Frameworks & Benchmarks (2)Multimodal Models (2)Computer Vision (1)Recommendation & Information Retrieval (1)Robotics & Embodied AI (1)

Frequent co-authors

Kezhen Chen (2)Yunkai Zhang (1)Linda Li (1)Yin Cui (1)

Papers (3)

Apr 6, 2026

Yunkai Zhang +7Apr 6, 2026

Grid2Matrix: Revealing Digital Agnosia in Vision-Language Models

VLMs suffer from "digital agnosia," exhibiting a surprisingly sharp failure to transcribe even small color grids into matrices, revealing a critical gap between visual feature encoding and language generation.

Yunkai Zhang, Linda Li, Yin Cui +5

Computer Vision Eval Frameworks & Benchmarks Multimodal Models

Mar 3, 2026

Retrieval-Augmented Robots via Retrieve-Reason-Act

Robots can now assemble complex furniture in zero-shot settings by actively retrieving and reasoning over visual instructions, outperforming methods relying solely on internal knowledge or limited examples.

Izat Temiraliev, Diji Yang

Recommendation & Information Retrieval Robotics & Embodied AI Tool Use & Agents

Feb 23, 2026

Feb 23, 2026·also Birmingham, CAS, Duke, Rochester +1

Classroom Final Exam: An Instructor-Tested Reasoning Benchmark

Even the best LLMs struggle to maintain correct intermediate states when solving university-level STEM problems, often taking more steps than necessary and accumulating errors along the way.

Chongyang Gao, Chongyang Gao, Diji Yang +8

Eval Frameworks & Benchmarks Multimodal Models Reasoning & Chain-of-Thought

Search

Diji Yang

Research focus

Frequent co-authors

Papers (3)