Ramaneswaran Selvakumar

Research focus

Speech & Audio (2)Interpretability & Mechanistic Interp (1)Multimodal Models (1)Eval Frameworks & Benchmarks (1)Red-Teaming & Adversarial Robustness (1)

Frequent co-authors

Dinesh Manocha (2)Kaousheik Jayakumar (1)S. Sakshi (1)Sreyan Ghosh (1)

Papers (2)

Apr 3, 2026

Ramaneswaran Selvakumar +5Apr 3, 2026

Do Audio-Visual Large Language Models Really See and Hear?

AVLLMs may "hear" at intermediate layers, but they largely ignore audio cues in favor of vision when generating text, revealing a fundamental modality bias.

Ramaneswaran Selvakumar, Kaousheik Jayakumar, S. Sakshi +3

Interpretability & Mechanistic Interp Multimodal Models Speech & Audio

Mar 31, 2026

Mar 31, 2026·also IIT Delhi, Indraprastha Institute of Information, Jaypee Institute of Information

Audio Hallucination Attacks: Probing the Reliability of Large Audio Language Models

LALMs can be easily tricked into "hearing" things that aren't there, with success rates as high as 95% on targeted attacks.

Ashish Seth, Sonal Kumar, Ramaneswaran Selvakumar +5

Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness Speech & Audio

Search

Ramaneswaran Selvakumar

Research focus

Frequent co-authors

Papers (2)