Abu Noman Md Sakib

Research focus

Eval Frameworks & Benchmarks (2)Constitutional AI & AI Ethics (1)Natural Language Processing (1)Interpretability & Mechanistic Interp (1)

Frequent co-authors

Zijie Zhang (2)Md. Main Oddin Chisty (1)Zhensen Wang (1)Merjulah Roby (1)

Papers (2)

Apr 21, 2026

UT AustinApr 21, 2026·also Khulna University of Engineering and Technology

Beyond Semantic Similarity: A Component-Wise Evaluation Framework for Medical Question Answering Systems with Health Equity Implications

LLMs ace semantic similarity in medical QA, but VB-Score reveals they're failing to extract key medical entities, especially when answering questions about chronic conditions affecting older and minority populations.

Abu Noman Md Sakib, Md. Main Oddin Chisty, Zijie Zhang

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Natural Language Processing

Apr 6, 2026

UT AustinApr 6, 2026

Empirical Characterization of Rationale Stability Under Controlled Perturbations for Explainable Pattern Recognition

Current XAI evaluations can be fooled: this new metric reveals that even small input variations can cause explanations to drastically change, undermining trust in pattern recognition systems.

Abu Noman Md Sakib, Zhensen Wang, Merjulah Roby +1

Eval Frameworks & Benchmarks Interpretability & Mechanistic Interp

Search

Abu Noman Md Sakib

Research focus

Frequent co-authors

Papers (2)