Zijie Zhang

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (4)Multimodal Models (3)Speech & Audio (1)Constitutional AI & AI Ethics (1)

Frequent co-authors

Yanghai Wang (3)Jiafu Tang (2)Zhe Cao (2)Abu Noman Md Sakib (2)

Papers (5)

Jul 14, 2026

Yanghai Wang +91w ago

AVSCap: Orchestrating Audio-Visual Synergy for Omni-modal Video Captioning

AVSCap-7B achieves superior audio-visual synergy, outperforming existing models by effectively linking non-speech sounds to visual actions.

Yanghai Wang, Jiafu Tang, Yuanxing Zhang +7

Multimodal Models Speech & Audio

Jun 2, 2026

OmniHalluc-L: Counterfactual Benchmarking and Modality-Perturbation Reliability Calibration for Long-Form Omni Hallucination

Open-weight Omni models struggle with binding accuracy, achieving only 41.55% on a new counterfactual benchmark, highlighting a critical gap in long-video comprehension.

Zixuan Dong, Jiafu Tang, Zhide Lei +9

Eval Frameworks & Benchmarks Multimodal Models

Apr 21, 2026

UT AustinApr 21, 2026·also Khulna University of Engineering and Technology

Beyond Semantic Similarity: A Component-Wise Evaluation Framework for Medical Question Answering Systems with Health Equity Implications

LLMs ace semantic similarity in medical QA, but VB-Score reveals they're failing to extract key medical entities, especially when answering questions about chronic conditions affecting older and minority populations.

Abu Noman Md Sakib, Md. Main Oddin Chisty, Zijie Zhang

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Natural Language Processing

Apr 16, 2026

Apr 16, 2026·also JIUTIAN Research, Kling Team

DR$^{3}$-Eval: Towards Realistic and Reproducible Deep Research Evaluation

Current research agents still struggle with retrieval robustness and hallucination control, even when evaluated in a static, verifiable research environment.

Qianqian Xie, Qing Xiong, He Zhu +16

Eval Frameworks & Benchmarks Multimodal Models Tool Use & Agents

Apr 6, 2026

UT AustinApr 6, 2026

Empirical Characterization of Rationale Stability Under Controlled Perturbations for Explainable Pattern Recognition

Current XAI evaluations can be fooled: this new metric reveals that even small input variations can cause explanations to drastically change, undermining trust in pattern recognition systems.

Abu Noman Md Sakib, Zhensen Wang, Merjulah Roby +1

Eval Frameworks & Benchmarks Interpretability & Mechanistic Interp

Search

Zijie Zhang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (5)