Shengfang Zhai

Papers on Lattice

Total citations

Topics

h-index

Research focus

Eval Frameworks & Benchmarks (2)Multimodal Models (1)Tool Use & Agents (1)Inference & Quantization (1)Open-Source Models & Weights (1)

Frequent co-authors

Fanqing Meng (1)Lingxiao Du (1)Zijian Wu (1)Guanzheng Chen (1)

Papers (2)

Apr 26, 2026

UWApr 26, 2026·also Laboratory of AI for Electrochemistry (AI4EC)

ClawMark: A Living-World Benchmark for Multi-Turn, Multi-Day, Multimodal Coworker Agents

LLM agents struggle to maintain performance in multi-day collaborative tasks, dropping significantly after just one environmental update, revealing a critical gap in adaptation to evolving real-world conditions.

Fanqing Meng, Lingxiao Du, Zijian Wu +38

Eval Frameworks & Benchmarks Multimodal Models Tool Use & Agents

Feb 26, 2026

BAIRFeb 26, 2026·also PolyU

IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation

Now you can audit black-box LLM APIs for cheating (model substitution, overbilling) with <1% overhead, using verifiable computation.

Yanpei Guo, Yanpei Guo, Wenjie Qu +8

Eval Frameworks & Benchmarks Inference & Quantization Open-Source Models & Weights

Search

Shengfang Zhai

Research focus

Frequent co-authors

Papers (2)