Shi Feng

Papers on Lattice

Total citations

Topics

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (3)Natural Language Processing (3)Constitutional AI & AI Ethics (1)Red-Teaming & Adversarial Robustness (1)

Frequent co-authors

YongKang Liu (2)Matthew Khoriaty (1)David Williams-King (1)Xiao Wang (1)

Papers (4)

Jun 1, 2026

Matthew Khoriaty +21w ago

"I've Seen How This Goes": Characterizing Diversity via Progressive Conditional Surprise

The Decan metric reveals that diversity in AI-generated content can be quantitatively assessed without additional training, highlighting significant diversity loss across model fine-tuning stages.

Matthew Khoriaty, David Williams-King, Shi Feng

Eval Frameworks & Benchmarks Natural Language Processing

May 6, 2026

Xiao Wang +5May 6, 2026·also CMU ML

From Parameter Dynamics to Risk Scoring : Quantifying Sample-Level Safety Degradation in LLM Fine-tuning

Seemingly harmless fine-tuning data can stealthily nudge LLMs toward unsafe behavior by subtly shifting model parameters in "danger-aligned" directions.

Xiao Wang, Yifei Zhang, YongKang Liu +3

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness

Apr 14, 2026

Shi Feng +5Apr 14, 2026·also Stanford HAI

Peer-Predictive Self-Training for Language Model Reasoning

Language models can bootstrap their reasoning abilities without human labels by learning from each other's aggregated answers, achieving significant gains in mathematical reasoning.

Shi Feng, Fan Nie, Fan Nie +3

Natural Language Processing Reasoning & Chain-of-Thought Training Efficiency & Optimization

Apr 13, 2026

Apr 13, 2026·also SMU

A Systematic Analysis of the Impact of Persona Steering on LLM Capabilities

LLMs with induced personalities don't just *sound* different – they exhibit measurable and predictable cognitive performance changes, mirroring human psychology.

Jiaqi Chen, Tingna Xie, Shi Feng +1