Daling Wang

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Constitutional AI & AI Ethics (1)Eval Frameworks & Benchmarks (1)Red-Teaming & Adversarial Robustness (1)

Frequent co-authors

Xiao Wang (1)Yifei Zhang (1)YongKang Liu (1)Xiaocui Yang (1)

Papers (1)

May 6, 2026

Xiao Wang +62w ago

From Parameter Dynamics to Risk Scoring : Quantifying Sample-Level Safety Degradation in LLM Fine-tuning

Seemingly harmless fine-tuning data can stealthily nudge LLMs toward unsafe behavior by subtly shifting model parameters in "danger-aligned" directions.

Xiao Wang, Yifei Zhang, YongKang Liu +4

Constitutional AI & AI Ethics Eval Frameworks & Benchmarks Red-Teaming & Adversarial Robustness

Search

Daling Wang

Publication activitypapers/week, last 8 weeks

Research focus

Frequent co-authors

Papers (1)