Thorsten Wittkopp

Technische Universität Berlin, Technical University of Berlin, Germany

Papers on Lattice

Total citations

Topics

Research focus

Interpretability & Mechanistic Interp (1)Red-Teaming & Adversarial Robustness (1)RLHF & Preference Learning (1)Distributed Systems & Hardware (1)Inference & Quantization (1)

Frequent co-authors

Odej Kao (2)Patrick Wilhelm (1)Dominik Scheinert (1)Dominik Scheinert (1)

Papers (2)

Mar 4, 2026

Mar 4, 2026·also Technical University of Berlin

Monitoring Emergent Reward Hacking During Generation via Internal Activations

Forget inspecting final outputs: LLMs telegraph their reward-hacking intentions internally, early in the generation process, via distinctive activation patterns.

Patrick Wilhelm, Thorsten Wittkopp, Odej Kao

Interpretability & Mechanistic Interp Red-Teaming & Adversarial Robustness RLHF & Preference Learning

Mar 2, 2026

logsight.ai GmbHMar 2, 2026·also Technical University of Berlin, TII, TU Berlin

Beyond Microservices: Testing Web-Scale RCA Methods on GPU-Driven LLM Workloads

Off-the-shelf root cause analysis tools fall flat when applied to LLM inference stacks, demanding a new generation of observability techniques.

Dominik Scheinert, Dominik Scheinert, Alexander Acker +14

Distributed Systems & Hardware Inference & Quantization

Search

Thorsten Wittkopp

Research focus

Frequent co-authors

Papers (2)