Kevin Song

Papers on Lattice

Total citations

Topics

h-index

Publication activitypapers/week, last 8 weeks

Research focus

Eval Frameworks & Benchmarks (1)

Papers (1)

Mar 19, 2026

Kevin Song1w ago

Evaluating Model-Free Policy Optimization in Masked-Action Environments via an Exact Blackjack Oracle

Even in a seemingly simple tabular environment like Blackjack, model-free RL agents can converge to near-optimal *average* rewards while still making surprisingly poor decisions in specific states.

Kevin Song

Eval Frameworks & Benchmarks

Search

Kevin Song

Publication activitypapers/week, last 8 weeks

Research focus

Papers (1)