Zach Stein-Perlman comments on Claude 3.5 Sonnet

Zach Stein-Perlman Jun 21, 2024, 12:20 AM
13 points
5
I thought that paper was just dangerous-capability evals, not safety-related metrics like adversarial robustness.