Artyom Karpov

Karma: 37

The Steganographic Potentials of Language Models

Artyom Karpov, Tinuade and SCho

May 8, 2025, 11:23 AM

9 points

0 comments1 min readLW link

CCS on compound sentences

Artyom KarpovMay 4, 2024, 12:23 PM

6 points

0 comments9 min readLW link

Inducing human-like biases in moral reasoning LMs

Artyom Karpov, Austin Meek, Bogdan Ionut Cirstea and SCho

Feb 20, 2024, 4:28 PM

23 points

3 comments14 min readLW link

How important is AI hacking as LLMs advance?

Artyom KarpovJan 29, 2024, 6:41 PM

1 point

0 comments6 min readLW link

My (naive) take on Risks from Learned Optimization

Artyom KarpovOct 31, 2022, 10:59 AM

7 points

0 comments5 min readLW link