Quintin’s Alignment Papers Roundup

Sep 10, 2022, 11:35 PM

Quintin’s alignment papers roundup—week 1

Quintin PopeSep 10, 2022, 6:39 AM

120 points

6 comments9 min readLW link

Quintin’s alignment papers roundup—week 2

Quintin PopeSep 19, 2022, 1:41 PM

67 points

2 comments10 min readLW link

QAPR 3: interpretability-guided training of neural nets

Quintin PopeSep 28, 2022, 4:02 PM

58 points

2 comments10 min readLW link

QAPR 4: Inductive biases

Quintin PopeOct 10, 2022, 10:08 PM

67 points

2 comments18 min readLW link

QAPR 5: grokking is maybe not that big a deal?

Quintin PopeJul 23, 2023, 8:14 PM

114 points

15 comments9 min readLW link