CBiddulph

Karma: 632

CBiddulph’s Shortform

CBiddulphJan 30, 2025, 9:35 PM

4 points

18 comments1 min readLW link

[Question] Why not train reasoning models with RLHF?

CBiddulphJan 30, 2025, 7:58 AM

4 points

4 comments1 min readLW link

Worries about latent reasoning in LLMs

CBiddulphJan 20, 2025, 9:09 AM

42 points

3 comments7 min readLW link

5 ways to improve CoT faithfulness

CBiddulphOct 5, 2024, 8:17 PM

42 points

40 comments6 min readLW link

OpenAI’s Sora is an agent

CBiddulphFeb 16, 2024, 7:35 AM

96 points

25 comments4 min readLW link

Is Metaethics Unnecessary Given Intent-Aligned AI?

CBiddulphSep 2, 2023, 9:48 AM

10 points

0 comments7 min readLW link

Preparing for AI-assisted alignment research: we need data!

CBiddulphJan 17, 2023, 3:28 AM

31 points

3 comments1 min readLW link

The Rational Utilitarian Love Movement (A Historical Retrospective)

CBiddulphNov 3, 2022, 7:11 AM

3 points

0 comments1 min readLW link