Esben Kran

Karma: 533

Catastrophic Cyber Capabilities Benchmark (3CB): Robustly Evaluating LLM Agent Cyber Offense Capabilities

Jonathan N, abra, Connor Axiotes and Esben Kran

Nov 5, 2024, 1:01 AM

8 points

0 comments6 min readLW link

(www.apartresearch.com)

Can startups be impactful in AI safety?

Esben Kran and Archana Vaidheeswaran

Sep 13, 2024, 7:00 PM

15 points

0 comments6 min readLW link

Finding Deception in Language Models

Esben Kran and Archana Vaidheeswaran

Aug 20, 2024, 9:42 AM

20 points

4 comments4 min readLW link

Results from the AI x Democracy Research Sprint

Esben Kran, jordine and Jason Hoelscher-Obermaier

Jun 14, 2024, 4:40 PM

13 points

0 comments6 min readLW link

Demonstrate and evaluate risks from AI to society at the AI x Democracy research hackathon

Esben KranApr 19, 2024, 2:46 PM

5 points

0 comments LW link

(www.apartresearch.com)

Join the AI Evaluation Tasks Bounty Hackathon

Esben KranMar 18, 2024, 8:15 AM

12 points

1 comment LW link

Multi-Agent Security Hackathon

Esben Kran, Jason Hoelscher-Obermaier and Clement Neo

Feb 5, 2024, 10:51 PM

6 points

0 comments1 min readLW link

Identifying semantic neurons, mechanistic circuits & interpretability web apps

Esben Kran and Neel Nanda

Apr 13, 2023, 11:59 AM

18 points

0 comments8 min readLW link

Announcing the European Network for AI Safety (ENAIS)

Esben KranMar 22, 2023, 5:57 PM

19 points

0 comments LW link

Automated Sandwiching & Quantifying Human-LLM Cooperation: ScaleOversight hackathon results

Esben Kran, Fazl, Sabrina Zaki, gabrielrecc and rz2383

Feb 23, 2023, 10:48 AM

8 points

0 comments6 min readLW link

Generalizability & Hope for AI [MLAISU W03]

Esben KranJan 20, 2023, 10:06 AM

5 points

2 comments2 min readLW link

(newsletter.apartresearch.com)

Robustness & Evolution [MLAISU W02]

Esben KranJan 13, 2023, 3:47 PM

10 points

0 comments3 min readLW link

(newsletter.apartresearch.com)

AI improving AI [MLAISU W01!]

Esben KranJan 6, 2023, 11:13 AM

5 points

0 comments4 min readLW link

(newsletter.apartresearch.com)

Results from the AI testing hackathon

Esben KranJan 2, 2023, 3:46 PM

13 points

0 comments LW link

Will Machines Ever Rule the World? MLAISU W50

Esben KranDec 16, 2022, 11:03 AM

12 points

7 comments4 min readLW link

(newsletter.apartresearch.com)

Join the AI Testing Hackathon this Friday

Esben KranDec 12, 2022, 2:24 PM

10 points

0 comments LW link

ML Safety at NeurIPS & Paradigmatic AI Safety? MLAISU W49

Esben Kran and Steinthal

Dec 9, 2022, 10:38 AM

19 points

0 comments4 min readLW link

(newsletter.apartresearch.com)

NeurIPS Safety & ChatGPT. MLAISU W48

Esben Kran and Steinthal

Dec 2, 2022, 3:50 PM

3 points

0 comments4 min readLW link

(newsletter.apartresearch.com)

Results from the interpretability hackathon

Esben Kran and Neel Nanda

Nov 17, 2022, 2:51 PM

81 points

0 comments6 min readLW link

(alignmentjam.com)

[Book] Interpretable Machine Learning: A Guide for Making Black Box Models Explainable

Esben KranOct 31, 2022, 11:38 AM

20 points

1 comment1 min readLW link

(christophm.github.io)