Neuron to Graph: Interpreting Language Model Neurons at Scale

A. Foote*, N. Nanda, E. Kran, I. Konstas, S. Cohen, F. Barez*

May 2023

Type

Conference paper

Publication

ICLR 2023 Workshop

Interpretability ICLR