Detecting Edit Failures in Large Language Models: An Improved Specificity Benchmark

J. Hoelscher-Obermaier*, J. Persson*, E. Kran, I. Konstas, F. Barez*

July 2023

Type

Conference paper

Publication

ACL 2023

Interpretability ACL/EMNLP