XSTest: A Test Suite for Identifying Exaggerated Safety Behaviours in Large Language Models

Röttger, Paul
Membro del Collaboration Group
;
Attanasio, Giuseppe
Membro del Collaboration Group
;
Bianchi, Federico
Membro del Collaboration Group
;
Hovy, Dirk
Membro del Collaboration Group
2024

2024
9798891761148
Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers)
Röttger, Paul; Kirk, Hannah; Vidgen, Bertie; Attanasio, Giuseppe; Bianchi, Federico; Hovy, Dirk
File in questo prodotto:
File Dimensione Formato  
2024.naacl-long.301.pdf

accesso aperto

Tipologia: Pdf editoriale (Publisher's layout)
Licenza: Creative commons
Dimensione 335.52 kB
Formato Adobe PDF
335.52 kB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11565/4070977
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus 69
  • ???jsp.display-item.citation.isi??? 29
social impact