Stanford Question Answering Dataset (SQuAD) è un dataset per il task noto come Machine Reading Comprehension (o comprensione del testo da parte di un sistema di NLP), costituito da domande poste in linguaggio naturale rispetto ad un insieme di articoli di Wikipedia, dove la risposta ad ogni domanda è un segmento di testo appartenente a tali articoli (o potrebbe essere senza risposta).
SQuAD2.0 combina 100.000 domande rispetto a centinaia di pagine di Wikipedia con oltre 50.000 domande senza risposta. Il compito di SQuAD2.0 consiste quindi non solo nel rispondere alle domande quando possibile, ma anche nel rilevare situazioni in cui nessuna risposta sia supportata dal paragrafo e astenersi da qualsiasi risposta.
SQuAD2.0 mette alla prova la capacità dei sistema di NLP non solo nel rispondere alle domande che prevedono la comprensione di testi scritti, ma anche di astenersi quando viene presentata una domanda a cui non si può rispondere sulla base del paragrafo fornito. SQuAD è uno sforzo iniziato dallo Stanford NLP Group e la sua costruzione continua nel tempo, dato che tali dataset sono destinati ad evolversi. La SQuAD LeaderBoard è aggiornata per confrontare lo stato dell’arte di metodi, sistemi e tecnologie.