Grande dizionario della lingua italiana

Prototipo edizione digitale

Presentazione del prototipo

Il corpus contiene attualmente tutti i volumi del GDLI in una versione provvisoria e sperimentale, perfettibile mediante il lavoro di revisione che tutt’ora prosegue presso l’Accademia, come è necessario per un’opera di questa mole. Si è comunque deciso di mettere immediatamente lo strumento (realizzato a tempo di record) nelle mani degli studiosi, benché presenti non pochi difetti. Infatti per ora la ripulitura è stata minima, ed è stata svolta in forma automatica all’interno del flusso della digitalizzazione. Sono state indicizzate tutte le forme individuate da una procedura che ha utilizzato la trascrizione prodotta dal sistema OCR (Finereader), avendo prima ricostruito l’unità delle parole sillabate nei cambi pagina (perché potessero essere individuate dalle procedure di ricerca). Restano da rivedere manualmente, prima di tutto, i lemmi e le parole e frasi in caratteri greci, che non sono stati letti dall’OCR. Tale lavoro è stato affidato, con apposita borsa di studio, alla dott.ssa Canzani, che ha già operato sulle parti in greco per l’edizione elettronica delle Cinque Crusche. Si sta allestendo un sistema per l’individuazione automatica dei lemmi, che presenta non pochi problemi: vi collabora anche l’ILC di Pisa, che ha un apposito accordo con l’Accademia della Crusca. Sarà necessaria una revisione manuale dei testi, la quale richiederà molto tempo.

Per quanto il testo elettronico presenti molte debolezze, l’approdo finale di ogni ricerca è la riproduzione in facsimile dell’originale a cui si rimane quindi, anche in questa edizione, del tutto fedeli, consentendo oltretutto, grazie ai sistemi di ingrandimento a video, una lettura comoda di un testo di non sempre facile accesso nella versione cartacea per le dimensioni ridotte dei caratteri. Nella ricerca si possono certamente perdere alcuni risultati di forme “occultate” dagli errori commessi dall’OCR ma, una volta arrivati alla pagina, il consultatore può attingere appieno a tutte le preziose informazioni del dizionario.

Ai fini della consultazione, sono state implementate tre modalità di ricerca: una ricerca libera per parola, che estrae tutti i contesti in cui si trova almeno una delle parole inserite, una ricerca in sequenza, che consente di individuare porzioni di testo (compresi i segni interpuntivi), e una ricerca per voce, che individua automaticamente la pagina di inizio di una data voce. Le prime due ricerche sono fulltext. I risultati della ricerca indicano il volume di appartenenza, il numero di pagina, il primo e l’ultimo lemma contenuti nella pagina. Il risultato viene evidenziato all’interno di un contesto breve. Accanto al risultato, sono presenti i pulsanti che permettono di ampliare la porzione di testo visualizzata, o di accedere alla pagina in formato PDF e facsimile JPG. Oltre che alla modalità di ricerca aperta, è possibile accedere anche all'elenco delle forme indicizzate (in ordine alfabetico o ordinate per frequenza) e all’elenco degli autori citati (con rimando alla pagina dell’indice che contiene i dati a essi relativi). L'elenco delle abbreviazioni consente di accedere alle occorrenze indicizzate per l'abbreviazione selezionata.

Infine, una sala di lettura permette di accedere a uno scaffale digitale in cui possono essere sfogliati i volumi per immagini. Ogni scatto è collegato alla trascrizione in formato PDF della pagina relativa.