Il IIIF Document Viewer è una estensione del nostro IIIF Image Viewer e fa parte della suite di moduli basati su IIIF.
Permette di convertire automaticamente i file PDF importati in una sequenza di immagini che può essere visualizzata all’interno del browser, utilizzando solo le funzioni web standard, senza la necessità di plug-in esterni e riducendo al minimo l’uso della banda.
Il file PDF originale non viene scaricato dal browser, sono invece scaricate immagini generate on the fly, o create al momento del caricamento (ingestion). Immagini che il IIIF Document Viewer riscala, cioè ingrandisce o rimpicciolisce in base al livello di zoom richiesto.
La generazione delle immagini derivate al momento del caricamento (ingest) può essere configurata per bilanciare al meglio performance e occupazione dello spazio su disco (storage).
I file PDF sono processati tramite una suite di curation tasks e, per ogni pagina:
- si estrae una immagine a risoluzione configurabile per bilanciare qualità e occupazione disco
- è disponibile la rappresentazione testuale dell’immagine preservando i dati di posizionamento
- sono indicizzate le informazioni testuali.
IIIF Document Viewer fa in modo che l’utente finale non possa copiare ed incollare il contenuto dell’immagine ed impedisce il download del PDF originale.
Da evidenziare che i bookmarks presenti nel PDF sono utilizzati per generare automaticamente l’indice (table of contents).
Per i PDF che supportano l’estrazione dei contenuti testuali IIIF Document Viewer consente la ricerca “nel libro”. Inoltre, se utilizzato insieme a IIIF OCR &Transcription è possibile abilitare le funzionalità di lettura tramite OCR anche per PDF di sole immagini frutto di fascicolazione di digitalizzazioni.