Introduzione
Durante il caricamento dei contenuti sulla piattaforma, il sistema analizza il file al fine di estrarne informazioni testuali. A seconda del formato, la piattaforma recupera tali informazioni tramite l’estrazione del testo (per documenti, immagini, file web e formati analoghi) oppure mediante la generazione di trascrizioni (per audio, video e pacchetti e-learning supportati).
Sono utilizzabili dalle funzionalità della piattaforma basate sull’analisi testuale esclusivamente i contenuti da cui il sistema riesce a estrarre o generare con successo il testo:
Il presente articolo descrive tutti i tipi di contenuto supportati, nonché le condizioni necessarie per un’estrazione del testo e una generazione di trascrizioni efficaci.
Tipologie di contenuto supportate per l’analisi
La tabella seguente riporta tutte le tipologie di file analizzabili dalla piattaforma.
| Categoria | Tipologie | Contenuto estratto | Materiali didattici / Asset |
| File di testo | .txt, .csv | Testo | Materiali didattici e asset |
| File di documenti | .doc, .docx, .odt, .ppt, .pptx, .pdf, .xls, .xlsx | Testo | Materiali didattici e asset |
| File immagine | .bmp, .jpeg, .png, .tiff | Testo contenuto nell’immagine | Materiali didattici e asset |
| File web |
.html, .htm Nota: Nel caso in cui venga fornito l’URL di una pagina web, la trascrizione viene generata esclusivamente per la pagina specifica indicata. Non viene estratto il contenuto dai link incorporati nella pagina stessa. |
Testo | Materiali didattici e asset |
| File audio | .acc, .mpeg, .wav | Trascrizione audio | Materiali didattici e asset |
| File video | .mp4, .mov | Trascrizione audio | Materiali didattici e asset |
| File Google Workspace✴ | Docs, Sheets, Slides | Testo | Materiali didattici e asset |
| Video online collegati✴ | YouTube, Vimeo, Wistia | Sottotitoli | Materiali didattici e asset |
| Pacchetti e-learning✴ | SCORM e xAPI/TinCan (Articulate Rise e Articulate Storyline) | Testo e trascrizione audio | Materiali didattici |
| File Docebo | Lezioni Creator | Testo e trascrizione audio | Materiali didattici |
✴ Il contenuto privato (ovvero contenuti che richiedono autenticazione per essere accessibili) non è supportato.
Contenuti non supportati e limitazioni nell’estrazione
Le tipologie di contenuto non elencate nella tabella precedente non sono supportate per l’estrazione del testo o la generazione di trascrizioni. Tra queste si annoverano assignment, Docebo Learning Impact (DLI), LTI, checklist di osservazione, survey, test, Elucidat, archivio, playlist, Shape e AICC.
Oltre all’essere un formato di file supportato, il sistema deve essere in grado di estrarre il testo o generare una trascrizione dal contenuto. In caso di insuccesso nell’estrazione del testo, il contenuto non potrà essere utilizzato dalle funzionalità basate sull’analisi testuale.
L’estrazione del testo o la generazione di trascrizioni possono risultare fallimentari nei seguenti casi:
- File audio o video privi di parlato (ad esempio contenenti esclusivamente musica di sottofondo);
- Trascrizioni con meno di 30 parole, le quali vengono scartate;
- Contenuti privati che richiedono autenticazione per l’accesso;
- Immagini compresse a tal punto da impedire un riconoscimento ottico dei caratteri (OCR) accurato.
Sono utilizzabili dalle funzionalità quali Ricerca globale, Harmony e Tag automatici esclusivamente i contenuti dai quali la piattaforma riesce con successo a estrarre il testo o a generare una trascrizione.