Presentación
Cuando sube contenido a su plataforma, el sistema analiza el archivo para extraer información textual. Dependiendo del formato, la plataforma localiza esta información mediante la extracción de texto (para documentos, imágenes, archivos web y formatos similares) o la generación de transcripciones (para audio, vídeo y paquetes de aprendizaje compatibles).
Solo el contenido del que el sistema pueda extraer o generar texto correctamente puede ser utilizado por las funciones de la plataforma basadas en el análisis textual:
Este artículo enumera todos los tipos de contenidos compatibles y las condiciones necesarias para la correcta extracción de texto y generación de transcripciones.
Tipos de contenidos compatibles con el análisis de contenidos
La siguiente tabla enumera todos los tipos de archivos que puede analizar la plataforma.
| Categoría | Tipos | Contenido extraído | Materiales de formación / activos |
| Archivos de texto | .txt, .csv | Texto | Materiales de formación y activos |
| Archivos de documentos | .doc, .docx, .odt, .ppt, .pptx, .pdf, .xls, .xlsx | Texto | Materiales de formación y activos |
| Archivos de imagen | .bmp, .jpeg, .png, .tiff | Texto en la imagen | Materiales de formación y activos |
| Archivos web |
.html, .htm Nota: Cuando se proporciona la URL de una página web, la transcripción se genera solo para dicha página específica. No se extrae el contenido de los enlaces integrados en la página. |
Texto | Materiales de formación y activos |
| Archivos de audio | .acc, .mpeg, .wav | Transcripción de audio | Materiales de formación y activos |
| Archivos de vídeo | .mp4, .mov | Transcripción de audio | Materiales de formación y activos |
| Archivos de Google Workspace✴ | Docs, Sheets, Slides | Texto | Materiales de formación y activos |
| Videos en línea enlazados✴ | YouTube, Vimeo, Wistia | Subtítulos | Materiales de formación y activos |
| Paquetes de e-learning✴ | SCORM y xAPI/TinCan (Articulate Rise y Articulate Storyline) | Transcripción de texto y audio | Materiales de formación |
| Archivos de Docebo | Lecciones de Creator | Transcripción de texto y audio | Materiales de formación |
✴No se admiten contenidos privados (contenidos que requieran autenticación para su acceso)
Contenido no admitido y limitaciones para la extracción
Los tipos de contenidos que no aparecen en la tabla anterior no son compatibles con la extracción de texto ni con la generación de transcripciones. Entre ellos se incluyen: tareas, Docebo Learning Impact (DLI), LTI, listas de comprobación de observación, encuestas, exámenes, Elucidat, archivos, listas de reproducción, Shape y AICC.
Además de ser de un tipo de archivo compatible, el sistema también debe poder extraer texto o generar una transcripción a partir del contenido. Si la extracción de texto falla, el contenido no puede ser utilizado por las funciones que dependen del análisis textual.
La extracción de texto o generación de transcripciones puede fallar en los siguientes casos:
- Archivos de audio o vídeo en los que no se hable (por ejemplo, solo música de fondo).
- Transcripciones de menos de 30 palabras, que se descartan.
- Contenido privado que requiera autenticación para su acceso.
- Imágenes comprimidas hasta un punto que impide un reconocimiento óptico de caracteres (OCR) preciso.
Solo el contenido del que la plataforma pueda extraer texto o generar una transcripción con éxito puede utilizarse en funciones como la búsqueda global, Harmony y el etiquetado automático.