Tipos de contenidos compatibles con la extracción de texto y la generación de transcripciones – Docebo Help & Support

Presentación

Cuando sube contenido a su plataforma, el sistema analiza el archivo para extraer información textual. Dependiendo del formato, la plataforma localiza esta información mediante la extracción de texto (para documentos, imágenes, archivos web y formatos similares) o la generación de transcripciones (para audio, vídeo y paquetes de aprendizaje compatibles).

Solo el contenido del que el sistema pueda extraer o generar texto correctamente puede ser utilizado por las funciones de la plataforma basadas en el análisis textual:

Este artículo enumera todos los tipos de contenidos compatibles y las condiciones necesarias para la correcta extracción de texto y generación de transcripciones.

Tipos de contenidos compatibles con el análisis de contenidos

La siguiente tabla enumera todos los tipos de archivos que puede analizar la plataforma.

Categoría	Tipos	Contenido extraído	Materiales de formación / activos
Archivos de texto	.txt, .csv	Texto	Materiales de formación y activos
Archivos de documentos	.doc, .docx, .odt, .ppt, .pptx, .pdf, .xls, .xlsx	Texto	Materiales de formación y activos
Archivos de imagen	.bmp, .jpeg, .png, .tiff	Texto en la imagen	Materiales de formación y activos
Archivos web	.html, .htm Nota: Cuando se proporciona la URL de una página web, la transcripción se genera solo para dicha página específica. No se extrae el contenido de los enlaces integrados en la página.	Texto	Materiales de formación y activos
Archivos de audio	.acc, .mpeg, .wav	Transcripción de audio	Materiales de formación y activos
Archivos de vídeo	.mp4, .mov	Transcripción de audio	Materiales de formación y activos
Archivos de Google Workspace✴	Docs, Sheets, Slides	Texto	Materiales de formación y activos
Videos en línea enlazados✴	YouTube, Vimeo, Wistia	Subtítulos	Materiales de formación y activos
Paquetes de e-learning✴	SCORM y xAPI/TinCan (Articulate Rise y Articulate Storyline)	Transcripción de texto y audio	Materiales de formación
Archivos de Docebo	Lecciones de Creator	Transcripción de texto y audio	Materiales de formación

✴No se admiten contenidos privados (contenidos que requieran autenticación para su acceso)

Contenido no admitido y limitaciones para la extracción

Los tipos de contenidos que no aparecen en la tabla anterior no son compatibles con la extracción de texto ni con la generación de transcripciones. Entre ellos se incluyen: tareas, Docebo Learning Impact (DLI), LTI, listas de comprobación de observación, encuestas, exámenes, Elucidat, archivos, listas de reproducción, Shape y AICC.

Además de ser de un tipo de archivo compatible, el sistema también debe poder extraer texto o generar una transcripción a partir del contenido. Si la extracción de texto falla, el contenido no puede ser utilizado por las funciones que dependen del análisis textual.

La extracción de texto o generación de transcripciones puede fallar en los siguientes casos:

Archivos de audio o vídeo en los que no se hable (por ejemplo, solo música de fondo).
Transcripciones de menos de 30 palabras, que se descartan.
Contenido privado que requiera autenticación para su acceso.
Imágenes comprimidas hasta un punto que impide un reconocimiento óptico de caracteres (OCR) preciso.

Solo el contenido del que la plataforma pueda extraer texto o generar una transcripción con éxito puede utilizarse en funciones como la búsqueda global, Harmony y el etiquetado automático.