Unterstützte Inhaltstypen für Textextraktion und Transkripterstellung – Docebo Help & Support

Einführung

Wenn Sie Inhalte auf Ihre Plattform hochladen, analysiert das System die Datei, um Textinformationen zu extrahieren. Je nach Format ruft die Plattform diese Informationen durch Textextraktion (für Dokumente, Bilder, Webdateien und ähnliche Formate) oder Transkripterstellung (für Audio-, Video- und unterstützte Lernpakete) ab.

Nur Inhalte, aus denen das System erfolgreich Text extrahieren oder ein Transkript erstellen kann, können von Plattformfunktionen genutzt werden, die auf Textanalyse basieren:

Dieser Artikel gibt einen Überblick über alle unterstützten Inhaltstypen und die Bedingungen, die für eine erfolgreiche Textextraktion und Transkripterstellung erforderlich sind.

Unterstützte Inhaltstypen für die Inhaltsanalyse

Die folgende Tabelle listet alle Dateitypen auf, die von der Plattform analysiert werden können.

Kategorie	Typen	Extrahierter Inhalt	Schulungsunterlagen / Assets
Textdateien	.txt, .csv	Text	Schulungsunterlagen und Assets
Dokumentdateien	.doc, .docx, .odt, .ppt, .pptx, .pdf, .xls, .xlsx	Text	Schulungsunterlagen und Assets
Bilddateien	.bmp, .jpeg, .png, .tiff	Text im Bild	Schulungsunterlagen und Assets
Webdateien	.html, .htm Hinweis: Wenn eine URL einer Webseite angegeben wird, wird das Transkript nur für diese spezifische Seite erstellt. Inhalte von eingebetteten Links innerhalb der Seite werden nicht extrahiert.	Text	Schulungsunterlagen und Assets
Audiodateien	.acc, .mpeg, .wav	Audio-Transkription	Schulungsunterlagen und Assets
Videodateien	.mp4, .mov	Audio-Transkription	Schulungsunterlagen und Assets
Google Workspace-Dateien✴	Docs, Sheets, Slides	Text	Schulungsunterlagen und Assets
Verlinkte Online-Videos✴	YouTube, Vimeo, Wistia	Untertitel	Schulungsunterlagen und Assets
E-Learning-Pakete✴	SCORM und xAPI/TinCan (Articulate Rise und Articulate Storyline)	Text und Audio-Transkription	Schulungsunterlagen
Docebo-Dateien	Creator-Unterrichte	Text und Audio-Transkription	Schulungsunterlagen

✴Private Inhalte (Inhalte, die eine Authentifizierung zum Zugriff erfordern) werden nicht unterstützt

Nicht unterstützte Inhalte und Extraktionsbeschränkungen

Inhaltstypen, die in der obigen Tabelle nicht aufgeführt sind, werden für Textextraktion oder Transkripterstellung nicht unterstützt. Dazu gehören Aufgaben, Docebo Learning Impact (DLI), LTI, Beobachtungschecklisten, Umfragen, Tests, Elucidat, Archive, Wiedergabelisten, Shape und AICC.

Zusätzlich zum unterstützten Dateityp muss das System auch in der Lage sein, Text zu extrahieren oder ein Transkript aus dem Inhalt zu erstellen. Wenn die Textextraktion fehlschlägt, können die Inhalte nicht von Funktionen genutzt werden, die auf Textanalyse basieren.

Textextraktion oder Transkripterstellung kann in folgenden Fällen fehlschlagen:

Audio- oder Videodateien, die keine Sprache enthalten (z. B. nur Hintergrundmusik)
Transkripte, die kürzer als 30 Wörter sind und verworfen werden
Private Inhalte, die eine Authentifizierung zum Zugriff erfordern
Bilder, die so stark komprimiert sind, dass eine genaue optische Zeichenerkennung (OCR) nicht möglich ist.

Nur Inhalte, aus denen die Plattform erfolgreich Text extrahieren oder ein Transkript erstellen kann, können von Funktionen wie der globalen Suche, Harmony und Auto-Tagging verwendet werden.