Einführung
Wenn Sie Inhalte auf Ihre Plattform hochladen, analysiert das System die Datei, um Textinformationen zu extrahieren. Je nach Format ruft die Plattform diese Informationen durch Textextraktion (für Dokumente, Bilder, Webdateien und ähnliche Formate) oder Transkripterstellung (für Audio-, Video- und unterstützte Lernpakete) ab.
Nur Inhalte, aus denen das System erfolgreich Text extrahieren oder ein Transkript erstellen kann, können von Plattformfunktionen genutzt werden, die auf Textanalyse basieren:
Dieser Artikel gibt einen Überblick über alle unterstützten Inhaltstypen und die Bedingungen, die für eine erfolgreiche Textextraktion und Transkripterstellung erforderlich sind.
Unterstützte Inhaltstypen für die Inhaltsanalyse
Die folgende Tabelle listet alle Dateitypen auf, die von der Plattform analysiert werden können.
| Kategorie | Typen | Extrahierter Inhalt | Schulungsunterlagen / Assets |
| Textdateien | .txt, .csv | Text | Schulungsunterlagen und Assets |
| Dokumentdateien | .doc, .docx, .odt, .ppt, .pptx, .pdf, .xls, .xlsx | Text | Schulungsunterlagen und Assets |
| Bilddateien | .bmp, .jpeg, .png, .tiff | Text im Bild | Schulungsunterlagen und Assets |
| Webdateien |
.html, .htm Hinweis: Wenn eine URL einer Webseite angegeben wird, wird das Transkript nur für diese spezifische Seite erstellt. Inhalte von eingebetteten Links innerhalb der Seite werden nicht extrahiert. |
Text | Schulungsunterlagen und Assets |
| Audiodateien | .acc, .mpeg, .wav | Audio-Transkription | Schulungsunterlagen und Assets |
| Videodateien | .mp4, .mov | Audio-Transkription | Schulungsunterlagen und Assets |
| Google Workspace-Dateien✴ | Docs, Sheets, Slides | Text | Schulungsunterlagen und Assets |
| Verlinkte Online-Videos✴ | YouTube, Vimeo, Wistia | Untertitel | Schulungsunterlagen und Assets |
| E-Learning-Pakete✴ | SCORM und xAPI/TinCan (Articulate Rise und Articulate Storyline) | Text und Audio-Transkription | Schulungsunterlagen |
| Docebo-Dateien | Creator-Unterrichte | Text und Audio-Transkription | Schulungsunterlagen |
✴Private Inhalte (Inhalte, die eine Authentifizierung zum Zugriff erfordern) werden nicht unterstützt
Nicht unterstützte Inhalte und Extraktionsbeschränkungen
Inhaltstypen, die in der obigen Tabelle nicht aufgeführt sind, werden für Textextraktion oder Transkripterstellung nicht unterstützt. Dazu gehören Aufgaben, Docebo Learning Impact (DLI), LTI, Beobachtungschecklisten, Umfragen, Tests, Elucidat, Archive, Wiedergabelisten, Shape und AICC.
Zusätzlich zum unterstützten Dateityp muss das System auch in der Lage sein, Text zu extrahieren oder ein Transkript aus dem Inhalt zu erstellen. Wenn die Textextraktion fehlschlägt, können die Inhalte nicht von Funktionen genutzt werden, die auf Textanalyse basieren.
Textextraktion oder Transkripterstellung kann in folgenden Fällen fehlschlagen:
- Audio- oder Videodateien, die keine Sprache enthalten (z. B. nur Hintergrundmusik)
- Transkripte, die kürzer als 30 Wörter sind und verworfen werden
- Private Inhalte, die eine Authentifizierung zum Zugriff erfordern
- Bilder, die so stark komprimiert sind, dass eine genaue optische Zeichenerkennung (OCR) nicht möglich ist.
Nur Inhalte, aus denen die Plattform erfolgreich Text extrahieren oder ein Transkript erstellen kann, können von Funktionen wie der globalen Suche, Harmony und Auto-Tagging verwendet werden.