Die Metadaten Supply Chain – der erste Schritt zur Content Intelligence

Wenn heutzutage das Wort Metadaten fällt, ist man schnell im Gedanken bei Zusatzinformationen, die in unterschiedlichen Applikationen händisch gepflegt werden müssen. Man denkt an Informationen wie Titel, Beschreibung, Ersteller, Kategorie, Copyright und ähnliches.

Ein ganz anderes Bild zeigt uns das jüngste Forschungsprojekt „You are your Metadata: Identification and Obfuscation of Social Media Users using Metadata Information“ am Alan Turing Institute des University College in London. Die Arbeit der Forscher beweist, dass sich allein auf Basis von gespeicherten Metadaten die zugehörigen Nutzer eindeutig identifiziert werden können. In der Studie haben die Forscher analysiert, wie sich aus den Metadaten, die die Nutzer auf Twitter hinterlassen, deren Leben einfach rekonstruieren lässt. Es ging dabei nicht um die Inhalte der Tweets, sondern um Metadaten wie Zeit und Ort des Posts, Links, Hashtags oder Retweets. Laut den englischen Forschern befüllen Nutzer demnach „144 obskure Datenfelder“, ohne es zu merken. Erkenntnis der Forscher: „Wir konnten anhand der Metadaten jeden von 10.000 Nutzern mit einer Genauigkeit von 96,7 Prozent identifizieren.“
Quelle: https://www.sueddeutsche.de/digital/twitter-studie-privatsphaere-nutzer-1.4047115

Diese und andere Studien beweisen, dass Metadaten weit mehr als nur Felder sind, die ausgefüllt werden müssen. Sie besitzen unglaubliches Potential und sind die wesentliche Basis für Anwendungensfelder im Bereich der künstlichen Intelligenz bzw. Machine Learning.

Aus diesem Anlass wollen wir in diesem Beitrag Antworten auf die wesentlichen Fragen zu Metadaten geben:

  • Was sind Metadaten nun wirklich?
  • Welche Metadaten gibt es?
  • Wie kann ich sie nutzen?
  • Und was hat das Ganze eigentlich mit Content Intelligence zu tun?

Was sind Metadaten nun wirklich?

Metadaten werden traditionell als „Informationen über Merkmale anderer Daten“ definiert. Diese Definition ist aber nur bedingt geeignet, wenn es um die Bedeutung von Metadaten geht. Besser werden sie als „kontextbezogene Daten“ beschrieben. Der Kontext gibt eine Perspektive oder eine Bedeutung, die den Benutzern einen Mehrwert bietet.

„Assets“ entstehen erst durch die Anreicherung von Metadaten

Objekte, die in DAM-Systemen gespeichert sind, werden deshalb zum Teil „digitale Assets“ genannt, da sie einen Mehrwert liefern, der in der Beschreibung enthalten ist.
Oft werden die Begriffe Daten, Informationen, Content und Assets stellvertretend verwendet. Diese haben aber durchaus unterschiedliche Bedeutungen.

*1: https://www.cmswire.com/cms/web-engagement/content-strategy-understanding-the- difference-between-data-information-and-content-009088.php
*2: Theresa Regli – Digital Asset Management 2016

Welche Metadaten gibt es?

Metadaten existieren in unterschiedlicher Form und Ausprägung. Sie können als beschreibende Texte, Strukturen und Hierarchien oder auch als Verweise und Beziehungen gegeben sein.
Metadaten werden von der National Information Standards Organization (NISO) in den 4 wesentliche Typen unterschieden:

Strukturierte vs. Unstrukturierte Metadaten

Zusätzlich können Metadaten noch in strukturierte und unstrukturierte Daten unterteilt werden.

Wie kann ich Metadaten nutzen?

Metadaten können für unterschiedlichste Einsatzzwecke genutzt werden:

Suchen und Finden
Der am häufigsten angewendete Einsatzzweck ist sicherlich die erweiterte Suchmöglichkeit durch die zusätzliche Beschreibung des Contents.

Navigieren und Strukturieren
Auch die dadurch mögliche mehrdimensionalen Navigation bzw. Strukturierung von Content, wie z.B. bei der Anwendung von Kategoriebäumen oder Klassifikation bei Produkten ist ein sehr beliebter Einsatzzweck.

Beziehungen und Verbindungen
Eine oft unterschätzte aber wesentliche Meta-Information sind Relationen. Diese geben uns Kontrolle und Sicherheit bei der Verwendung, sowie bei der zielgerichteten Eliminierung von Content.

Metadaten als Geschäftsmodell

Metadaten sind auch der Kern der Geschäftsmodelle der großen „Digital Pure Player“:

Facebook-Nutzer erstellen Metadaten, wenn sie Freundeslisten verwalten, Status veröffentlichen oder Beschreibungen zu Medien hinzufügen, den Status von Freunden „liken“, bereits veröffentlichten Inhalt erneut teilen und Originalmedien beisteuern. Durch das Verfolgen dieser Aktivitäten analysiert Facebook Trendthemen und fördert gesponserte Beiträge, die Einnahmen generieren.

Amazon hat eine weltweite Online-Präsenz im Einzelhandel, die viele verschiedene Warenkategorien abdeckt. Metadaten steuern viele Teile des Unternehmens. Die Metadaten beginnen mit den Herausgebern von Büchern oder Anbietern anderer Arten von Waren, als Teil ihrer eigenen Inventarsysteme. Diese Lieferanten senden diese Metadaten an Amazon, das sie mit ähnlichen Informationen von Tausenden anderer Anbieter integriert, um eine eigene Website für den Produktverkauf zu erstellen. Amazon sammelt Metadaten über Verkäufe und nutzt sie weiter, um Kunden Empfehlungen zu geben und die Beziehungen zu Lieferanten zu optimieren. Amazon stellt die Metadaten über die Produkte, die es vermittelt, auch Affiliate- Seiten zur Verfügung, die darüber hinaus eigene Dienste aufbauen, den Umsatz über Amazon steigern und das Geschäft an den ursprünglichen Anbieter weiterleiten.

Quelle: UNDERSTANDING METADATA, WHAT IS METADATA, AND WHAT IS IT FOR? By Jenn Riley

Wie und wo komme ich an die wichtigsten Metadaten?

Metadaten sind nicht nur „User Generated Content“, sondern entstehen während des gesamten Marketing-Content-Lifecycles.
In der Supply-Chain-Terminologie können Prozesse in Upstream- oder Downstream-Prozesse unterschieden werden.
Im Zusammenhang mit dem Marketing-Content-Lifecycle bedeutet „Upstream“, dass Metadaten generiert werden, bevor das Asset erstellt wird, häufig sogar bevor die binären Daten überhaupt existieren.
Downstream bedeutet, dass Metadaten hinzugefügt werden, nachdem dem Asset eine Kennung zugewiesen wurde.


(Für eine größere Ansicht bitte klicken)
Was hat das ganze eigentlich mit Content Intelligence zu tun?

Bevor wir dieser Frage auf den Grund gehen können, gilt es den Begriff „Content Intelligence“ kurz zu erklären.

Content Intelligence bedeutet, den vollständigen Kontext eines einzelnen Contents zu
begreifen, um bessere Entscheidungen für den betroffenen Inhalt zu treffen. Dabei ist mit Content jegliche Form und Ausprägung von Inhalten gemeint. Dies können Bilder, Texte, Produkte, Videos, redaktionelle Artikel, Kommentare oder Sonstiges sein.

Content Intelligence ist wie eine Rechtschreib- und Grammatik Prüfung für digitale Asset, die Ihnen anzeigt, ob ein Content an dieser Stelle inhaltlich „richtig“ bzw. geeignet ist und ob er in der „richtigen“ bzw. geeigneten Reihenfolge, also in der richtigen „Grammatik“, angewendet wird.

Warum Content Intelligence ohne Metadaten nicht funktioniert

Content Intelligence besteht aus 3 Wesentlichen Säulen: 1) Das Sammeln von Daten, 2) die Analyse der Daten, 3) die Ableitung von Vorhersagen auf Basis der Analyse.
Im wesentlichen bedient sich Content Intelligence an Technologien wie Big Data, Machine Learning, Natural Language Processing und weiteren Formen der Artificial Intelligence, auf Deutsch „künstliche Intelligenz“.

Alle diese Technologien ermöglichen es, bereits heute gezielt Muster aus enormen Mengen von Daten zu erkennen und dadurch statistische Entscheidungen abzuleiten.
Um das Potential dieser Technologien voll auszuschöpfen, braucht es jedoch große Mengen an Metadaten.

Um eine solche Anzahl an Metadaten zu generieren, muss im Unternehmen folgendes gegeben sein:

  • Das Bewusstsein, Metadaten als Mehrwert zu verstehen.
  • Digital Asset Management für die Verwaltung und Vorhaltung von Metadaten.
  • Eine Metadaten Supply Chain, für die laufende und nachhaltige Erzeugung von Metadaten.

Die Metadaten Supply Chain

Die Metadaten Supply Chain ist nicht bloß eine Technologie oder Applikation. Sie ist viel mehr ein kontrollierter Prozess in Form ein Lieferkette, die sich nahtlos in die System-Landschaft eines Unternehmens integriert, und sich durch Einsatz von Technologie selbstständig und laufend optimiert (automatisiert). Die Metadaten Supply Chain hat als oberstes Ziel die quantitative, aber auch qualitative Erzeugung von Metadaten für Marketing Inhalte. Sie benötigt den Einsatz von menschlichen Ressourcen, vermindert diesen aber laufend und auch wesentlich während ihrer Einsatzzeit und erzeugt von Beginn an Metadaten, die genutzt werden können. Viele der zu erzeugenden Metadaten entstehen automatisch durch die Benutzung von Systemlösungen im Marketing-Content-Lifecycle, manche Metadaten indirekt durch die Verwendung von digitalen Formularen und geführten Workflows, und manche Metadaten müssen zusätzlich manuell angereichert werden. Entscheidend für die Akzeptanz des manuellen Ressourcen Einsatzes ist, dass alle erzeugten Metadaten durch das Training einer Künstlichen Intelligenz, als Vorschläge (Vorhersagen) auch im Metadaten-Prozess wiederverwendet werden können, um den Prozess nachhaltig zu verbessern und zu beschleunigen.

Der Weg zur Metadaten Supply Chain

1) Content Audit
Wenn man sich als Unternehmen entschließt eine Metadaten Supply Chain einzurichten, ist der erste Schritt nicht eine Technologie anzuschaffen, sondern ein Content-Audit durchzuführen. Es gilt herauszufinden welchen Content man besitzt, welche Prozesse mit diesem verbunden sind und welche Metadaten für diesen Content von Bedeutung sind.

2) Technologie Stack
Um eine bedienbare und langfristig durchführbare Supply Chain einzurichten, braucht es den Einsatz eines definierten Marketing Technologie Stacks. Dieser kann sich aus bestehenden Systemen und auch neuen Systemen zusammensetzen. Auch ist es möglich, Lösungen einzusetzen, die sich auf Basis einer All-In-One Lösung als zentraler und unternehmensweiter Marketing-Content-Hub platzieren.

3) Durchgängiger Prozess
Die Metadaten Supply Chain ist im Kern ein durchgängiger Prozess, der sicherstellt, dass alle relevanten Metadaten aus dem Content Audit erzeugt und und abgespeichert werden. Es gilt, die Prozesse so zu modellieren, dass sie automatisch oder mit geringem Aufwand intuitiv durchführbar sind. Hierfür benötigt es Lösungen, die ein digitales Workflow- und Taskmanagement ermöglichen.

4) Einsatz von Künstlicher Intelligenz
Um Systemen heute die Fähigkeit zur Selbstoptimierung zu verleihen, benötigt es den Einsatz künstlicher Intelligenz. Dadurch ist es möglich, Systeme zu trainieren, um auf Basis der bestehenden Metadaten Vorhersagen für zukünftige Metadaten zu treffen.
Dies ermöglicht es iterativ im Form eines sogenannten „Batch Learnings“ die Prozesse zu optimieren und weitgehend zu automatisieren. Der richtige Mix aus Automatismus und manuellen Kontrollmechanismen ist dabei entscheidend für die Qualität und stetige Verbesserung.

5) Schaffung einer Basis durch Initiales Training
Um die initiale Hürde innerhalb des Unternehmens zu verringern, ist es ratsam für die Einführung des Metadaten Supply Chain erste sogenannte trainierte „Classifier“ bereitzustellen. Classifier sind eine Art Schablone und werden im Bereich des Machine-Learnings eingesetzt. Sie sind für die Programmierung verwendbare digitale Modelle, die auf Basis von zuvor analysierten Datenbeständen, erkannte Muster in Form von Regelwerken bereitstellen. Die initial benötigten Classifier können auf Basis des Content-Audits nominiert und durch geschultes Personal erstellt werden. Ist die Metadaten Supply Chain richtig modelliert, ist als Vorbereitung für das initiale Training, bloß die mehrfache Durchführung gewisser Abschnitte der Lieferkette für eine bestimmte Kategorie von digitalen Assets notwendig, bis eine erstes ausreichendes Datenset für ein Training erschaffen wurde.

Über den Autor
Manuel Mayr, Lead Marketing Content Management bei Premedia, beschäftigt sich bereits über 10 Jahren mit der Umsetzung von Marketing Technologie-Projekten mit dem Schwerpunkt DAM, PIM und Publishing. Gemeinsam mit seinem Team unterstützt er die Marketing- und IT-Abteilungen bei der Digitalisierung und Automatisierung der Content- und Geschäftsprozesse.

Sie wollen mehr zum Thema Metadaten und Content Intelligence erfahren? Premedia ist Goldpartner auf der Marketing Power Conference am 06./07. November 2018. Schauen Sie doch ganz einfach vorbei und lassen Sie sich live im Workshop überzeugen!

Speichere in deinen Favoriten diesen permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.