SER Blog  Customer Storys & Lösungen

Dark Data: Verborgener Schatz oder Kostenfalle?

Christian Bley

In der Ära der Digitalisierung sind Daten zu einem der wertvollsten Vermögenswerte für Unternehmen geworden. Doch während die Bedeutung von Daten in den letzten Jahren exponentiell gewachsen ist, gibt es immer noch einen Teil, der im Dunkeln verborgen bleibt – Dark Data. Dieser Artikel befasst sich eingehend mit Dark Data, die Bedeutung und wie es Unternehmen beeinflusst.

Was ist Dark Data?

Der Begriff Dark Data bezieht sich auf Informationen und Daten, die von Unternehmen gesammelt, aber nicht aktiv genutzt oder analysiert werden. Diese Daten liegen oft unstrukturiert und ungenutzt in den Tiefen der Unternehmenssysteme in Datensilos vor, beispielsweise als E-Mails, Dokumente, Bilder, Videos, Textnachrichten und vieles mehr.

Viele Unternehmen sehen in der Strukturierung primär einen Kostenfaktor. Doch Dark Data sollte vielmehr als wertvolle Ressource betrachtet werden. Um ein Gefühl für die Relevanz zu bekommen, hier ein paar Zahlen:

-             In 2023 werden weltweit 120 Zettabyte an Daten generiert

-             80 % der bestehenden Daten sind unstrukturiert

-             50 % der Daten sind Dark Data  

Herausforderungen und Risiken durch Dark Data

Die Masse an Informationen

Welche Informationen sind wichtig, welche nicht? Wem sind wann und wo Informationen zur Verfügung zu stellen? Gerade die Pandemie hat dafür gesorgt, dass wir diverse Plattformen zur Verfügung gestellt bekommen haben, über welche wir Informationen leicht und schnell teilen. Dieser schon über die Jahre davor anhaltende Trend hat dazu geführt, dass uns im Arbeitsalltag eine Flut an Informationen entgegen schlägt.

Auch die Preisentwicklung immer günstiger werdender Speichertechnologien hat hierzu beigetragen. Ein Großteil dieser teilweise redundanten, teilweise auch vergessenen Informationen ist Dark Data.

DSGVO-Konformität

Eine weitere Herausforderung ist die Einhaltung der Datenschutz-Grundverordnung (DSGVO) und weiterer Datenschutzbestimmungen. Wenn Unternehmen nicht wissen, welche Daten sie besitzen, können sie auch keine angemessenen Maßnahmen zur Sicherung und Einhaltung der Vorschriften ergreifen. Dark Data kann somit ein erhebliches Risiko für die Datenschutzkonformität darstellen. 

Mangelndes Know-how und fehlende Softwarelösungen

Die Fähigkeit Dark Data zu analysieren wird immer wichtiger. Hier kommt es sowohl auf das richtige Wissen als auch die richtigen Werkzeuge im Unternehmen an. Der Umgang mit Daten ist ausschlaggebend dafür, in welchem Ausmaß Dark Data produziert wird aber auch wie es wiederum nutzbar gemacht werden kann. Hierbei helfen Softwarelösungen, die meistens noch gar nicht im Einsatz sind und damit auch keine Erfahrungswerte existieren. Beispiel Prompt Engineering: Hier werden einer KI in natürlicher Sprache Anweisungen gegeben, welche immer weiter verfeinert werden um optimale Ergebnisse zu erhalten. Eine Disziplin, die es vorher schlicht nicht gab.

Cyberkriminalität

Dark Data sind oft ungeschützt und ungesichert. Dies macht sie anfällig für Cyberangriffe. Unternehmen müssen daher sicherstellen, dass sie robuste Sicherheitsmaßnahmen implementieren, um Dark Data vor Bedrohungen zu schützen.

Verlust wertvoller Erkenntnisse

Dark Data enthält potenziell wertvolle Erkenntnisse über Kundenverhalten, Markttrends und operative Effizienz. Wenn diese Daten nicht analysiert werden, gehen diese Erkenntnisse verloren, und Unternehmen verpassen wertvolle Chancen zur Verbesserung ihrer Geschäftsstrategien.

So wird Dark Data nutzbar

Die Bewältigung von Dark Data erfordert den Einsatz von Technologien und Lösungen, die Unternehmen bei der Identifizierung, Analyse und Nutzung dieser Daten unterstützen.

Enterprise Content Management (ECM)

ECM-Systeme sind entscheidend, um unstrukturierte Daten zu organisieren und für die Nutzung verfügbar zu machen. Neben der Möglichkeit zur Klassifizierung, Indexierung und Archivierung von Dokumenten kann auch der Zugriff auf die Informationen klar definiert werden. Das ist zum einen wichtig, da nicht jeder Mitarbeiter auf jede Information Zugriff haben darf, zum anderen, um Schlicht die oben bereits angesproche Informationsflut einzudämmen und dem Anwender nur relevante Informationen zur Verfügung zu stellen. Dies steigert wiederum die Effizienz. 

Doch Enterprise Content Management geht noch weiter und sorgt dafür, dass Dokumente am Ende ihres Lebenszyklus gelöscht oder auch anonymisiert werden. Somit können Compliance Richtlinien und darüber hinaus gesetzliche Vorgaben im Rahmen des Datenschutzes eingehalten werden. 

Praxisbeispiel: Dark Data in der Vertragsverwaltung

Ein Softwareunternehmen verwaltet über sein ECM sämtliche bestehende Verträge und dazugehörige Dokumente, darunter Wartungsverzeichnisse und Lizenzinformationen. Die Verträge enthalten vor allem Stammdateninformationen zu den Vertragspartnern aber auch Angaben zu Laufzeiten und weiteren Parametern. In den mitgeltenden Dokumenten finden sich Informationen zu den Vertragsgegenständen. 

Die Analyse Wartungsverzeichnisse gibt Aufschluss über die unter Wartung stehenden Softwaremodule über alle Kunden hinweg. Dabei lassen sich Trends zur Anzahl und Laufzeiten feststellen. Es stellt sich heraus, dass über die Zeit bestimmte Lizenzen oder Produkte in den Verträgen nicht mehr auftauchen. Das könnte ein Hinweis darauf sein, dass diese entweder nicht mehr nachgefragt werden oder veraltet sind. Es wird also ein Produkt am Leben gehalten, welches gar nicht mehr beim Kunden im Einsatz ist.

Die Konsequenz: Durch die Abkündigung dieser Produkte könnten erhebliche Kosten eingespart werden, da die Weiterentwicklung nicht mehr vorangetrieben wird und keine Ressourcen mehr für die Bereitstellung des Service in diesem Bereich vorgehalten werden müssen. Dark Data wird somit zu einer wertvollen Quelle für Kosteneinsparungen und Prozessoptimierung

Leitfaden für die Automatisierung & Optimierung von Geschäftsprozessen

Wie können Sie Ihre Geschäftsprozesse automatisieren und optimieren, um mehr Agilität, Kundenzufriedenheit & Effizienz zu erreichen? Unser Leitfaden enthält Empfehlungen, Praxisbeispiele & Checklisten, die Sie bei der Digitalisierung Ihrer Prozesse unterstützen. 

Jetzt Whitepaper lesen

Künstliche Intelligenz (KI)

Die jüngsten Entwicklungen im Bereich der Künstlichen Intelligenz erlauben es Unternehmen, Dark Data effektiv und schnell zu verarbeiten.

Bisher waren Unternehmen kaum in der Lage, Dark Data in der selben Geschwindigkeit zu analysieren, wie sie produziert wurde. KI bietet erstmalig die Möglichkeit, Daten im großen Umfang zu klassifizieren, sodass Muster und Trends schneller identifiziert werden können.

Praxisbeispiel: Dark Data durch chatten erschließen

Ein Unternehmen verwaltet seine Verträge digital. Bei der Erstellung, während der Verhandlung sowie nach Abschluss müssen bestimmte Passagen und Informationen aus dem Vertragswerk erfragt werden. Das Problem: Wo befindet sich die gesuchte Information? Wie ist diese zu interpretieren?

Über einen Chatbot auf Basis eines Large Language Model (LLM) kann der Anwender nun mit dem Dokument interagieren und beispielsweise nach den beteiligten Vertragspartnern im Dokument fragen. Neben solch einfachen Abfragen wären aber auch wesentlich komplexere Fragestellung nach Kontextinformationen möglich. So kann die Auswertung der Vertragsstrafen Aufschluss auf die möglichen Risiken geben. Der Anwender erschließt sich so den kompletten Vorgang durch die Unterhaltung mit den Dokument.

Die Vorteile der Nutzung von Dark Data

Die Vorteile der Nutzung von Dark Data lassen sich auf operativer und auf strategischer Ebene finden.

Kosteneinsparungen

Durch die Identifizierung und Analyse von Dark Data können ungenutzte Ressourcen erkannt und beseitigt werden. Dies kann zu erheblichen Kosteneinsparungen führen, sei es durch die Einstellung nicht mehr benötigter Dienstleistungen wie im oben genannten Beispiel oder die Optimierung von Prozessen.

Verbesserte Transparenz und Effizienz

Dark Data zu nutzen bedeutet auch, besseren Zugriff auf relevante Informationen zu haben. Dies verbessert massiv die Transparenz in Vorgängen, was die Kommunikation intern unter den eigenen Mitarbeitern und nach extern zu Geschäftspartnern erheblich verbessert. Das Einbeziehen von Dark Data in Entscheidungsprozesse sorgt für mehr Effizienz sowie für mehr Qualität im Ergebnis.

Bessere Kundenbeziehungen

Die Verfügbarkeit der richtigen Daten zur richtigen Zeit kann auch die Kundenbeziehungen verbessern. Wer seine Kunden besser versteht und weiß, welche Produkte oder Dienstleistungen bevorzugt werden, kann so auch maßgeschneiderte Angebote erstellen.

Risikomanagement & Compliance

Ein weiterer Nutzen, der aus Dark Data gezogen werden kann, ist die Verbesserung der Compliance und Risikomanagement-Strategien. Dark Data enthält oft Informationen, die auf mögliche Compliance-Verstöße oder Risiken hinweisen können, aber diese Informationen bleiben oft unbeachtet. Durch die Identifizierung und Analyse von Dark Data können Unternehmen frühzeitig potenzielle Risiken erkennen und proaktiv Maßnahmen ergreifen, um rechtliche und finanzielle Konsequenzen zu vermeiden. Dies kann dazu beitragen, den Ruf des Unternehmens zu schützen und das Vertrauen von Kunden und Investoren zu stärken. 

7 DMS-Funktionen, die Sie nie mehr missen wollen

Mit DMS bearbeiten, lenken & archivieren Sie Dokumente einfacher, schneller & immer nachvollziehbar. Diese DMS-Funktionen helfen Ihnen am meisten

Jetzt Whitepaper lesen

Die Zukunft von Dark Data

Was wird in der Zukunft mit Dark Data passieren? Wird der Nutzen dieser Informationen überbewertet? Welche Möglichkeiten haben Unternehmen zur Bewältigung von Dark Data? Grob heruntergebrochen wird die Zukunft von zwei wesentlichen Faktoren beeinflusst.

Datenkompetenz

Die Fähigkeit, Daten zu verstehen und effektiv zu nutzen, wird immer wichtiger. Unternehmen müssen in die Schulung und Weiterbildung ihrer Mitarbeiter investieren, um sicherzustellen, dass sie über die erforderliche Datenkompetenz verfügen. Der beste Weg Dark Data nutzbar zu machen, ist dafür zu sorgen, dass Dark Data gar nicht erst produziert wird. Es gilt also ein verantwortungsvoller Umgang beim Teilen und verbreiten von Informationen. Mitarbeiter müssen sich die Frage stellen, welche Daten lege ich wo und in welcher Form ab, sodass diese den richtigen Adressaten erreichen und wiederauffindbar sind. Daten müssen korrekt interpretiert und bewertet werden, sodass eine entsprechende Ableitung von Handlungsmöglichkeiten überhaupt möglich ist. Im Kern geht es also um das kodieren und dekodieren von Daten.

Fortschritte bei Künstlicher Intelligenz

In den letzten Jahren haben wir erhebliche Fortschritte bei Künstlicher Intelligenz gesehen. Diese Fortschritte werden dazu beitragen, Dark Data noch effektiver zu nutzen, da KI-Systeme in der Lage sind, Muster und Zusammenhänge in den Daten besser und schneller als der Mensch zu erkennen. In Zukunft wird diese Technologie noch weiter in der Qualität und in der Handhabung verbessert, sodass sie auch für den breiten Markt zugänglicher wird. Diese Entwicklung hat bereits ganz neue Berufszweige entstehen lassen. So sorgt der Prompt Engineer beispielsweise dafür, dass die KI über gezielte Fragestellungen das beste Ergebnis ausgibt.

KI hilft aber auch bei der Differenzierung von Dark Data. Nicht jede archivierte Information ist relevant. Ein Großteil der Daten sind lediglich Redundanzen, welche gefiltert werden müssen. Es ist auch nicht so, dass aus jeder Information Erkenntnisse gewonnen werden können. Ein nicht kleiner Teil von Dark Data ist schlichtweg unwichtig.

Tipps zur Bewältigung von Dark Data

Hey Doxi, bitte gib mir Tipps, wie ich Dark Data nutzbar mache!

Hier sind meine Top 5 Tipps, wie Sie Dark Data nutzbar machen:

  • Priorisierung: Beginnen Sie mit der Identifizierung der datenintensivsten Bereiche und priorisieren Sie diese.
  • Holen Sie sich Hilfe: Wenn Sie nicht über das erforderliche Know-how verfügen, sollten Sie externe Experten hinzuziehen, um Dark Data effektiv zu nutzen.
  • Automatisierung von Datenklassifizierung und -analyse: Implementieren Sie Automatisierungslösungen, die die Klassifizierung und Analyse von Dark Data erleichtern. Moderne Data-Analytics-Plattformen und KI-Tools können automatisch große Mengen an Daten durchsuchen, kategorisieren und relevante Informationen extrahieren. Dies spart nicht nur Zeit, sondern ermöglicht auch eine kontinuierliche Überwachung Ihrer Datenquellen, um Dark Data in Echtzeit zu identifizieren.
  • Etablieren einer Unternehmenskultur für Datenverantwortung: Schaffen Sie eine Kultur innerhalb Ihres Unternehmens, die die Verantwortung für Daten und Dark Data fördert. Sensibilisieren Sie Ihre Mitarbeiter für die Bedeutung von Datenmanagement und Datenschutz. Stellen Sie sicher, dass jeder Mitarbeiter versteht, wie er dazu beitragen kann, Dark Data zu identifizieren und sicher zu verwalten. Eine aktive Beteiligung aller Mitarbeiter ist entscheidend, um Dark Data effektiv anzugehen.
  • Nicht ignorieren: Der größte Fehler, den Sie machen können, ist, Dark Data zu ignorieren. Erkennen Sie sein Potenzial und setzen Sie es gezielt ein.

Dark Data ist ein verborgener Schatz an Informationen

Dark Data mag im Verborgenen liegen, aber es birgt ungenutzte Potenziale für Unternehmen. Durch die effektive Identifizierung, Analyse und Nutzung von Dark Data können Unternehmen Kosten einsparen, Prozesse optimieren und bessere Entscheidungen treffen. Es ist an der Zeit, das Licht auf Dark Data zu richten und die verborgenen Schätze zu heben, die in den Unternehmensdaten schlummern.

Häufig gestellte Fragen zu Dark Data

Was ist ECM-System?
ECM ist das Akronym für Enterprise Content Management. Dabei handelt es sich um eine unternehmensweite Software, die Informationen sicher verwaltet, strukturiert sowie digitalisiert. Sie eignet sich zum Erfassen, Finden, Bearbeiten, Austauschen sowie zum Aufbewahren von elektronischen Dokumenten.
Was ist ein Large Language Model (LLM)?
Ein Sprachmodell, welches über Machine Learning in der Lage ist, natürliche Sprache zu verarbeiten. LLM finden vor allem in der Analyse textbasierter Inhalte Anwendung. Das wohl bekannteste Modell ist wohl aktuell GPT von OPenAI.
Was sind ROT-Daten?
Nur ein kleiner Teil von Dark Data beinhaltet geschäftsrelevante Daten. Diese haben aber afür eine überproportionale Relevanz. Der Rest sind ROT Daten – redundant, obsolet, trivial. Eine der größten Herausforderung beim Umgang mit Dark Data ist das herausfiltern von ROT Daten.
Was ist der Unterschied zwischen Dark Data und Big Data?
Big Data beschreibt die Gesamtheit an Daten, welche sich über verschiedene Quellen, wie zum Beispiel E-Mails/Dokumenten, Webseiten oder Solcial Media im Unternehmen anhäufen. Dark Data ist der Teil davon, der nicht genutzt wird. Das kann daran liegen, dass die Auswertung zu schwer ist, die Daten unstrukturiert oder nicht relevant sind.

Christian Bley

Hi, ich bin Chris Bley, Solution Engineer bei SER. Seit 15 Jahren berate ich meine Kunden rund um das Thema Digitalisierung, erarbeite Konzepte und setze Projekte in diesem Bereich um. Ein wesentlicher Teil meiner Arbeit besteht dabei aus der Vermittlung meines Wissens. Neben der Veranstaltung von Workshops erstelle ich daher viel Content in Form von Artikeln, Videos, Whitepapern uvm. Wenn am Ende des Tages noch kreative Energie übrig ist, fließt diese in mein Tonstudio und neue Songtexte.[nbsp]

Jetzt zum Newsletter anmelden

Die neusten Digitalisierungstrends, Gesetze und Richtlinien sowie hilfreiche Tipps direkt in Ihrem Postfach.

Wie können wir helfen?

+49 (0) 228 90896-789
Was ist die Summe aus 5 und 6?

Ihre Nachricht hat uns erreicht!

Wir freuen uns über Ihr Interesse und melden uns in Kürze bei Ihnen.

Kontaktieren Sie uns