Welche Daten sollte ich aufbewahren?

Die weltweite Datenexplosion setzt sich unvermindert fort und bringt für Unternehmen aller Branchen weitreichende Herausforderungen mit sich. Die Anforderungen des vergangenen Jahrzehnts, die Reduzierung von Datenvolumen bei gleichzeitiger Einhaltung gesetzlicher Aufbewahrungs und Archivierungspflichten, treffen heute auf den Zeitgeist der künstlichen Intelligenz und den Wunsch, möglichst alle potenziell künftig relevanten Daten vorzuhalten. Da die unbegrenzte Speicherung sämtlicher Informationen weder wirtschaftlich noch organisatorisch tragfähig ist, rückt zunehmend eine zentrale Frage in den Fokus:

Welche Daten sollte ich tatsächlich aufbewahren?

Beginnen wir mit dem Offensichtlichen

Die unverzichtbare Grundlage bilden nach wie vor die gesetzlichen Anforderungen. Gesetzliche Aufbewahrungspflichten definieren die Mindestmenge an Daten, die gespeichert werden muss, sowie die jeweiligen Aufbewahrungsfristen. Selbst wenn keine weiteren Informationen archiviert werden, müssen diese Daten verfügbar bleiben, und auf Anforderung entweder bereitgestellt oder ordnungsgemäß gelöscht werden können.

Ein Großteil dieser Informationen gehört zur Kategorie der sogenannten „Low Touch Daten“. Dabei handelt es sich um Datenbestände auf die nur selten oder gar nicht zugegriffen wird und die primär zu Compliance Zwecken bis zum Ablauf der vorgeschriebenen Aufbewahrungsfrist gespeichert werden. Danach erfolgt ihre Löschung in der Regel automatisiert.

Über die Grundlagen hinaus

Im Zeitalter der künstlichen Intelligenz entscheiden sich immer mehr Organisationen dafür, Datenbestände dauerhaft aufzubewahren. Dadurch entstehen umfangreiche Datenpools, die als Grundlage für Automatisierungs und KI Lösungen dienen und wertvolle Erkenntnisse sowie geschäftsrelevante Mehrwerte liefern können. Gleichzeitig erhöht sich jedoch die Komplexität des Datenmanagements erheblich.

Noch vor wenigen Jahren lag der Schwerpunkt vieler Experten auf Daten Tiering und Kostenoptimierung. Eine effektive Archivierungsstrategie bestand darin, Dateien zu identifizieren, die über einen bestimmten Zeitraum weder genutzt noch verändert wurden, oder Datenbestände inaktiver Benutzerkonten beispielsweise ehemaliger Mitarbeiter, auszusondern und in kostengünstigeres Archiv und Langzeitspeicherklassen zu verschieben.

Bereits die Identifikation und Klassifizierung von Daten anhand solcher Kriterien stellte Unternehmen vor erhebliche Herausforderungen. Mit dem Einzug intelligenter Automatisierungswerkzeuge verändert sich die Situation jedoch grundlegend. Daten, die bislang als wenig relevant galten und in tiefen Archivschichten abgelegt wurden, können künftig einen erheblichen analytischen Wert besitzen. Die Aussagekraft KI gestützter Auswertungen hängt unmittelbar von Umfang, Qualität und Historie der verfügbaren Daten ab. Gleichzeitig bleibt die zentrale Herausforderung bestehen: zu unterscheiden, welche Informationen tatsächlich wertvolle Erkenntnisse ermöglichen und welche lediglich Datenrauschen darstellen.

Lösungsansätze und neue Herausforderungen

Einige Organisationen versuchen, dieses Problem durch eine nahezu vollständige Datenspeicherung zu lösen. Angesichts steigender Speicherkosten ist dieser Ansatz jedoch langfristig häufig weder wirtschaftlich noch nachhaltig. Darüber hinaus erhöht jede zusätzliche Datensammlung das Sicherheitsrisiko. Größere Datenbestände vergrößern nicht nur die Compliance Anforderungen, sondern erweitern auch die potenzielle Angriffsfläche für Datenschutzverletzungen und Cyberangriffe.

Der zukunftsweisende Ansatz liegt daher in der automatisierten Datenerkennung und Datenklassifizierung. Ab einer bestimmten Größenordnung ist eine manuelle Verwaltung von Aufbewahrungsrichtlinien und Datenbeständen schlicht nicht mehr praktikabel. Moderne Archivsysteme müssen einen Großteil dieser Aufgaben übernehmen, indem sie Daten automatisiert analysieren, klassifizieren und den jeweils passenden Aufbewahrungsrichtlinien zuordnen. Gleichzeitig müssen sie sicherstellen, dass relevante Informationen auch künftig effizient identifiziert und genutzt werden können.

Genau diese Fähigkeit wird die Leistungsfähigkeit moderner Archivlösungen in den kommenden Jahren maßgeblich bestimmen. Unternehmen Weltweit stehen vor der Aufgabe, ihre Strategien und Technologien an die neuen Rahmenbedingungen anzupassen und sich kontinuierlich weiterzuentwickeln, während die KI Transformation weiter an Dynamik gewinnt.

Ihre Daten in Ihren Händen – Mit TECH-ARROW

by Matúš Koronthály

Bildquelle: Canva