Was sind Daten?

Daten sind digitale Informationsträger, die von einem Computer oder anderem elektronischen Gerät gelesen, bearbeitet und gespeichert werden können. Sie liegen in unterschiedlichen Formaten vor, deren Kodierung einer bestimmten Syntax folgt.

In der Informatik werden Daten fast ausschließlich in binärer Form dargestellt. Dabei ist die Bezeichnung Bit eine Maßeinheit für die Datenmenge. Beispiele für digitale Formate sind unter anderem Text, Bilder, Zahlen sowie Audio- und Videodateien. Welche Informationen Daten genau repräsentieren, muss aus dem jeweiligen Kontext geschlossen werden. So kann die Ziffernfolge 12345678 eine Telefonnummer oder Kreditkartennummer sein. Ihre konkrete Bedeutung erhält sie erst durch die Verarbeitung von Programmen oder Algorithmen.

Welche Arten von Daten existieren?

Strukturierte Daten

Strukturierte Daten werden in einer bestimmten Weise angeordnet, sodass sie eine gleichartige Form aufweisen. Beispiele hierfür sind Datensätze, Felder oder Listen. Strukturierte Daten finden insbesondere in relationalen Datenbanken Anwendung. Informationen werden vor der Speicherung in entsprechenden Feldern sortiert und formatiert. Sie können dann über eine Datenbanksprache wie SQL abgefragt und bearbeitet werden.

Semi-Strukturierte Daten

Im Gegensatz zu strukturierten Daten gibt es bei semi-strukturierten Daten kein festes Schema. Sie sind hierarchisch gegliedert und können durch verschachtelte Informationen erweitert werden. Zudem ist die Reihenfolge der Attribute bei semi-strukturierten Daten unwichtig. Eine Entität einer Klasse kann mehrere Attribute gleichzeitig besitzen.

Unstrukturierte Daten

Unstrukturierte liegen in keinem standardisierten Format vor. Aus ihnen muss erst eine Struktur gewonnen werden, bevor sie in eine Datenbank abgelegt werden können. Beispiele für unstrukturierte Daten sind Bilder, Texte, Video- und Audioaufnahmen. Sie beinhalten häufig viele relevante Informationen, die vor allem im Bereich Big Data von Bedeutung sind.

Was versteht man unter Datenmanagement?

Datenmanagement bezeichnet alle technischen und organisatorischen Maßnahmen zur Verwaltung von Daten, um diese effizient nutzen und Geschäftsprozesse verbessern zu können. Unternehmen sollten daher über eine umfassende Datenstrategie verfügen, die die Ziele des Datenmanagements festlegt. Zu den essenziellen Methoden des Datenmanagements gehören:

Für das Datenmanagement von Unternehmen spielt vor allem Konsolidierung eine wichtige Rolle. Bei der Konsolidierung werden durch Aggregation Daten aus verschiedenen Systemen oder Abteilungen in einer einzigen Quelle zusammengeführt. Es entsteht eine zentrale Sicht und Redundanzen werden reduziert. Für eine optimale Konsolidierung sind eine geeignete Datenarchitektur und hohe Datenqualität notwendig.

Wie können Daten gespeichert werden?

Elektronische Datenspeicher

Elektronische Datenspeicher bestehen aus Halbleiterbauteilen, deren Schaltkreise fast ausschließlich auf Silizium basieren. Man unterteilt sie in flüchtige (z. B. RAM), permanente (z. B. SSDs) und semi-permanente Speicher (z. B. Speicherkarten, USB-Sticks).

Magnetische Datenspeicher

Für diese Art der Speicherung wird magnetisierbares Material wie Bänder oder Platten verwendet. Man unterscheidet zwischen rotierenden und nicht rotierenden Speichermedien. Bei rotierenden Platten werden mithilfe eines Lese-Schreib-Kopfes die Daten gelesen oder überschrieben. Nicht-rotierende Speicher wie Magnetbänder oder Karten werden an einem festen Kopf vorbeigezogen.

Optische Datenspeicher

Zum Lesen und Beschreiben der Daten wird bei optischen Datenträgern ein Laserstrahl eingesetzt. Hierbei werden zum Speichern die Reflexionseigenschaften des Mediums genutzt. Beispiele für optische Datenspeicher sind CDs oder DVDs.

Cloud-basierte Speicher

Cloud

Beim Cloud Computing werden Daten extern über das Internet gespeichert und verwaltet. Die Dateien können so von jedem Ort aus aufgerufen werden. Zudem sind Cloud Speicher hoch skalierbar.

Edge

Edge Computing ist eine Form der dezentralen Datenverarbeitung, die in der Nähe der Datenquelle oder des Nutzers stattfindet. Dadurch können Daten schneller und sicherer verarbeitet werden.

Fog

Fog Computing ist ein Cloud-Konzept, bei dem Daten dezentral in lokalen Minirechenzentren verwaltet werden können. Fog-Nodes sind Vermittlungsknoten, die entscheiden, ob Daten an zentrale oder dezentrale Endpunkte weitergeleitet werden müssen. Dies reduziert den Kommunikationsweg und spart Rechenleistung.

Was sind personenbezogene Daten?

Personenbezogene Daten sind Informationen, die einer identifizierbaren Person zugeordnet werden können. Darunter fallen zum Beispiel Namen, Anschrift, Geburtsdatum, Telefonnummer, E-Mail-Adresse, Sozialversicherungsnummer oder IP-Adresse.

Ebenfalls können personenbezogene Daten auch Kategorien von Daten kennzeichnen, wie z. B. medizinische Daten, politische oder religiöse Überzeugungen. Gesetzlich definiert ist der Begriff seit dem Inkrafttreten der Europäischen Datenschutz-Grundverordnung (DSGVO) am 25. Mai 2018.
Unternehmen müssen sich bei der Verarbeitung persönlicher Daten an die rechtlichen Regelungen halten. Dies beinhaltet technische und organisatorische Maßnahmen zur Minimierung, Schutz und Transparenz in Bezug auf die Sammlung, Verarbeitung und Weitergabe von personenbezogenen Daten.