Datenqualität

Ein objektives Mass zur Bestimmung der Datenqualität ist uns nicht bekannt. Allerdings ist die Anzahl und Vollständigkeit von Metadaten zu einem beliebigen Datenbestand ein guter Qualitätsindikator.

Was sind Metadaten?

Die Antwort ist gleichzeitig simpel und schwierig. Je nachdem, wie intensiv man sich bereits mit Daten, deren Erfassung und Pflege beschäftigt hat. Für den Informatiker erst einmal die einfache Erklärung:

= >  Metadaten sind Daten über andere Daten.

Für Menschen, die nicht den ganzen Tag mit Datenbanken, Programmiersprachen und Algorithmen zu tun haben, folgen hier noch einige Detailinformationen:

Erstaunlicherweise sind Metadaten keine Erfindung des Computerzeitalters, sie werden bereits seit Jahrhunderten in Bibliotheken zur Erfassung des Bestandes an Schriftgut genutzt, u.a. auch in der grossen Bibliothek von Alexandria.

Die in den antiken Quellen beschriebenen Dimensionen der Bibliothek machten Ordnungssysteme notwendig, die es ermöglichten, ein gewünschtes Werk aus der Masse herauszusuchen oder die verfügbare Literatur zu einem bestimmten Thema ausfindig zu machen. Diesem Zweck diente die Katalogisierung der Bestände, die sich bis ins 3. Jahrhundert v. Chr. zurückverfolgen lässt. (Wikipedia)

Der Zweck war natürlich zu verhindern, entweder den ganzen Bestand an Dokumenten (incl. Standorte) auswendig zu kennen - oder wochenlang das gewünschte Exemplar in der Bibliothek zu suchen.

Suchmaschinen wie Google - eigentlich alle Datenbanken - haben das gleiche Problem, nur werden für deren Funtionalität keine Kärtchen und Zettelchen geschrieben, sondern Metadaten in elektronischen "Katalogen" erfasst und gespeichert.

Für jede Suchanfrage z. B. speichert Google natürlich den Suchbegriff - und als Metadaten: Zeitpunkt und Ort der Anfrage, Ident-Nr. des Computers und vieles mehr. Den meisten Anwendern ist nicht bewusst, dass bei Benutzung von Suchmaschinen und sozialen Netzwerken IHRE Metadaten gespeichert werden und dass diese Metadaten den primären Nutzen für Computerkriminelle oder Behörden darstellen.