Navigation auf uzh.ch
Gute Datendokumentation ist für die Reproduzierbarkeit der Forschung und die Wiederverwendbarkeit der Daten unerlässlich. Sie liefert Informationen über den Kontext, die Struktur, die Herkunft und den Inhalt eines Datensatzes (oder einer Datei) mit dem Ziel, seinen Nutzen zu erhöhen. Datendokumentation ist somit auch ein wichtiger Bestandteil von FAIRen Daten.
Datendokumentation wird manchmal auch als Metadaten bezeichnet — Daten über Daten. Metadaten beschreiben grundsätzliche Informationen über die Daten:
Metadaten können also entweder in einem Datenarchiv/-repository eingepflegt sein und Sie müssen beim Daten teilen die entsprechenden Zellen ausfüllen. Oder aber Sie erstellen eine zusätzliche Datendokumentation (README Datei), welche zusätzliche Informationen für die Wiederverwendung Ihrer Daten enthält. In der Regel empfiehlt sich beides: Die Angaben im Datenrepository sind maschinen-lesbar und können so für Metaanalysen verwendet werden, während die README Datei die Weiterverwendung der Daten durch Menschen erleichtert.
Beginnen Sie mit Ihrer Datendokumentation bereits dann, wenn Sie Ihre Daten sammeln. Dies erleichtert es Ihnen später, den vollständigen Prozess der Datengenerierung nachzuvollziehen und eine gut strukturierte Datendokumentation zu erstellen.
Die Dokumentation das erste Mal strukturieren: Es ist nicht nötig, dass Sie ihre Datendokumentation gleich zu Beginn an vollständig strukturiert haben. Gewisse Strukturen können Ihnen jedoch von Anfang helfen, alle nötigen Metadaten für die Wiederverwendbarkeit Ihrer Daten zu sammeln.
Die Stanford Libraries bieten dazu eine gute Einführung.
Metadaten-Standards verwenden: Gut-strukturierte Metadaten oder Datendokumentation unterstützen die langfristige Auffindbarkeit, die Verständlichkeit und Bewahrung Ihrer Forschungsdaten. Disziplinen-spezifische Repositories verlangen in der Regel stark strukturierte Metadaten, damit eine hochgranulare Suche im Repository möglich ist.
Metadaten-Standards werden auch als "Schema" bezeichnet. Schemas können entweder generischer Natur sein oder auch disziplinen-spezifisch.
Bekannte Metadaten-Standards sind zum Beispiel DublinCore - ein Set von 15 Begriffen (wie Hersteller*in, Titel, etc.). Die Data Documentation Initiative (DDI) bietet ein XML-basiertes Schema für den Inhalt, den Transport, die Darstellung und die Archivierung von Metadaten in den Sozialwissenschaften. Um disziplinen-spezifische Metadatenschemas zu finden, eignet sich:
Vorlagen für die Erstellen von Datendokumentation finden Sie hier:
Die README Datei von Cornell University ist ein Word-Dokument, welches die wichtigsten Fragen für eine umfassende Datendokumentation stellt. Generieren Sie anschliessend aus Ihrem Word-Dokument ein PDF, und teilen Sie dieses zusammen mit Ihren Daten.
Das CESSDA Metadata Schema erlaubt es Ihnen, Informationen zu Ihrem Daten auf Projektebene zu erfassen. Beantworten Sie dazu die Fragen unter "Project-level documentation".
Der DataCite Metadata Generator erstellt Ihnen eine XML-basierte Datendokumentation anhand der Fragen, die Sie im Generator beantworten.