Hinweise für Einreichende • Hinweise für Gutachter • Große Datentransfers
Das Forschungsdatenrepositorium OPARA¶
Was ist OPARA?¶
OPARA ist das Forschungsdatenrepositorium der sächsischen Hochschulen. Es können digitale Forschungsdaten archiviert oder veröffentlicht werden. Der Dienst ist über die Webseite https://opara.zih.tu-dresden.de erreichbar.
Die Archivierung digitaler Forschungsdaten erfolgt gemäß der guten wissenschaftlichen Praxis für zunächst zehn Jahre. Bei der Veröffentlichung digitaler Forschungsdaten erhalten diese zusätzlich einen DOI zur dauerhaften Referenzierung, werden unbefristet gespeichert und sind für jedermann auffindbar und zugreifbar.
Daten werden im Rahmen eines Einreichungsprozesses auf der OPARA-Webseite übertragen. Dieser umfasst die Angabe beschreibender Metadaten, den Upload der Daten und - im Falle der Veröffentlichung - die Auswahl einer Open-Access-Lizenz. (Siehe: DFG: Was ist Open Access?)
Vor der finalen Archivierung oder Veröffentlichung findet ein Begutachtungsprozess statt, in dem die Einreichung - insbesondere bei einer Publikation - auf ihre formale Eignung (Art der Daten, Umfang und Signifikanz der angegebenen Metadaten, Beschreibung und Dokumentation, Wahl der Lizenz) und inhaltliche Eignung (Vollständigkeit, Richtigkeit, Nachvollziehbarkeit der Dokumentation) geprüft wird.
Das Akronym OPARA bedeutet "Open Access Repository and Archive".
Wer darf OPARA nutzen?¶
1) Alle Personen, die an den angebundenen(*) öffentlichen sächsischen Hochschulen forschen. Dies umfasst z.B. Wissenschaftler, die im Rahmen von Drittmittelprojekten forschen, aber auch Studierende und Promovierende im Rahmen ihrer akademischen Qualifikationsarbeit.
2) Alle Wissenschaftler, die an Forschungsprojekten mit Beteiligung der angebundenen(*) öffentlichen sächsischen Hochschulen arbeiten. Diese erhalten Zugriff auf OPARA über einen Gastlogin der jeweiligen Hochschule.
*) Folgenden öffentlichen sächsischen Hochschulen steht OPARA zur Verfügung:
- Hochschule für Technik und Wirtschaft Dresden
- Technische Universität Bergakademie Freiberg
- Technische Universität Dresden
- Universität Leipzig
Auch den übrigen öffentlichen sächsischen Hochschulen steht die Nutzung von OPARA offen. Bitte kontaktieren Sie uns, wenn Sie einer dieser Hochschulen angehören und OPARA nutzen möchten.
Für welche Daten darf OPARA genutzt werden?¶
OPARA darf zur Archivierung oder Veröffentlichung aller digitalen Forschungsdaten genutzt werden. Dies betrifft alle digitalen Daten, die im Rahmen der wissenschaftlichen Arbeit entstehen. Sie bilden üblicherweise die Grundlage jeder wissenschaftlichen Publikation, z.B. Journal-Paper, Tagungsbeiträge, Dissertationen oder studentischer Abschlussarbeiten. Digitale Forschungsdaten sind in der Praxis sehr heterogen. Daher existieren keine Einschränkungen hinsichtlich Datentyp oder Dateiformat oder Datenmenge.
Keine Forschungsdaten sind
-
Dokumente, die den Charakter einer üblichen wissenschaftlichen Veröffentlichung haben, wie z.B. auf der QUCOSA-Webseite dokumentiert. Für solche Daten sollte entweder QUCOSA oder ein ähnlicher Dokumenten- oder Publikationsdienst genutzt werden.
-
Verwaltungsdokumente, z.B. aus Projekt- oder der Institutsverwaltung.
Quellcode für Software ist ein Spezialfall und sollte auf dafür spezialisierten Code-Repositorien veröffentlicht werden, wie z.B. dem GitLab der TU Chemnitz oder kommerziellen Anbietern wie GitLab oder GitHub. Sofern darüber hinaus ein DOI benötigt wird, kann aber auch Quellcode in OPARA veröffentlicht werden.
Welche Kosten entstehen bei der Nutzung von OPARA?¶
Keine.
Was ist bei der Vorbereitung und Einreichung von Daten zu beachten?¶
Die Ziele von Archivierung und Veröffentlichung von Forschungsdaten sind zum einen die Sicherung der Reproduzierbarkeit von Forschungsergebnissen im Sinne der guten wissenschaftlichen Praxis, und zum anderen, Dritten die Daten zugänglich zu machen um eine Nachnutzung zu ermöglichen, z.B. im Rahmen weiterer Forschung oder anderer Kontexte. Ausgerichtet an diesen Zielen sollte die Auswahl und Aufbereitung der Daten erfolgen.
Welche Daten sollten archiviert oder veröffentlicht werden?¶
Datenveröffentlichungen erfolgen zumeist im Kontext einer üblichen wissenschaftlichen Publikation z.B. in einem wissenschaftlichen Journal. Darin wird eine bestimmte Forschungsfrage diskutiert und das Forschungsergebnis basierend auf der Auswertung der zugrundeliegenden Daten vorgestellt. Diese Daten sollten Gegenstand der Datenveröffentlichung sein. Weil in OPARA veröffentlichte Daten zeitlich unbefristet und unveränderlich gespeichert werden, können veröffentlichte Daten auch als archiviert betrachtet werden.
Bei der reinen Archivierung ist der Kontext häufig das gesamte Forschungsprojekt, z.B. ein Drittmittelprojekt oder eine akademische Qualifikationsarbeit. Forschungsdaten, die einen ausgereiften und unveränderlichen Entwicklungsstand aufweisen, kommen für die Archivierung infrage. Diese findet oft zu bestimmten Zeitpunkten statt, z.B. zum Projektende. Aber auch zu früheren Zeitpunkten ist es empfehlenswert, zumindest eine Teilmenge der Forschungsdaten des Projekts zu archivieren. So können z.B. direkt nach Beendigung der Datenaufnahme in einer frühen Projektphase die Rohdaten oder nach Beendigung bestimmter Auswertezyklen fertige Analysedaten archiviert werden. Ein frühzeitiges Archivieren kann auch eventuellen späteren Datenverlusten vorbeugen oder bei der Klärung späterer urheberrechtlicher Fragen helfen.
In jedem Fall sollte geprüft werden, welche der vorliegenden Daten von tatsächlicher Relevanz sind. Das Vorhandensein der ursprünglich aufgenommenen Rohdaten ist regelmäßig notwendig zur Reproduktion von Forschungsergebnissen und oft sind diese auch einzigartig und unwiederbringlich. Diese Daten sollten Teil der Veröffentlichung oder Archivierung sein. Zwischenresultate lassen sich häufig durch Wiederholung der Datenverarbeitung oder -analyse wiederherstellen und sind somit nicht archiv- oder veröffentlichungswürdig, da die Verarbeitungsschritte nachvollziehbar dokumentiert sein sollten und somit reproduzierbar sind. Liegen weiterhin z.B. finale Ergebnisdaten vor, sind diese häufig von der Datenmenge so gering aber vom Informationsgehalt hoch, so dass diese ebenfalls berücksichtigt werden sollten. Darüber hinaus können im Rahmen des Forschungsprozesses auch weitere Datenprodukte relevant sein. Im Einzelfall sollte auch abgeschätzt werden, wie hoch der Aufwand der Bereinigung und eventuellen Wiederherstellung von Daten im Verhältnis zu den Kosten der dauerhaften Speicherung ist.
Ist eine Verschlüsselung von Daten zur Archivierung sinnvoll?¶
Grundsätzlich ist die Archivierung verschlüsselter Daten nicht zu empfehlen, weil zusätzlich zur Problematik der dauerhaften Verfügbarkeit der eigentlichen Daten auch noch die sichere Verfügbarkeit des Schlüssels dauerhaft gewährleistet sein muss. Ohne diesen können die archivierten Daten nicht wiederhergestellt werden.
Gemäß der guten wissenschaftlichen Praxis sollen Daten mindestens zehn Jahre verfügbar sein, was durch den Dienst OPARA gewährleistet wird. Der Verlust eines digitalen Schlüssels ist in diesem Zeitraum nicht auszuschließen und wird durch den perspektivisch mehrmaligen (geplanten und ungeplanten) Wechsel der digitalen Arbeitsmittel (PC, Laptop, etc.) als auch durch die seltene Nutzung und dem damit einhergehend nachlassenden Bewusstsein über Zweck und Existenz des Schlüssels begünstigt.
Unbenommen davon werden Ihre Daten bei besonderem Schutzbedarf auch in verschlüsselter Form archiviert, wir weisen aber nachdrücklich auf das genannte Risiko hin und empfehlen dringend, ein geeignetes Konzept zur dauerhaften Verfügbarkeit des Schlüssels zu etablieren.
Dürfen personenbezogene Daten archiviert werden?¶
Gemäß § 12 (2) des Sächsischen Datenschutzdurchführungsgesetzes sind personenbezogene Merkmale aus Forschungsdaten zu löschen, sobald der Forschungszweck dies zulässt.
Es kann angenommen werden, dass mit Projektende der jeweilige Forschungszweck entfällt. Da die Daten durch die Archivierung aber regelmäßig weit über das Projektende hinaus erhalten bleiben, müssen diese von personenbezogenen Merkmalen bereinigt sein.
Gegebenenfalls muss daher im Einzelfall entschieden werden, ob und mit welchem Aufwand die personenbezogenen Merkmale aus den Daten entfernt werden können, und ob anhand der verbleibenden Daten überhaupt noch die Nachvollziehbarkeit des Forschungsprozesses gewährleisten werden kann und diese somit erhaltenswert sind. Bei der Klärung dieser Frage können die zuständigen Datenschutzbeauftragten der Hochschulen unterstützen.
Von der gesetzlichen Regelung abweichend ist es möglich, die Informierte Einwilligung der betreffenden Personen zur Archivierung oder Veröffentlichung ihrer personenbezogenen Daten vor der Datenerhebung einzuholen. Dieses Vorgehen sollte aber ebenfalls mit den Datenschutzbeauftragten im Voraus abgestimmt werden.
Wer hat Zugriff auf archivierte Daten?¶
Jede Einreichung wird vom Einreichenden einer Organisationseinheit (OU) zugeordnet, z.B. einer Professur innerhalb der Hochschule. Standardmäßig können alle Angehörigen dieser OU auf den archivierten Datensatz zugreifen. Damit wird verhindert, dass nach dem Ausscheiden der einreichenden Person aus der Einrichtung der Datensatz von niemandem mehr gefunden werden kann und ein sogenanntes 'Dark Archive' entsteht. Eine individuelle manuelle Rechtevergabe hat sich in der Vergangenheit als nicht praktikabel erwiesen und birgt ebenfalls die Gefahr, dass auch die zusätzlich autorisierten Personen aus der Einrichtung ausscheiden.
Veröffentlichte Datensätze sind für alle – auch nicht eingeloggte – Nutzer von OPARA vollständig zugreifbar.
Gibt es für die Veröffentlichung von Forschungsdaten Alternativen zu OPARA?¶
Ziel einer Datenveröffentlichung ist die Bereitstellung des Datensatzes für eine potenzielle Nachnutzung durch Dritte. Durch die Nutzung eines disziplinspezifischen Repositoriums kann dieses Ziel für bestimmte Fachdisziplinen oder bestimmte Datenarten besser erreicht werden. Die Vorteile solcher Repositorien sind der höhere Bekanntheitsgrad in der jeweiligen Fachcommunity, die Möglichkeit bestimmte Datenarten nach den Community-Standards detaillierter und spezifischer zu beschreiben, und die Einordnung eines Datensatzes mit weiteren ähnlichen. Infrage kommende Repositorien können nach Disziplin, Datenart oder anderen Stichworten auf der Webseite www.re3data.org gefunden werden.