Research Data Management

Im Zeitalter von Big Data ist das Problem immer mehr, die Verwaltung der großen Datenmengen. Satellitenteleskope messen auf allen Wellenlängen im All, Bibliotheken digitalisieren die riesigen Mengen von Literatur aus allen Zeitschichten und die Archäologie bringt immer neue Objekte dazu. Das Problem, das man vor ~3500 Jahren durch die Erfindung von Bibliotheken löste, deren Anspruch das Wissen der Welt zu sammeln in der historischen Bibliothek von Alexandria kulminierte, wird heutzutage auf ein ganz neues Level gehoben. 

  • Wir schreiben nicht mehr nur Bücher/ Fachartikel, sondern wir publizieren auch die Daten dazu (noch vor ~100 Jahren blieben diese in den handschriftlichen Laborbüchern unpubliziert und bestenfalls von Wissenschaftshistorikern angeschaut), auf dass alle, die wollen, die Forschungsergebnisse/ -thesen überprüfen können. 
  • Während man für Text-Bild-Gemische eben Bücher und Fachartikel hat, für Fachartikel vor ca. 200 Jahren sammelnde Fachzeitschriften erfand (um den akademischen Austausch nicht auf bilateralen Briefwechsel zu beschränken), Jahrgänge von Zeitschriften zu buchartigen Gebinden zusammenfasst und all diese gebundenen Schriften in Bibliotheken sammelt, gab es für die Datengrundlagen lange keinen einheitlichen Sammelort. 
  • Die Informatik erfand im 20. Jahrhundert Datenbanken, also Netzwerke von Tabellen, deren Verknüpfung das Durchsuchen erleichert und Hypertext, mit dem man Text sehr leicht auf andere Texte verknüpfen kann. 
  • Doch mit dem Wachsen der Vielfalt von Datenformaten, ist auch das Verknüpfen und Verschränken von Daten in verschiedenen Datenbanken als neues Problem definiert. 
  • Die Informatik erfand das Semantic Web, Wissensgraphen und Ontologien, um Netzwerke von Wissen und Netzwerke von Netzwerken mathematisch zu beschreiben. Die Abfragesprachen für all diese Datenlagerungsstrukturen (wie SQL, SPARQL u.a.) gehören heute zum akademischen Handwerkszeug wie der Bleistift. … und Nationale ForschungsDatenInfrastrukturen (NFDI) schießen wie Pilze aus dem Boden, denn man braucht sie für alle Fächer. 

Interdisziplinärer Forschung wie der Astronomie (die ja schon seit 2.5 Jahrtausenden Natur- und Geisteswissenschaften verbindet) eröffnet dies ungeahnte Möglichkeiten. Was hätte wohl ein Universalgelehrter wie Aristoteles, Eratosthenes, oder Ptolemaios noch alles gefunden, wenn er schon die heutigen Möglichkeiten gehabt hätte?

Weniger philosophisch-kontemplativ, sondern direkt in die Probleme der Gegenwart thematisierend war unser deutsch-ägyptischer Datenmanagement-Workshop in Madinat as-Sadis min Uktubar, der “Stadt des 6. Oktober”, nahe Kairo. Zwei Tage lang wurden Vorlesungen gehalten zu den Themen von Datenspeicherung, Datenmanagement, Datenmanagement-Planung und vielem mehr. Das ist natürlich keine Entwicklungshilfe: An ägyptischen Universitäten gibt es bereits Konzepte dafür, in Deutschland gibt es landesweite Richtlinien und die EU hat wiederum eigene Richtlinien. Bei DAAD-Projekten geht es Austausch zwischen Akademikern. Die Aufgabe war also, zusammenzutragen, was es an einzelnen Datenmanagement-Konzepten, -Anforderungen etc. gibt und wie man damit umgeht. Ein Datenmanagement-Berater, Roman Gerlach, der Friedrich-Schiller-Universität Jena stand hier Rede und Antwort für allgemeine Fragen, obwohl das gemeinsame deutsch-ägyptische Forschungsprojekt eigentlich auf eine sehr konkrete Anwendung (Bio- und Geo-Daten) gemünzt war. 

Die hierbei strukturierten naturwissenschaftlichen Daten sind allerdings derart wichtig für zahlreiche Forschungsfragen, dass man sie auch fachfremd erreichen können sollte. Sie sollten also idealerweise auch ohne fachlichen Hintergrund lesbar sein, so dass sich die naturwissenschaftliche Forschung (in allen MINT Fächern) hierüber verstärkt Gedanken macht. In den Geschichtswissenschaften übrigens auch, denn nirgends ist der natürliche Datenverlust durch den Zahn der Zeit so offensichtlich wie hier. Umso großartiger, an einem so historischen Ort (Ägypten) über Datenmanagement zu reden! 

Dass Medien, auf denen Wissen gespeichert ist, nicht für immer leben, weiß man nirgends so gut wie mit der Geschichte des Brands in der damals weltgrößten Bibliothek im Hinterkopf. Hier zuerst an der Nile University bei Kairo…
… und dann eine Kurzfassung nochmal in der erst letztes Jahr eröffneten Universität von New Mansoura an der Küste (etwas nordöstlich des neu gegründeten Alexandria).

Diese Universitäten in Ägypten sind super modern ausgestattet: der Testpatient, den wir hier bestaunen, ist ein sprechender Kunststoff-Roboter, der so tut als würde er atmen und krank sein. Hieran können Studierende üben, bevor sie auf echte Menschen als Patienten losgelassen werden. 

Am Nationalen Forschungsinstitut für Geowissenschaften und Astronomie (in Helwan bei Kairo) fiel unser Besuch mit einer kleinen (eintägigen) Tagung zum Thema “Klima ist zwischen Erde und Himmel” zusammen, so dass ich dort einen Vortrag zum Thema Citizen Science-Sternbeobachtungen in Abhängigkeit von Wetter, Licht- und Luftverschmutzung halten durfte. Das ist jetzt erstmal nicht direkt Forschungsdaten-Management, sondern Forschungsdaten-Genese, aber die so generierten Daten wollen ja irgendwann ausgewertet werden, so dass man sich auch über die Lagerung Gedanken machen muss. 

NRIAG – Wir besuchten eine Konferenz über das Klima, organisiert von Prof. Dr. Abd El-Fady B. Morcos.
Auch diese kleine Konferenz durfte ich als ausländische Gästin miteröffnen: Es war mir eine Ehre.

Danke, Thank you and شكرا an Dr. Alsayed Algergawy und Prof Dr. Passent ElKafrawy für die Organisation dieses großartigen Austauschprogramms!

Avatar-Foto

Veröffentlicht von

"physics was my first love and it will be my last physics of the future and physics of the past" Dr. Dr. Susanne M Hoffmann ist seit 1998 als (Kultur)Astronomin tätig (Universitäten, Planetarien, öffentliche Sternwarten, u.a.). Ihr fachlicher Hintergrund besteht in Physik und Wissenschaftsgeschichte (zwei Diplome), Informatik und Fachdidaktik (neue Medien/ Medienwissenschaft) als Weiterqualifikationen. Sie ist aufgewachsen im wiedervereinigten Berlin, zuhause auf dem Planeten Erde. Jobbedingt hat sie 2001-2006 in Potsdam gelebt, 2005-2008 saisonal in Mauretanien (winters) und Portugal (sommers), 2008-2009 und 2013-'15 in Berlin, 2010 in Hamburg, 2010-2012 in Hildesheim, 2015/6 in Wald/Österreich, 2017 in Semarang (Indonesien), seit 2017 in Jena, mit Gastaufenthalten im Rahmen von Forschungskollaborationen in Kairo+Luxor (Ägypten), Jerusalem+Tel Aviv (Israel), Hefei (China)... . Die einleitenden Verse beschreiben eine Grundstruktur in ihrem Denken und Agieren: Physik ist eine Grundlagenwissenschaft, die datenbasiert und mit dem Erkenntnisapparat der Logik ein Verständnis der Natur zu erlangen bestrebt ist. Es gibt allerdings auch Fragen der Welt, die sich der Physik entziehen (z.B. wie wir Menschen auf diesem Planeten friedlich, synergetisch und benevolent zusammenleben können) - darum ist Physik nicht die einzige Liebe der Bloggerin. Sie liebt die Weisheit und hinterfragt die Welt. Das Wort "Philosophie" ist ihr aber zu groß und das populärwissenschaftliche Verständnis davon zu schwammig, als dass sie sich damit identifizieren würde: hier geht's faktenbasiert zu. Ihr fachliches Spezialgebiet sind Himmelskarten und Himmelsgloben; konkret deren Mathematik, Kartographie, Messverfahren = Astrometrie, ihre historische Entwicklung, Sternbilder als Kulturkalender und Koordinatensystem, Anomalien der Sternkarte - also fehlende und zusätzliche Sterne, Sternnamen... und die Schaustellung von alle dem in Projektionsplanetarien. Sie versteht dieses Blog als "Kommentar an die Welt", als Kolumne, als Informationsdienst, da sie der Gesellschaft, die ihr das viele studieren und forschen ermöglichte, etwas zurückgeben möchte (in der Hoffnung, dass ihr die Gesellschaft auch weiterhin die Forschung finanziert).

3 Kommentare

  1. Datentresoren, die Katastrophen überstehen
    Vielleicht braucht ja die Welt für wissenschaftliche Daten etwas Analoges zum Svalbard Global Seed Vault, dem weltweiten Saatgut-Tresor. Die Fragen wären nur noch wo man den weltweiten Wissenschaftsdaten-Tresor einrichten soll, in welcher Form man die Daten speichern soll und wie man auf die Daten zugreift.

    Um alle Daten aus wissenschaftlichen Studien Jahrhunderte, ja Jahrtausende überstehen zu lassen, also Zeiträume in denen Katastrophen auch ganze Länder zerstören können, sollte man vielleicht mehr als einen Speicherort in Betracht ziehen und die Daten in identischer Form an mehreren Orten gleichzeitig speichern. Um die Sicherheit der Daten gegenüber Schreibzugriffen zu gewährleisten, sollten Daten immer nur hinzugefügt, nicht aber gelöscht werden können. Ferner sollten die Daten ohne Stromversorgung ihre Integrität über Jahrtausende bewahren. Da käme etwa die Speicherung in Form von DNA oder in Form von Eingravierungen in Siliziumkarbid in Frage, denn beide können viele Jahrhunderte überstehen und bei beiden lassen sich sehr hohe Datendichten erreichen, bei Siliziumkarbid beispielsweise mehr als ein Terabit pro Square Inch, wie man dem Artikel Nanoscale Optical Patterning of Amorphous Silicon Carbide for High-Density Data Archiving entnehmen kann.

  2. Ganz genau, der Erfindung der Sprache folgte die der Schrift, die des dann Buches und der Bibliothek :

    Das Problem, das man vor ~3500 Jahren durch die Erfindung von Bibliotheken löste, deren Anspruch das Wissen der Welt zu sammeln in der historischen Bibliothek von Alexandria kulminierte, wird heutzutage auf ein ganz neues Level gehoben. [Artikeltext]

    Diese Bibliothek ging dann hopp :

    -> https://en.wikipedia.org/wiki/Library_of_Alexandria


    Räumlichkeiten der Schrift, die Schrift ist bekanntlich der dritte Zivilisationssprung , zuvor gab es die Erfindung [1] der Sprache und die der Schrift, sind sozusagen entzündlich, wenn andere, politische Gegner auch, so wollen.

    Heutzutage gibt es zum Glück passende Digitalisierungen und passende Vorratsdatenhaltung, lokal und oft verknüpft, die resielienter ist.

    Mit freundlichen Grüßen
    Dr. Webbaer

    [1]
    Es geht so : Erfindung der Sprache, Erfindung der Schrift, gerne auch der Lautschrift (die ist flexibler), des Buches, die des Buchdrucks, die des Webs, die
    u.a. die globale Datenhaltung und somit auch Bücher meint.
    Ei sog. semantisches Web wirbt in seiner Entwicklung angestrebt, wird abär, diesseitiger Einschätzung, leider nicht möglich sein.

    PS:
    Antizivilisatorische Bewegung gibt es, sie wird alsbald auch europäisch breit aufscheinen.

  3. Among other things, global data management and thus also books.
    A so-called semantic web is aimed at in its development, but unfortunately it will not be possible, according to our assessment.

Schreibe einen Kommentar