Abzock-Zeitschriften, Datenauswertung Teil 3: Die Institutionen

In den letzten Tagen hat eine mehrmonatige Recherche von NDR, WDR und SZ-Magazin in Zusammenarbeit mit ausländischen Partnern das Thema wissenschaftliche Abzock-Zeitschriften und Abzock-Konferenzen in Deutschland auf die Tagesordnung gebracht. Links zu den verschiedenen Berichten finden sich in diesem NDR-Dossier. Inzwischen hat der NDR auch einen FAQ mit einer Reihe von Antworten zu seinem Vorgehen online gestellt. Zur Erinnerung: Abzock-Fachzeitschriften, auch “predatory journals” genannt, sind selbsternannte wissenschaftliche Fachzeitschriften, die zwar vorgeben, den üblichen Qualitätsstandards des “Peer review” zu folgen, aber die in Wirklichkeit gegen Gebühr jeden Mist veröffentlichen. Parallel dazu geht es um Abzock-Konferenzen: vorgeblich wissenschaftliche Konferenzen ohne nennenswerte Qualitätsstandards, deren Geschäftsmodell entsprechend darin besteht, die Teilnahmegebühren einzustreichen.

Ich hatte beschlossen, dem einmal selbst nachzugehen und habe in Abzock-Zeitschriften, Datenauswertung Teil 1: Methoden, Ländervergleich, Gesamtzahl beschrieben, wie ich 17500 Artikel eines der in der Berichterstattung erwähnten Zeitschriften-Portale (SCIRP) heruntergeladen und zusammenfassend ausgewertet hatte. In Teil 2: Die Vielveröffentlicher hatte ich mir die (wenigen) Autor/innen näher angeschaut, die mit vier oder mehr Artikeln in meiner Stichprobe vertreten waren.

In diesem Teil geht es um die Frage, welche Institutionen in meiner Stichprobe mit welcher Häufigkeit vertreten sind. Woher kommen die Autoren, die in predatory journals veröffentlichen?

Jenseits der Automatik

Mit diesem Teil der Auswertung bin ich bereits in Teilen an meine Grenzen gestoßen. Zum einen vom Zeitaufwand her, denn die hier interessante Zuordnung – Uni? Hochschule? Außeruniversität? – lässt sich nicht komplett automatisieren. Ich musste dazu die Liste der Institutionen durchgucken und entscheiden, in Zweifelsfällen durch Aufsuchen der Homepage der entsprechenden Institution und unter Zuhilfenahme von Zusatzinformationen wie der Wikipedia-Liste der Hochschulen in Deutschland, worum es sich handelt. Einige Arten von Recherche konnte ich nur in Ausnahmefällen durchführen. Wieviele derjenigen, die eine Hochschule als Affiliation angeben, sind in Wirklichkeit gar nicht mehr dort tätig, sondern längst emeritiert/pensioniert? Bei einigen Personen, die entsprechende Angaben zumindest bei einem Teil ihrer Artikel machen (“Formerly at…”) konnte ich das feststellen. Aber dafür, systematisch Mitarbeiterverzeichnisse und Affiliationen abzugleichen, fehlten mir Zeit und Ressourcen.

Die folgenden Angaben sind daher mit Vorbehalt zu genießen. Ich habe nach bestem Wissen und Gewissen, aber nicht so vollständig ausgewertet, wie ich es für einen echten wissenschaftlichen Artikel erwarten würde. Zum Ausgleich lege ich aber wieder meine Methoden offen. Wer sich dieselben Daten besorgt, wie in Teil 1 beschrieben, kann meine Skripte darüberlaufen lassen (oder diese Skripte einfach nur anschauen) und so nachvollziehen, wie ich zu meinen Ergebnissen gekommen bin. Hier ist das entsprechende Materialpaket zum Herunterladen; es ergänzt die Skripte zum Artikel-Herunterladen von Teil 1 und nutzt dieselbe Verzeichnisstruktur:

Materialien für Teil 3: ZIP-Datei (78 kB) via Dropbox

Konkret sind dort enthalten das Perl-Skript getSCIRPinfo-v3.pl, das alle Daten zu deutschen Institutionen in eine Datei affiliationen.csv schreibt; die von Hand korrigierte (falsch kodierte Umlaute!) Version dieser Datei, affiliationen-korrigiert.csv; das Perl-Skript sortInstitutions-v2.pl mit dem ich (unter Angabe vieler spezifischer Bedingungen) die Institutionen in Kategorien wie Universität, Firma, Hospital/Arztpraxis etc. einordne, und die von letzterem Skript erzeugte HTML-Seite institutionen-sortiert.html, die ich vor allem zum Überprüfen meiner Einordnung genutzt habe. Die ebenfalls von letzterem Skript erzeugte Datei institutionen-kennzahlen.csv und die Python-Datei aff-diagramme.py, mit der ich aus jener Datei die Balkendiagramme in diesem Artikel erzeugt habe, bilden den Abschluss.

Die verschiedenen Institutionen

Meine Gesamtstichprobe umfasste 17500 Artikel von scirp.org, unter denen sich 443 Artikel befinden, von denen mindestens ein Autor eine deutsche Affiliation (Institution, Adresse…) besitzt. Wie groß ist bei diesen Artikeln der Anteil der unterschiedlichen Arten von Institutionen, in denen Wissenschaft betrieben wird? Dieses Balkendiagramm hier listet auf, bei wievielen der Artikeln verschiedene Arten von Institutionen beteiligt waren. Da ein Artikel mehrere Autoren von unterschiedlichen Arten von Institutionen haben kann, ist die Summe der sich ergebenden Zahlen größer als die Gesamtzahl der Artikel, und die Prozentzahlen summieren sich zu mehr als 100%:

Die allermeisten der untersuchten Artikeln stammen damit aus Universitäten oder Hochschulen. Nicht berücksichtigt ist dabei, dass es sich in einer Reihe von Fällen nicht um die Haupt-Affiliation handeln dürfte; einige Beispiele dafür hatte ich in Teil 2: Die Vielveröffentlicher gefunden. In einigen Fällen habe ich das berücksichtigt und dann als Affiliation z.B. Firma angegeben; andere Fälle sind mir garantiert entgangen, weil ich nicht alle Fälle einzeln nachrecherchiert habe. Ehemalige, Emeriti, Autoren mit einer Privatadresse oder mit einem Institutsnamen, für den sich außer in Predatory-Journal-Artikeln keinerlei Webpräsenz finden lässt, habe ich in der Kategorie “Privatgelehrte” zusammengefasst.

Mir fehlt an dieser Stelle der Vergleich mit herkömmlichen Fachzeitschriften, um richtig beurteilen zu können, welche der institutions-Arten überrepräsentiert sind. Wichtig ist aus meiner Sicht: die Randbereiche, an die man vermutlich nicht zuerst denkt, wenn man sich die deutsche Wissenschaftslandschaft vor Augen führt, sind recht stark repräsentiert. Privatgelehrte sowie Ärzte in Kliniken und Praxen sind für ein Fünftel der hier untersuchten Artikel (mit) verantwortlich. Bezieht man solche Artikelzahlen auf die Gesamtheit “der deutschen Wissenschaftler” sollte man entsprechend nicht nur die Universitätsangehörigen und Angehörigen der außeruniversitären Forschungsinstitute heranziehen, sondern muss eine größere Grundgesamtheit definieren, die auch Privatgelehrte sowie Ärzte in Kliniken und Praxen berücksichtigt.

Nichtsdestotrotz bleibt ein deutlicher Anteil von Autoren aus Universitäten und außeruniversitären Forschungsinstituten übrig. Da verstärkt Aufklärungsarbeit über Predatory Journals zu leisten ist sicherlich eine angemessene Reaktion.

Universitäten, aufgeschlüsselt

Ich habe die Universitäten und Hochschulen noch weiter aufgeschlüsselt, wie das folgende Diagramm zeigt: Die Prozentzahlen beziehen sich dabei nach wie vor auf die Gesamtzahl von 443 Artikeln mit mindestens einem Autor mit deutscher Affiliation. Der Großteil der Artikel stammt dabei aus Universitäten (definiert als Hochschulen mit Promotionsrecht, also dem Recht, Doktortitel zu verleihen). Ein beträchtlicher Anteil, nämlich 17% der Gesamtartikelzahl, stammt alleine schon aus den medizinischen Fakultäten jener Universitäten, der Rest (immerhin 50% der Gesamtartikelzahl) aus anderen Fakultäten. Hochschulen ohne Promotionsrecht sind immerhin für 10% der Gesamtartikelzahl (mit) verantwortlich.

Interessant wäre auch hier der Vergleich mit herkömmlichen Fachzeitschriften. Sind die Prozentzahlen dort anders? Wenn jemand weiß, wie man an entsprechend aufgeschlüsselte Daten gelangt, wäre ich für einen entsprechenden Hinweis in den Kommentaren dankbar.

Außeruniversitäre Forschungseinrichtungen

Zum Abschluss habe ich noch den Anteil der verschiedenen Arten von außeruniversitären Forschungseinrichtungen aufgeschlüsselt:

Dabei sind Institute der großen deutschen außeruniversitären Forschungsinstitutionen jeweils mit rund 10 betroffenen Artikeln in etwa gleich auf.

Bei der Max-Planck-Gesellschaft, also meinem eigenen Arbeitgeber, war ich besonders neugierig und habe mir alle 8 Arbeiten angeschaut. Nur zwei der Arbeiten waren komplett an Max-Planck-Instituten entstanden, und eine davon hat auch einen Institutsdirektor als Letztautor. Eine weitere Arbeit geht auf das Konto eines “adjunct researchers”, der vorher Postdoc am betreffenden Max-Planck-Institut, zum Veröffentlichungszeitraum aber bereits Universitätsdozent war. Die weiteren fünf Arbeiten haben Autoren, die inzwischen (das heißt bis zu anderthalb Jahre nach der Veröffentlichung) den Institutswebseiten nach nicht mehr an dem betreffenden Institut arbeiten – Doktorand/innen, Postdoktorand/innen. Wobei sogar legitim ist/wäre, wenn das Institut nach Ende des dortigen Angestelltenverhältnisses als Affiliatino angegeben wird, solange die Arbeit, über die berichtet wird, zumindest zum Teil während der Zeit am Institut ausgeführt wurde. Diese kleine Stichprobe zeigt bereits, dass das simple Zuordnen zu den in der Veröffentlichung genannten Instituten so einfach nicht ist.

Der nächste Schritt?

Insgesamt war dieser Teil der Auswertung weniger ergiebig, als ich erhofft hatte. Mir fehlt als wichtiger Vergleichsmaßstab wie hoch die relativen Anteile an wissenschaftlichen Veröffentlichungen der verschiedenen Typen von Institutionen allgemein, bei herkömmlichen Zeitschriften sind. Erst dann lässt sich sauber argumentieren, welche Arten von Institution in meiner Stichprobe über- oder unterrepräsentiert sind.

Wie oben bereits gesagt: Mein Eindruck der Prozentverhältnisse ist, dass die Randgebiete des Wissenschaftsbetriebs überrepräsentiert sind. Aber die Mehrzahl der Artikel stammt offenbar aus dem regulären Universitätsbetrieb. Dort und bei den außeruniversitären Forschungsinstituten ein Bewusstsein für das Problem der Predatory Journals zu schaffen wäre auf alle Fälle angemessen.

Mehr verspreche ich mir von meinem letzten geplanten Auswertungsschritt: Der Aufgliederung in Fachgebiete. Dazu dann in ein paar Tagen mehr.

Meine Blogbeiträge zum Thema bislang:

Markus Pössel hatte bereits während des Physikstudiums an der Universität Hamburg gemerkt: Die Herausforderung, physikalische Themen so aufzuarbeiten und darzustellen, dass sie auch für Nichtphysiker verständlich werden, war für ihn mindestens ebenso interessant wie die eigentliche Forschungsarbeit. Nach seiner Promotion am Max-Planck-Institut für Gravitationsphysik (Albert-Einstein-Institut) in Potsdam blieb er dem Institut als "Outreach scientist" erhalten, war während des Einsteinjahres 2005 an verschiedenen Ausstellungsprojekten beteiligt und schuf das Webportal Einstein Online. Ende 2007 wechselte er für ein Jahr zum World Science Festival in New York. Seit Anfang 2009 ist er wissenschaftlicher Mitarbeiter am Max-Planck-Institut für Astronomie in Heidelberg, wo er das Haus der Astronomie leitet, ein Zentrum für astronomische Öffentlichkeits- und Bildungsarbeit. Pössel bloggt, ist Autor/Koautor mehrerer Bücher, und schreibt regelmäßig für die Zeitschrift Sterne und Weltraum.

5 Kommentare Schreibe einen Kommentar

  1. Hier nochmal Carla und Jan: Zitieren eigentlich Wissenschaftler im Mainstream die Arbeiten aus Pseudojournals? Kann man das vielleicht automatisiert über google scholar search herausfinden?

  2. Interessante Analyse. Könnte durchaus auch eine Veröffentlichung werden. Macht eine ganz andere Eindruck als die Berichterstattung. In mein Blogpost zu dem Problem habe ich so einiges zu Publish-or-Perish geschrieben, nichts falsches, aber vielleicht war das nicht relevant wenn es sich eher um Randfiguren geht.
    http://variable-variability.blogspot.com/2018/07/german-investigative-reporter-peer-review-scandal.html

    Was mir noch interessieren würde wäre wie die Ergebnisse aussehen für Erst-Autoren und für Ko-Autoren. Vor allem in der große Gruppe der Einmal-Autoren könnte ich mich vorstellen, dass diejenige Wissenschaftler von Universitäten und Forschungseinrichtungen Ko-autoren sind die nicht gut aufgepasst haben. Ich wäre überrascht wenn diese Leute oft Erst-Autoren wären. Der Erst-Autor wird doch meist wissen was für Zeitschrift es ist.

Schreibe einen Kommentar