SciLogs » RELATIV EINFACH » Wissenschaft und Gesellschaft » Abzock-Zeitschriften, Datenauswertung Teil 4: Themengebiete, Erstautoren

Abzock-Zeitschriften, Datenauswertung Teil 4: Themengebiete, Erstautoren

BLOG: RELATIV EINFACH

… aber nicht einfacher

Vor knapp zwei Wochen hat eine mehrmonatige Recherche von NDR, WDR und SZ-Magazin in Zusammenarbeit mit ausländischen Partnern das Thema wissenschaftliche Abzock-Zeitschriften und Abzock-Konferenzen in Deutschland auf die Tagesordnung gebracht. Links zu den verschiedenen Berichten finden sich in diesem NDR-Dossier. Außerdem hat der NDR einen FAQ mit einer Reihe von Antworten zu seinem Vorgehen online gestellt. Zur Erinnerung: Abzock-Fachzeitschriften, auch “predatory journals” genannt, sind selbsternannte wissenschaftliche Fachzeitschriften, die zwar vorgeben, den üblichen Qualitätsstandards des “Peer review” zu folgen, aber die in Wirklichkeit gegen Gebühr jeden Mist veröffentlichen. Parallel dazu geht es um Abzock-Konferenzen: vorgeblich wissenschaftliche Konferenzen ohne nennenswerte Qualitätsstandards, deren Geschäftsmodell entsprechend darin besteht, die Teilnahmegebühren einzustreichen.

Ich hatte beschlossen, dem einmal selbst nachzugehen und habe in Abzock-Zeitschriften, Datenauswertung Teil 1: Methoden, Ländervergleich, Gesamtzahl beschrieben, wie ich 17500 Artikel eines der in der Berichterstattung erwähnten Zeitschriften-Portale (SCIRP) heruntergeladen und zusammenfassend ausgewertet hatte. In Teil 2: Die Vielveröffentlicher hatte ich mir die (wenigen) Autor/innen näher angeschaut, die mit vier oder mehr Artikeln in meiner Stichprobe vertreten waren, und in Teil 3: Die Institutionen geschaut, welche Art von Institution (Universität? Firma? Privatgelehrte?) in den Artikeln wie häufig als “Heimatbasis”, als Affiliation, angegeben wird. Eine Zusammenfassung habe ich dafür für den gestrigen Tagesspiegel geschrieben, die ist online hier zu finden.

In diesem Teil geht es um die Frage, wie sich die Artikel der deutschen Untermenge meiner Stichprobe auf die unterschiedlichen Fachgebiete verteilen.

Wie klassifizieren?

Wie die unterschiedlichen Fachgebiete definieren? Nach Fakultäten, oder nach Schul- bzw. Studienfächern? Ich habe mich letztlich dafür entschieden, im wesentlichen dieselben Kategorien zu nehmen wie auf der Webseite Springer Link des Verlags SpringerNature – nicht weil auch Spektrum und damit die SciLogs zu SpringerNature gehören, sondern aus dem pragmatischen Grund, dass dort jeweils auch steht, wieviele Fachartikel auf dem Springer-Link-Webportal zu jedem der Gebiete gehören, und diese Zahlen brauche ich später zu Vergleichszwecken. Die Kategorie-Unterteilung finde ich allerdings nicht ganz optimal. Die erste Kategorie, nämlich Biomedizin, habe ich in meiner Auswertung mit der Medizin zusammengelegt, die Pharmazie in dieselbe Kategorie gepackt. Insgesamt habe ich damit die Kategorien:

0 : Business and Management
1 : Economics
2 : Chemistry
3 : Computer Science
4 : Earth Sciences
5 : Education
6 : Engineering
7 : Environment
8 : Geography
9 : History
10 : Law
11 : Life Sciences
12 : Literature
13 : Materials Science
14 : Mathematics
15 : Medicine, Biomedicine, Public Health, Pharmacy
16 : Philosophy
17 : Physics
18 : Political Science
19 : Psychology
20 : Social Sciences

Dann bin ich die 443 Artikel mit deutscher Beteiligung durchgegangen und habe jedem davon nach besten Wissen und Gewissen eine der Kategorien zugeordnet. Die Zuordnung hat eindeutig dort eine subjektive Komponente, wo es mehrere Möglichkeiten gab – ist beispielsweise ein bestimmter Artikel eher Chemie, oder eher Verfahrenstechnik? Ich mache meine Ergebnisse wie bei den letzten Malen transparent; die Möglichkeit, meine Skripte und eben auch die Datei mit den expliziten Fachthema-Zuordnungen jedes der 443 Artikel herunter zu laden, gibt es am Ende dieses Blogbeitrags per Dropbox-Link.

Verteilung auf die Themengebiete

Die resultierende Verteilung der Artikel auf die Themengebiete ist hier zu sehen:

Einige der Eigenschaften des Diagramms sollten uns nicht wundern. Literaturwissenschaften gehören nun einmal nicht zu “Science” im englischsprachigen Sinne, und kamen dementsprechend gar nicht vor. Juristen dürften vornehmlich auf deutsch veröffentlichen, und sind damit in englischsprachigen Journals vermutlich insgesamt sehr selten vertreten. Die angewandten Wissenschaften sind mit 263 Artikeln (60%) klar in der Überzahl – und dabei ist noch nicht einmal mitgezählt, dass auch bei den Lebenswissenschaften und der Physik, die ich hier pauschal den nicht-angewandten Wissenschaftsgebieten zugeschlagen hatte, zahlreiche Artikel zu angewandten Fragestellungen dabei sind.

Sind Abzock-Zeitschriften damit vor allem ein Problem der Medizin, die mit 122 Artikeln ganz vorne liegt? Aussagen dieser Art kann man anhand des gezeigten Diagramms nicht treffen. Es könnte schließlich ebenso gut sein, dass zu medizinischen Themen generell mehr Artikel geschrieben werden, und sich dieses Mengenverhältnis dann auch bei den Artikeln in Predatory Journals spiegelt. Aber deswegen hatte ich ja die Springer-Link-Kategorien gewählt: um Vergleichszahlen für herkömmliche Fachartikel zu haben, aufgeschlüsselt nach denselben thematischen Kategorien. Auch da wird die Zuordnung nicht perfekt sein – insbesondere dürfte bei Springer Link jedem Artikel je nach Inhalt auch mehr als eine der Kategorien zugeordnet werden können; das habe ich, wie gesagt, anders gehandhabt. Aber für eine ungefähre Abschätzung, in welchen Fachgebieten überhäufig viele Predatory-Journal-Artikel erscheinen, sollte es reichen. In der Informatik und offenbar auch bei den Ingenieuren sind Konferenzbeiträge eine deutlich häufigere Veröffentlichungsform als normale Artikel in Fachzeitschriften; als Referenzzahl zähle ich daher die auf Springer-Link gelisteten Fachartikel und Konferenzbeiträge zusammen.

Häufigkeiten predatory vs. normal

In dem folgenden Diagramm zeige ich die “Referenzzahl” für verschiedene Fächer – so nenne ich das Verhältnis der Anzahl von Artikeln in meiner Stichprobe, geteilt durch die Anzahl von Artikeln in der entsprechenden Springer-Link-Kategorie und malgenommen mit dem willkürlichen Faktor von einer Million, der lediglich dazu dient, dass ich nicht bei unhandlich kleinen Zahlen lande. Wichtig ist dementsprechend der Vergleich der Referenzzahlen-Werte, nicht der jeweilige Einzelwert.

Dabei habe ich all diejenigen Fächer weggelassen, die weniger als 10 Artikel in der Stichprobe haben. Bei so kleinen Zahlen ist das Verhältnis zur Referenzzahl nicht sehr aussagekräftig – es hängt zu sehr von kleinen Schwankungen hab. Das Gebiet “History” habe ich auch herausgenommen. Das hat zwar die größte Referenzzahl von allen; allerdings gehen sämtliche 13 Artikel in diesem Gebiet auf denselben Privatgelehrten zurück – und sind damit alles andere als repräsentativ für die deutsche Geschichtswissenschaft.

Hier sind die verbleibenden Kennzahlen:

Diesem Kriterium nach sind die Wirtschaftswissenschaften, die Umweltwissenschaften und die Materialwissenschaften besonders häufig in meiner Stichprobe vertreten. Die Medizin ist ins Mittelfeld zurückgefallen und ragt nicht mehr besonders hervor – es werden in der Tat insgesamt sehr viele medizinische Fachartikel veröffentlicht.

Physik und Privatgelehrte

Als Physiker hat mich die relativ hohe Kennzahl meines eigenen Fachgebiets durchaus gewurmt. Sieht es bei uns in punkto predatory journals schlimmer aus als bei den Chemikern, den Medizinern, den Lebenswissenschaftlern?

Entsprechend habe ich mir die betreffenden 47 Artikel einzeln angeschaut. Alleine 20 davon sind von Privatgelehrten geschrieben – entweder ganz ohne Affiliation mit einem wissenschaftlichen Institut oder mit früherer Affiliation, aber längst pensioniert. Ich hatte in meinen vorigen Beiträgen immer wieder betont, dass ein Artikel nur deswegen, weil er in einem Predatory Journal erscheint, nicht vom Inhalt her falsch oder schlecht sein muss. Das halte ich auch nach wie vor für richtig. Unter den betreffenden 20 Artikeln scheint mir aber trotzdem ein ungewöhnlich großer Anteil zu sein, von dem ich nicht den Eindruck habe, dass er Stand und Niveau der professionellen Wissenschaftlichen Forschung repräsentieren würde. Zugespitzt gesagt: ein Artikel in einem Raubjournal beispielsweise, in dem ein Internist seine Version der physikalischen Weltformel vorstellt, ist nicht repräsentativ für die Theoretische Physik an den universitären oder außeruniversitären Forschungsinstituten.

Zumindest dieses Fach ist damit ein quantitatives Beispiel für meine bei der Untersuchung der “Vielveröffentlicher” und der Institutionen meiner Stichprobe geäußerte Vermutung, dass die Randgebiete der Wissenschaft – hier Privatgelehrte/Ehemalige, in der Medizin waren es Ärzte in Nicht-Forschungs-Krankenhäusern und Praxen – im Bereich Raubjournale eine überproportional große Rolle spielen – und Rückschlüsse auf “die Wissenschaft” allein deswegen schon problematisch sind.

Artikelhäufung an Universität X

Aber damit hier nicht der Eindruck entsteht, reguläre Forschungsinstitute seien damit bereits aus dem Schneider, hier noch ein weiteres aufschlussreiches Beispiel. Aus dem Bereich Lebenswissenschaften finden sich in meiner Stichprobe 31 Artikel. Bei deren Klassifikation war mir bereits aufgefallen, dass das Thema Hühnerfütterung dort auffällig häufig auftauchte. Bei näherem Hinsehen zeigte sich, dass ganze 13 der Life-Science-Artikel in meiner Stichprobe (entsprechend 42%), erschienen in ein und derselben Fachzeitschrift, aus dem Umfeld ein und desselben Lehrstuhls an einer deutschen Universität stammten.

Zum Teil hatten dort die Doktoranden oder wissenschaftlichen Mitarbeiter mit dem Lehrstuhlinhaber publiziert, zum Teil alleine. Mehrere Mitarbeiter wechselten im Laufe der Zeit offenbar zu einer Firma und publizierte mit der neuen Affiliation im gewohnten Journal – und ihre Kollegen von derselben Firma dann offenbar auch.

Das zeigt paradoxerweise einerseits, warum Predatory Journals in der Wissenschaft allgemein keine wichtige Rolle spielen. Man schaut sich als junger Wissenschaftler oder junge Wissenschaftlerin ja in der Regel nicht ohne jegliche Beratung im Internet mögliche Fachzeitschriften an und überlegt sich dann ganz selbstständig, wo man wohl publizieren sollte. Sondern man schaut sich an, wo die älteren Kollegen publizieren, der eigene Betreuer oder die Betreuerin, und die Wissenschaftler, in deren Fachartikel man sich für seine eigene Forschung einarbeitet.

Das Beispiel der 13 Life-Science-Artikel aus ein und demselben Umfeld zeigt aber eben auch die Schattenseite desselben Prinzips: ist ein Predatory Journal in einem Institut oder einer Arbeitsgruppe erst einmal etabliert, dann steigt aufgrund derselben Mechanismen die Wahrscheinlichkeit, dass weitere Gruppenmitglieder in demselben Journal publizieren. Dass die jetzige Berichterstattung das Bewusstsein für Predatory Journals und deren Probleme weckt, ist vor diesem Hintergrund sehr zu begrüßen. In einigen Gruppen scheint das Veröffentlichen in Predatory Journals auf diese Weise “eingerissen” zu sein.

Erstautor oder nicht?

An dieser Stelle noch eine Nachlieferung. Matthias Steinmetz, Direktor am Leibniz-Institut für Astrophysik Potsdam, hatte nach dem ersten Teil meiner Untersuchung gefragt:

wie sieht die Statistik aus, wenn Du es auf Erstautoren beziehst? Das wäre zum eine schnell machinell auswertbar, zum andern dahingehend interessant, da idR der Erstautor den Publikationsort bestimmt

— Matthias Steinmetz (@GalacticRAVE) 22. Juli 2018

Das habe ich jetzt in der Tat ausgewertet und komme unter meinen 443 Artikeln auf 353 Artikel (80%) bei denen der Erstautor eine deutsche Affiliation hat und 90 Artikel (20%) bei denen er oder sie keine deutsche Affiliation hat. Da der Erstautor in der Regel bestimmt, in welchem Journal er oder sie veröffentlichen will, ist das ein weiterer Faktor, den es zu berücksichtigen gilt: In einem Fünftel der Stichproben-Fälle waren der oder die Autoren mit deutscher Affiliation vermutlich nicht diejenigen, die sich bewusst für eine Veröffentlichung in dem betreffenden Raubjournal entschieden haben. Sie haben sich allerdings, das ist richtig, offenbar auch nicht oder zumindest nicht wirkungsvoll über die Fachzeitschriften-Wahl ihres Erstautors beschwert. Auch da sollte ein gesteigertes Bewusstsein dafür, was Raubzeitschriften sind und warum sie problematisch sind, helfen.

Skripte und Datenseiten

Auch für diesen Teil meiner Datenauswertung stelle ich wieder die entsprechenden Skripte und Kontroll-Dateien zur Verfügung: getSCIRPinfo-v4.pl wertet die Artikel meiner Stichprobe aus, zählt die deutschen Erstautoren und schreibt die Artikel mit deutscher Beteiligung in eine Datei deutsche-artikel.html (zur direkten Kontrolle) und deutsche-artikel.txt (zur Weiterverarbeitung). Das Python-Skript subject-selection.py hilft mir beim Sammeln meiner Klassifikationen – es zeigt mir jeweils den Artikeltitel und die möglichen Kategorien, und ich habe dann jeweils die Kennzahl eingegeben, deren Fachgebiet mir am besten zum Artikel zu passen schien. Die Ergebnisse stehen in der Numpy-Datei (keine Textdatei, aber von Python aus lesbar) subject-classes.npy. Das Python-Skript subj-diagramme.py erstellt zum einen die Balkendiagramme, die in diesem Blog zu sehen sind, zum anderen eine Datei artikel-fachgebiete.html, in der die Klassifikation für jeden einzelnen Artikel gezeigt ist und die ich zum Überprüfen genutzt habe. Die genannten Dateien gibt es wieder zum herunterladen:

Materialien für Teil 4: ZIP-Datei (117 kB) via Dropbox.

Man könnte noch viele schöne Sachen machen. An allen Ecken und Enden meiner Auswertung habe ich konkrete Beispiele dafür gefunden, auf welche Weise man diese Auswertung noch aussagekräftiger und belastbarer gestalten könnte – angefangen vom Datensatz über die Erfassung von Institutionen und Autoren bis hin zu Klassifikation und Vergleichs-Datensätzen. Aber das wäre dann ein ganzes Forschungsprojekt mit deutlich größerem Zeitaufwand – ich hoffe sehr, dass sich jemand dessen annimmt!

Meine Datenauswertung ist damit erst einmal abgeschlossen. Ich werde aber noch einen Teil 5 nachliefern, in dem ich ein Fazit ziehe.

Veröffentlicht von Markus Pössel

https://scilogs.spektrum.de/relativ-einfach/

Markus Pössel hatte bereits während des Physikstudiums an der Universität Hamburg gemerkt: Die Herausforderung, physikalische Themen so aufzuarbeiten und darzustellen, dass sie auch für Nichtphysiker verständlich werden, war für ihn mindestens ebenso interessant wie die eigentliche Forschungsarbeit. Nach seiner Promotion am Max-Planck-Institut für Gravitationsphysik (Albert-Einstein-Institut) in Potsdam blieb er dem Institut als "Outreach scientist" erhalten, war während des Einsteinjahres 2005 an verschiedenen Ausstellungsprojekten beteiligt und schuf das Webportal Einstein Online. Ende 2007 wechselte er für ein Jahr zum World Science Festival in New York. Seit Anfang 2009 ist er wissenschaftlicher Mitarbeiter am Max-Planck-Institut für Astronomie in Heidelberg, wo er das Haus der Astronomie leitet, ein Zentrum für astronomische Öffentlichkeits- und Bildungsarbeit, seit 2010 zudem Leiter der Öffentlichkeitsarbeit am Max-Planck-Institut für Astronomie und seit 2019 Direktor des am Haus der Astronomie ansässigen Office of Astronomy for Education der Internationalen Astronomischen Union. Jenseits seines "Day jobs" ist Pössel als Wissenschaftsautor sowie wissenschaftsjournalistisch unterwegs: hier auf den SciLogs, als Autor/Koautor mehrerer Bücher und vereinzelter Zeitungsartikel (zuletzt FAZ, Tagesspiegel) sowie mit Beiträgen für die Zeitschrift Sterne und Weltraum.