Software zum Auffinden von Textmogeleien

Auf der Internetseite der renommiertesten medizinischen Fachzeitschrift The Lancet bin ich vor kurzem auf einen Artikel namens "Checking for plagiarism, duplicate publication, and text recycling" aufmerksam geworden. Man kann sich denken wieso. Die Autorin Sabine Kleinert, die zugleich Vorsitzende des Committee on Publication Ethics (COTE) und Editor von The Lancet ist, macht dort auf ein Tool aufmerksam, welches von Universitäten zum Auffinden von Plagiaten verwendet wird. Hauptsächlich sollen damit abgeschriebene und duplizierte Textpassagen in studentischen Essays gefunden werden.  Wissenschaftliche Zeitschriften folgen dem und beginnen nun langsam auch, dieses Tool zu verwenden. Im Fokus steht hier die Software namens CrossCheck. Die Beschreibung der Software ließt sich so:
 
CrossCheck powered by iThenticate is an initiative started by CrossRef to help its members actively engage in efforts to prevent scholarly and professional plagiarism. Although there are several plagiarism screening tools already available, they are not well-suited to filtering academic content simply because they haven’t had access to the relevant full-text literature to screen against. CrossCheck changes this by creating and continuously growing a database of current and archival scholarly literature. This database is one of two parts that make up the CrossCheck service. The second part is the iThenticate tool, which compares authored work against the content in the database and highlight matching or similar text for further editorial review. (Quelle: CrossCheck)

 

Mit ihr kann man zum Beispiel wissenschaftliche Publikationen durch eine Datenbank laufen lassen, die bereits wissenschaftliche Literatur besitzt. Die Software vergleicht diese Texte nun miteinander und schlägt Alarm, wenn sich Ähnlichkeiten finden. The Lancet beginnt nun damit, diese Software auch zu benutzen. Ich finde andere Journals sollten dem folgen. Sinn der Sache soll sein, den Publikationsethos zu schützen, indem man Fälschungen, Ideen-und Satzklau und Ähnliches  aufdeckt und zugleich vorbeugt. Frau Kleinert sagt, dass zukünftig im The Lancet zur Publikation eingereichte wissenschaftliche Arbeiten bevor sie peer-reviewed werden, erst einmal durch diese Software gejagt werden. Findet man einen Täuschungsversuch, so wird man je nach Grad des Betrugs gewisse Gegenmaßnahmen in Gang setzen, wie etwa Autorenbefragung oder Inkenntnissetzung der Institutionsleitung, wo die mutmaßlichen Betrüger arbeiten. Um mit dem ganzen Problem richtig umzugehen, wird dabei nach einem Diagramm vorgegangen, dass von der COTE stammt und welches man hier einsehen kann. Es soll dabei helfen, mit einer als Plagiat vermuteten Arbeit richtig umzugehen.
 

 


 Quellen:

Sebastian Reusch

Veröffentlicht von

Sebastian Reusch ist studierter Biologe und spezialisierte sich auf molekularbiologische Fächer wie Genetik und Zellbiologie. Seine Abschlussarbeit machte er am Max-Delbrück-Centrum für molekulare Medizin, wo er an Prozessen in weißen Blutkörperchen forschte.

10 Kommentare Schreibe einen Kommentar

  1. Darf man sich selbst plagiieren?

    Ich vermute, das Tool schlägt auch Alarm, wenn man nur einen Absatz oder eine Formulierung aus seinen eigenen Veröffentlichungen wiederholt? 😉

    Das wäre dann nämlich schon witzig. Ich kann mir gut vorstellen, dass, wenn man routinemäßig über mehrere Jahre hinweg zu einem Thema publiziert, auch Formulierungen von einem Autor mehrfach verwendet werden, etwa in der Einleitung oder im Methodenteil.

    Warum sollte man das Rad auch immer wieder neu erfinden und neu umformulieren? Unter Umständen hat man die „perfekte Formulierung“ schon einmal gefunden, warum diese nicht wieder verwenden? Und ist es zulässig, wenn Mitarbeiter aus dem selben Labor die selben Formulierungen benutzen?

  2. Darf man sich selbst plagiieren? @M.Bal.

    Nein! Oder besser: Das sollte man tunlichst vermeiden, denn es ist gewissermaßen eine intellektuelle Bankrott-Erklärung. Als Leser erwarte ich, dass ein Autor in der Lage ist, einen Sachverhalt immer wieder neu bzw. anders darzustellen.

  3. Also einen Methodenteil neu zu verfassen, ist ja quatsch. Einen Abstract neu zu verfassen, naja, ist glaube ich nicht immer nötig. Zich Paper über das gleiche Thema und immer wieder ein anderer Abstract ist schon etwas übertrieben. Natürlich sollte man ihn aber wenigstens ein bischen modifizieren, wenn möglich. Wenn man sieht, sind Einleitungen zum selben Thema, wenn man unterschiedliche Autoren ließt, auch sehr ähnlich. Man muss daher einen geeigneten Mittelweg finden. Die Autorin vom Artikel äußert sich nämlich folgendermaßen:

    Readers deserve original content, and merely recycling parts of previously published work constitutes, at best, academic laziness.

    Ich muss ihr da zustimmen. Wenn man kann, sollte man schon immer ein paar Formulierungen abändern, denn wirklich immer das Gleiche zu schreiben, ist wirklich eine Bankrott-Erklärung. Formulierungen von Mitarbeitern zu benutzen, sehe ich etwas kritisch, denn man sollte in der Lage sein, seine Texte selbst zu verfassen. Egal ob man dadurch Zeit sparen möchte, wenn ich ein Paper lese, dann soll der Autor es auch selbst geschrieben haben.

  4. Methodenteil

    Im Methodenteil würde ich auch keine Neuformulierungen erwarten. Hier ist das „Selbstplagiat“ angebracht, wenn man denkt, dass man die optimale Beschreibung einer bestimmten Methode bereits gefunden hat.

    Eine Unsitte hingegen ist es, auf eine detaillierte Beschreibung der Methode zu verzichten und den Leser stattdessen auf ein früheres Paper zu verweisen.

  5. @Balanus: In der Wissenschaft ist es PFLICHT die Methoden in einem Paper detailliert anzugeben bzw. überhaupt anzugeben. Schließlich muss man die Ergebnisse ja auch nachvollziehen können und anderen Wissenschaftlern die Gelegenheit geben, die Ergebnisse zu reproduzieren.

  6. linguistiche software?

    Ich würde drei Sachen interessant finden:
    1. das durchchecken von historischen Texten,
    2. nachzuschauen, wie es um die Entwicklung von Erwartungshaltungen gegenüber Studenten aussieht, denn wenn man sich z.B. vergegenwärtigt, dass etwa das anschaut, gewinnt man den Eindruck, dass hier gestiegene „Ansprüche“ in Wirklichkeit Symptome intellektuellen und kulturellen Verfalls sind. (So wie in der Kunst „Kitsch“ eine degenerativer, aber technisch perfektionierter, „Nachhall“ „richtiger“ Kunst ist),
    3. Da direkte Kopien wohl nur den Bodensatz des Themas ausmachen, halte ich es für sinnvoll, Software nach strukturellen Merkmalen suchwen zu lassen, die sich nicht so einfach wegretuschieren lassen. Abgesehen vom Plagiats-/Ghostwritingthema wäre das ohnehin interessant, da Sprachestrukturen gute Indikatoren für geistige Verwandschaften sind (z.B. hab ich ein altes Fremdwörterbuch, deren Autorenteam man die Prägung durch Phänomenologie anmerkt)

  7. Selbstplagiat

    @Balanus: „Als Leser erwarte ich, dass ein Autor in der Lage ist, einen Sachverhalt immer wieder neu bzw. anders darzustellen.“

    Ist das nicht ein bißchen streng? Das klingt ja, als dürfe sich der Autor nicht einmal selbst zitieren. (Und warum sollte er andere zitieren dürfen, sich selbst aber nicht? Und wer ist eigentlich dieser Anonymus, der diese Verbote erläßt?)

    Ich denke, Elmar Diederichs hat sich hierzu sehr richtig geäußert. Der wichtigste Grund für das Kenntlichmachen von Zitaten ist es, dem Leser zu ermöglichen, die zitierte Passage im größeren Originalkontext nachlesen zu können. Warum soll das nicht für eigene Arbeiten auch gelten?

    So würde ich auch Martins Frage beantworten. Wenn der Leser in dieser Weise vom kenntlichen Zitat profitieren könnte, sollte man sich selbst nicht plagiieren.

    Und wenn man nichts wirklich neues zu sagen hat, natürlich auch nicht. Aber das ist wohl angesichts der Gewinne von Ansehen und Geld, die durch Veröffentlichungen zu erwarten sind, ein unerfüllbarer Wunsch.

    Übrigens haben selbst Künstler vor dem bürgerlichen Zeitalter keine Probleme gehabt, sich selbst zu plagiieren. Das heißt in diesem Fall parodieren, und ermöglichte Bach z.B., eine erotische Anmach-Arie im Weihnachtsoratorium als frommes Wiegenlied zu recyceln.

    http://leiffrenzel.de/papers/bach.html

  8. Selbstplagiat und Methoden

    .
    @Jürgen Bolt

    » Ist das nicht ein bißchen streng? Das klingt ja, als dürfe sich der Autor nicht einmal selbst zitieren. (Und warum sollte er andere zitieren dürfen, sich selbst aber nicht? Und wer ist eigentlich dieser Anonymus, der diese Verbote erläßt?) «

    Nun, angenommen, ich hebe mir zu einem bestimmten Thema zwei Publikationen von derselben Arbeitsgruppe kommen lassen (so etwas soll vorkommen). Nun lese ich das erste Paper, anschließend das zweite, und stelle beim zweiten fest, dass die Einleitung zu mehr 80% der gleiche Text ist wie im ersten. So etwas macht einfach einen ganz schlechten Eindruck.

    Natürlich darf ein Autor sich selbst zitieren, wenn es sachlich gerechtfertigt ist. Aber alten Wein in neuen Schläuchen zu verkaufen, ist nicht die feine Art.

    Das mit dem Anonymus und den Verboten verstehe ich nicht. Mir geht es primär um das Lesevergnügen, welches ich bei wörtlichen Wiederholungen längerer Textpassagen doch etwas eingeschränkt sehe.

    Im Übrigen dürfte es in aller Regel so sein, dass Autoren den Ehrgeiz haben, Neuformulierungen zu finden. Das ist zumindest meine Erfahrung nach dem Lesen von Dutzenden von Arbeiten zum gleichen Untersuchungsgegenstand.

    » Übrigens haben selbst Künstler vor dem bürgerlichen Zeitalter keine Probleme gehabt, sich selbst zu plagiieren. Das heißt in diesem Fall parodieren, und ermöglichte Bach z.B., eine erotische Anmach-Arie im Weihnachtsoratorium als frommes Wiegenlied zu recyceln. «

    Bach hat für das Wiegenlied ja nicht die Arie Note für Note übernommen, sondern das Thema variiert oder halt parodiert, wie ich dem verlinkten Text entnehmen kann: Die musikwissenschaftliche Forschung hat inzwischen für etliche von Bachs Kompositionen diese Wiederverwertungstechnik nachgewiesen,…

    @Sebastian Reusch: Methodenteil

    Ich habe es schon oft erlebt, dass man sich die genaue Beschreibung der Methoden geschenkt und stattdessen auf ein früheres Paper verwiesen hat (das dann meist nicht zur Hand war). Etwas anderes ist es, wenn irgendwelche Standardmethoden zur Anwendung kamen. Die braucht man dann nicht bis ins kleinste Detail zu referieren.

  9. @Balanus: Epikur+Altruismus

    „Mir geht es primär um das Lesevergnügen, welches ich bei wörtlichen Wiederholungen längerer Textpassagen doch etwas eingeschränkt sehe.“ LeseVERGNÜGEN, okay diese Sprache verstehe ich. Und ich wünsche Ihnen, daß Sie davon möglichst viel haben.

    Hoffentlich hat Ihnen das von mir verlinkte Paper auch Vergnügen bereitet. Mir gefällt es jedenfalls mehr, mich mit den Selbstplagiaten von Bach zu beschäftigen als mit den Fremdplagiaten des Hochstaplers, die diese ganze Diskussion veranlaßt haben.

    Ihr Lesevergnügen liegt mir um so mehr am Herzen, als Sie so altruistisch sind, die Erkenntnisse aus Ihrer Lektüre und die Links hier immer wieder vorzustellen und zu diskutieren.

    Das ist nach Susan Pinker nicht einmal so untypisch für Wissenschaftler.
    In ‚The Sexual Paradox‘ steht irgendwo eine Korrelation von Berufen und Testosteronspiegel. Ich habe das Buch gerade verliehen und kann nichts nachschlagen, aber sie beruft sich unter anderem auf Dabbs, z.B.

    http://journals.cambridge.org/…ine&aid=30397

    http://onlinelibrary.wiley.com/…01655.x/abstract

    Bei Männern korreliert der Grad der Bildung etwa negativ mit dem Testosteronspiegel (bei Frauen ist es eher umgekehrt). Wissenschaftler haben die niedrigsten und Sportler, Künstler und Arbeitslose die höchsten Spiegel. Wissenschaftler sind demnach relativ wenig durch Dominanzstreben motiviert.

    Eher durch Vergnügen.

  10. Off topic

    .

    @Jürgen Bolt

    » Hoffentlich hat Ihnen das von mir verlinkte Paper auch Vergnügen bereitet. «

    Nun ja, der verlinkte Aufsatz über Bachs Parodieverfahren ist schon recht trocken geschrieben. Und ich gehöre gewiss nicht zur Zielgruppe des Textes.

    Inwieweit meine Aktivitäten hier als SciLogs-Kommentator als „altruistisch“ anzusehen sind, sei mal dahingestellt. Das dürfte der eine oder andere hiesige Blogger ganz anders sehen. Die entsprechenden Links schenke ich mir jetzt… 🙂

    Was meinen Testosteron-Spiegel als Wissenschaftler angeht, so bitte ich zu bedenken, dass ich ganz gewiss kein typischer Wissenschaftler bin.

    » Wissenschaftler haben die niedrigsten und Sportler, Künstler und Arbeitslose die höchsten Spiegel«

    Und wie sieht es bei einem arbeitslosen Wissenschaftler aus, was dominiert bei dem?

    (Ich bin immer wieder verblüfft, was in der Sozialpsychologie so alles untersucht wird 😉

Schreibe einen Kommentar




Bitte ausrechnen und die Zahl (Ziffern) eingeben