Fehlende Excel-Kenntnisse sorgen Genforscher

Es ist eine Geschichte, die mich eigentlich fassungslos zurück lässt. Laut einer aktuellen Untersuchung sind rund 20 % der Veröffentlichungen im Bereich der Gentechnik fehlerbehaftet, weil die Studienautoren nicht mit Microsoft Excel umgehen können. Man kann es auch anders betrachten: Hier wird an einem Beispiel die Spitze eines Eisbergs sichtbar, der seit Jahren unter der Wasseroberfläche vieler Datenveröffentlichungen schlummert.


Anzeige

Dass wir täglich die verkürzten Ergebnisse irgend einer Studie um die Ohren geblasen kriegen, ist allseits bekannt. Auch ich zitiere hier in Blog-Beiträgen ja immer mal Erkenntnisse aus Studien. Und dass Kinder Jahrzehnte mit Spinat traktiert wurden, weil dieser viel Eisen enthält – was aber auf einen Tippfehler bei der Übernahme einer Tabelle (sowie hier und hier) in die betreffende Studie zurückzuführen war – ist auch vielen Leuten heute bekannt. Ließe sich als "Fußnote der Geschichte" interpretieren und abtun.

Tippfehler beim Eisengehalt in Spinat

Ich halte es mit aktuellen Studien so, dass man mal eine Erkenntnis als Hinweis zitiert und im Blog aufbereitet. Aber am Ende des Tages hilft nur gesunder Menschenverstand sowie der "gute Mix von allem". Wer auf neueste Erkenntnisse zwar achtet, diese aber nicht sklavisch zum Mantra erhebt, dürfte ganz gut fahren – sowohl im Hinblick auf Ernährung als auch in Punkto Gesundheitsvorsorge. Aber jetzt geht es um Handfesteres.

Handwerkliche Kompetenz bei Forschern – teilweise mangelhaft

Was sich aber jetzt abzeichnet, wirft ein bedenkliches Licht auf die Kompetenz der aktuellen Forscherlandschaft. Gut, das Studiendesign und die statistische Aufbereitung der Daten birgt viel Fehlerquellen. Gelegentlich werden alte Studiendaten durch erweiterte oder andere statistische Auswertungen in der Interpretation der Ergebnisse neu bewertet oder gänzlich widerlegt. Und auch plumpe Fälschungen von Studiendaten gibt es (siehe hier und hier).

Systematische Fehler in 20 % der Gentechnik-Veröffentlichungen

Jetzt gibt es aber das Bild, dass systematisch falsche Daten in Veröffentlichungen zur Gentechnik Eingang finden. Blog-Leserin 1ei hat mich die Nacht per E-Mail auf das Thema hingewiesen (danke dafür). In einem Artikel Gene name errors are widespread in the scientific literature weisen Forscher darauf hin, dass bei ca. 20 Prozent der Veröffentlichungen im Bereich der Gentechnik fehlerhafte Namen von Genen in anhängenden Excel-Tabellen verwendet werden. Das hat eine Auswertung der Veröffentlichungen in namhaften Publikationen in diesem Umfeld ergeben.

Excel hat schuld?

Problem ist die Verwendung des Tabellenkalkulationsprogramms Microsoft Excel bei der Aufbereitung von Informationen. Dass es dabei schon mal zu Rundungsfehlern auf Nachkommastellen bei Berechnungen kommen kann, weiß jeder, der mal Abrechnungen oder die Buchhaltung mit Excel versucht hat. Aber das ist nicht wirklich das Problem – vielmehr schlägt die automatische Zellformatierung bei den 'Forschern' und deren Veröffentlichungen samt Weitergabe der Daten zu.

Zum Hintergrund: Ich weise in meinen Office-Büchern (zum Beispiel Office 2013 – Bild für Bild oder Office 2016 – Bild für Bild bei Markt+Technik) selbst Einsteiger darauf hin, dass die Standard-Zellformate in Excel für allerlei Überraschungen und Darstellungsfehler verantwortlich sind. So werden schon mal Zahlen oder gemischte Angaben in Zellen als Datum oder Zahlen verunglimpft. Wer dann eine Zahl in einer solchen Zelle eingibt, bekommt ein Datum angezeigt, es werden Nachkommastellen abgeschnitten und mehr. Das kann man aber ganz gut mit gezielt zugewiesenen Zellformaten (z.B. Text, Zahl, Datum etc.) umgehen. Dann passieren solche "Konvertierungen" durch Excel nicht.

Im Artikel Gene name errors are widespread in the scientific literature werden Beispiele für solche Fehler in Excel-Tabellen mit Gennamen genannt. So wandelt Excel die Namen von Genen wie SEPT2 (Septin 2) oder MARCH1 (Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase) bei der automatischen Zellformatierung in '2-Sep' und '1-Mar' um, wenn man die Zellinhalte nicht durch ein vorangestelltes Hochkomma ' oder per Textformat kennzeichnet.


Anzeige

Die Forscher haben aus 18 Gentechnik-Journalen die zwischen 2005 und 2015 publizierten Artikel bzw. die dazu mitgelieferten Excel-Tabellen mit Daten heruntergeladen und ausgewertet. Insgesamt wurden 35.175 Excel-Dateien zu diesen Artikeln ausgewertet. Dabei wurden 987 Fehler bei 704 Publikationen in den Excel-Daten, verursacht durch fehlerhafte Formatierung, festgestellt.

Ich bin schockiert …

Das Ganze wirft ein bezeichnendes Licht auf das Umfeld, in dem heute Forschungsveröffentlichungen stattfinden. Achtet man bei der Dateneingabe auf die Formatierung, kann diese automatische Umwandlung in meinen Augen nicht mehr passieren (es sei denn, in den Gentechnik-Verlagen werden die Excel-Tabellen nochmals verändert). Wer seine Daten vor und nach einer Veröffentlichung kontrolliert, dem sollten solche groben Schnitzer eigentlich auch auffallen. Und die Peer-Reviews, mit denen sich wissenschaftliche Magazine gerne schmücken, sind wohl für die Tonne.

Werden die Studien von der Sekretärin des Forschers/Institutsleiters geschrieben und die Excel-Anhänge ungelesen eingereicht – und dort nimmt die Sekretärin das Ganze ab? Nichts gegen Sekretärinnen, die machen einen guten Job. Es gehört aber nicht zu deren Aufgaben, Studiendaten vor einer Veröffentlichung auf solche Schnitzer zu kontrollieren (obwohl dieser Nutzerkreis vermutlich um die Excel-Problematik der automatischen Konvertierung weiß).

Man kann es auch gehässig formulieren: Die Generation Facebook unter den Gen-Forschern kann offenbar weder Excel noch das grundlegende Handwerkszeug bedienen. Und so bekommt der alte Spruch, der mir im Ingenieursstudium um die Ohren gehauen wurde "wer misst, misst Mist" eine gänzlich neue Bedeutung. "Wer misst und publiziert, produziert Mist". Aber möglicherweise tue ich jetzt den Forschern unrecht – wer weiß.

Ein schlechtes Licht wirft das auf jeden Fall auf die gesamte Zunft. Gut, es ist immer problematisch, Daten aus Anhängen zu übernehmen, weil es Übertragungsfehler geben kann. Aber das Problem scheint in den letzten Jahren deutlich zugenommen zu haben. Letztendlich sind damit die Excel-Anhänge zu publizierten Veröffentlichungen oft wertlos.

Wen es interessiert, der englische Artikel Gene name errors are widespread in the scientific literature  geht auf die Details ein. Das Ganze liest sich recht sperrig – eine etwas populärere Darstellung findet sich in den deutschsprachigen Artikeln Wenn Excel "mitdenkt": 20% aller Genetik-Forschungen fehlerhaft (der Titel von winfuture.de trifft es nicht ganz – es geht um die Veröffentlichungen) sowie Verfälschte Tabellen: Excel bereitet Genforschern Probleme (der heise.de-Artikel ist in meinen Augen ganz gut geschrieben).


Anzeige

Dieser Beitrag wurde unter Allgemein, Gesundheit abgelegt und mit , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert