Excel-Problem bei Gen-Studien: "Fehler nicht gleich Fehler"
Drei Mitglieder eines australischen Herz- und Diabetes-Forschungsinstituts haben herausgefunden, dass viele Genetik-Studien Fehler enthalten, die von Microsoft Excel stammen. Mark Ziemann, Yotam Eren und Assam El-Osta haben dazu einen Artikel im Fachmagazin Genome Biology veröffentlicht. Ihren Erkenntnisse zufolge hat Excel Schwierigkeiten mit den Bezeichnungen vieler Gene. Sie werden von einer automatischen Korrekturfunktion des Office-Programms in Datumsangaben oder Gleitkommazahlen umgewandelt.
Gene, die Bezeichnungen wie SEPT2 oder MARCH1 enthalten, werden von Excel etwa in Datumsangaben wie 1.3.2016 korrigiert. Einige andere Namenszusätze, die verwendet werden, etwa „2310009E13“, werden als Gleitkommadarstellungen verstanden und verwandeln sich so in Ausdrücke wie „2,31E+13“.
Bekanntes Problem
Wie die drei Studienautoren herausfanden, kommen diese Fehler in einer großen Anzahl von Datenblättern vor, die als Anhang zu Fachpublikationen veröffentlicht werden. Für die Untersuchung wurden mit einem selbst gebauten Computerprogramm Artikel aus 18 Fachjournalen gefiltert, die zwischen 2005 und 2015 veröffentlicht wurden. Dabei fanden sich 7467 Genlisten zu 3597 Artikeln. In 987 Listen aus 704 Artikeln fanden sich Excel-Fehler. Das entspricht einem Anteil von 19,6 Prozent aller Artikel.
Das Problem der Umwandlung von Genbezeichnungen in Tabellenkalkulationsprogrammen ist seit mehr als einem Jahrzehnt bekannt. Außer Microsofts Excel sind auch die Programme LibreOffice und OpenOffice Calc davon betroffen. In keinem der Programme gebe es die Möglichkeit, die automatische Korrektur permanent auszuschalten, kritisieren Zieman, Eren und El-Osta. Sie schlagen vor, das kostenlose Online-Programm Google Sheets zu verwenden. Damit abgespeicherte Listen behalten die ursprünglichen Genbezeichnungen selbst dann, wenn man sie in Folge mit Excel öffnet.
Könnte schlimmer sein
Während die beschriebene Untersuchung auf die Verbesserung des Datenmaterials abzielt, werden keinerlei negative Folgen für die Forschung befürchtet. Währenddessen hat eine Untersuchung schwedischer und britischer Forscher unlängst ergeben, dass die Ergebnisse von Magnetresonanzuntersuchungen (MR) der letzten 25 Jahre stark verfälscht sein könnten. Schuld daran sei eine falsch überprüfte Statistikmethode, die in den meisten Programmen zur Auswertung von MR–Bildern enthalten ist. Die Erkenntnis zieht nun eine ganze Reihe von Studien in Zweifel, die mit MR-Untersuchungen gearbeitet haben.
"Fehler ist nicht gleich Fehler", meint Martin Kusch, Wissenschaftstheoretiker an der Universität Wien. "Wissenschaftliche Arbeiten werden damit nicht automatisch wertlos." Man müsse stets herausfinden, welchen Einfluss einzelne Fehler auf ein Gesamtergebnis haben. Selbst wenn sich herausstellt, dass signifikante Fehleinschätzungen die Folge waren gelte: "Dass Fehler entstehen und später korrigiert werden, ist ein normaler Prozess."