Excel Best Practices

Im IT-Umfeld ist es gelegentlich üblich zu diskutieren ob es in Ordnung ist, klassische Tabellenkalkulationsprogramme (Excel, Numbers, Calc, …) in der Arbeit mit Daten zu verwenden. Diplomatisch korrekt ist, dass sie in bestimmten Anwendungsfällen, wie der explorativen Datenanalyse und schnellen „Wegwerfarbeiten“ großartig sind, besonders für den Laien.

Excel kommt von Exzellenz

Eigentlich. In Anbetracht der enormen Bedeutung von Excel in nahezu jeder Branche, die Sie sich vorstellen können, ist der „richtige Umgang mit Excel“ von enormer Bedeutung. Es gibt viele gut dokumentierte Fälle von Excel-Fehlern, die zu verschiedenen Arten von Katastrophen führen. Ich werde hier nicht mit Links zu solchen Katastrophen langweilen, die Sie in Ihrer Lieblingssuchmaschine leicht finden können, sondern verweise auf die European Spreadsheet Risks Interest Group, eine Gruppe von Leuten, die zusammenkommen, um Konferenzen (!) zu veranstalten und Papiere darüber zu überprüfen, wie man es vermeiden kann, sein Unternehmen durch Tabellenkalkulationspannen zu ruinieren.

Was ist also ein guter Wissensstand in diesem Bereich?

Angesichts der Tatsache, dass es viele brillante Köpfe gibt, die sich intensiv mit dem Problem der Vermeidung von Fehlern in Tabellenkalkulationen beschäftigen, gibt es einige gute Referenzen, die man sich ansehen sollte. Die wahrscheinlich beste Referenz (auf die ich gestoßen bin) ist ein Artikel von Broman und Woo aus The American Statistician aus dem Jahr 2018, „Data Organization in Spreadhseets“. Darin werden viele gute Regeln für die Verwendung von Tabellenkalkulationen zum Sammeln, Speichern und Analysieren von Daten beschrieben.

Einige gemeinsame Themen

Ich empfehle dringend, sich die beiden oben genannten Referenzen anzuschauen, um mehr zu erfahren, aber ich fasse einige Themen zusammen, die mir aufgefallen sind
  • Verwenden Sie NIEMALS Farb-/Texteffekte, um aussagekräftige Daten anzuzeigen – dafür gibt es zwar viele Gründe, aber der wichtigste ist wohl, dass man nicht (einfach) eine Formel schreiben kann, die „wenn grün, dann 1“ ausdrückt.
  • Eine Kopfzeile für jede Datentabelle, und verwenden Sie bitte gute (verständliche, eindeutige usw.) Namen für die Felder
  • Ein Datenelement pro Zelle, kein „Brooklyn, NY 11223“ für „Stadt Staat PLZ“ in einer einzigen Zelle
  • Eine Zeile pro Datenpunkt, keine leeren Zellen in der Tabelle
  • Verwenden Sie Verknüpfungsschlüssel, um mehrere Tabellen miteinander zu verbinden.
  • ISO 8601 für Datumsangaben (2021-12-31)
    • Generell macht man sich in der IT das Leben leichter wenn Zeitstempel mit IS 8601 formatiert werden, da kann man nämlich zeitlich sortieren..
  • Konsistente Dateneingabe (Leerzeichen, Rechtschreibung, Großschreibung usw.), Verwendung der Validierungswerkzeuge zur Durchsetzung solcher Regeln
  • Formeln sollten konsistent für die gesamte Spalte/Zeile ohne Änderung gelten, keine einmalig geänderte Formel für Zeile 46
  • Behalten Sie die Rohdaten bei, ändern Sie sie nicht, verwende einen neuen Reiter.

Was müssen Sie also noch hinzufügen?

Ich wollte damit beginnen, die verschiedenen Themen unter den allgemeinen Kategorien zu klassifizieren, auf die sie abzielen: Macken in Excel (wie die Sache mit dem Datum), Vermeidung menschlicher Fehler, Vermeidung von Anti-Patterns usw. Aber wenn ich weiter darüber nachdenke, denke ich, dass eine solche Klassifizierung ein bisschen zu abstrakt wäre, um einem neuen Excel-Benutzer zu helfen, unentdeckte Probleme zu vermeiden. Wenn Sie daran interessiert sind, gibt es zum Glück ganze Abhandlungen, wie diese von Powell, Baker und Lawson aus dem Jahr 2008, die viele verschiedene Arten von Tabellenkalkulationsfehlern untersuchen und klassifizieren. Stattdessen gibt es meiner Meinung nach mindestens eine weitere Möglichkeit, Tabellenkalkulationen zu betrachten: Die Regeln zur Fehlervermeidung unterscheiden sich je nachdem, was Sie tun. Tabellenkalkulationen werden für eine Vielzahl von Datenaufgaben verwendet – Eingabe, Speicherung, Ad-hoc-Analyse, „verpacktes“ Analysewerkzeug und sogar gemeinsame Nutzung/Zusammenarbeit. Nicht jede Regel ist für alles relevant. Das allgemeine Motto „Menschen vor Fehlern bewahren“ bleibt bestehen, aber der Schwerpunkt verschiebt sich. Bei der Dateneingabe und -speicherung sind Sie vor allem daran interessiert, bestimmte Probleme zu vermeiden. Menschliche Fehler bei der Dateneingabe lassen sich durch Datenvalidierungstools verhindern. Die Sicherstellung, dass Ihre Daten „aufgeräumt“ sind (im R-Sinn von „aufgeräumten Daten“), in sauberen Ein-Zeilen-pro-Datenpunkt, mit Verbindungsschlüsseln über Tabellen hinweg, ist wichtig für die Speicherung und Pflege von Daten für die zukünftige Verwendung. Ich denke, dass sich die meisten Anleitungen zur Vermeidung von Tabellenkalkulationsproblemen auf diesen Teil der Dateneingabe/Speicherung konzentrieren. Da dies der häufigste Aspekt bei der Verwendung von Tabellenkalkulationen ist, liegt es auf der Hand, dass dies bei jedem Projekt in gewissem Maße der Fall ist. Daher wird er bei Fehlern natürlich stärker ins Gewicht fallen. Wenn die gemeinsame Nutzung und die Zusammenarbeit zu einem größeren Anliegen werden, müssen Sie sich mit der Frage auseinandersetzen, wie Sie sicherstellen können, dass andere Menschen sehen können, wo die Maschinen stehen“. Tabellenkalkulationen neigen dazu, die zugrunde liegende Maschinerie (die Formeln und Referenzen) standardmäßig zu verbergen. Es muss sichergestellt werden, dass jeder an ähnlichen Stellen nachschaut und erkennen kann, was geändert werden kann und was nicht. An dieser Stelle werden oft Konventionen über die Platzierung von Dingen, die Erstellung von Datenwörterbüchern und die Verwendung von Farben zur Hervorhebung von Dingen eingeführt.   Die Verwendungszwecke ändern sich ein wenig, wenn man zur Ad-hoc-Analyse übergeht. Jetzt ist es sehr wichtig, dass Sie Ihre Rohdaten in Ruhe lassen und einen Analysepfad auf Papier hinterlassen, der klar dokumentiert, wie Sie von den Rohdaten zur endgültigen Analyse gelangen. Es ist auch viel wichtiger, dass Sie organisiert bleiben und wissen, wann Sie Berechnungen in separate Arbeitsblätter auslagern müssen. Sie müssen sich auch Gedanken über die Speicherung von Formelparametern an gut sichtbaren Stellen machen (oft farblich hervorgehoben, um sie zu betonen!). Sie müssen auch Artefakte an leicht zu findenden Stellen ablegen, Parameter sollten sich in der Nähe des oberen und linken Randes befinden, Formeln müssen in einer Spalte der Datentabelle konsistent sein usw. Auch der Teil mit den aufgeräumten Daten beginnt in der Analysephase zu scheitern, da Sie schließlich anfangen müssen, Daten zu gruppieren, zu filtern und in formatierten Diagrammen und Tabellen zusammenzufassen. Die Dinge werden immer individueller, um den besonderen Anforderungen der Analyse- und Präsentationsschicht gerecht zu werden. Wenn Sie sich dann in den Bereich der „Tabellenkalkulation als verpacktes Analyseprodukt“ vorwagen, was in einem Beratungskontext ziemlich häufig vorkommt, haben Sie noch mehr Bedenken, dass Kunden eine Tabellenkalkulation versehentlich ändern/zerstören. Jetzt müssen Sie Dinge wie das Sperren von Blättern und Zellen einsetzen, um Missgeschicke zu verhindern. VBA und Skripte werden in diesem Bereich immer häufiger eingesetzt, und jetzt muss man sicherstellen, dass diese Dinge ordnungsgemäß dokumentiert sind, damit jeder, der die Tabelle pflegen will, auch nach Code suchen kann, der nicht sofort ersichtlich ist. Ehrlich gesagt wird über diese Phase der Tabellenkalkulation nicht allzu viel diskutiert, weil die Fähigkeiten, die man braucht, um diesen Punkt zu erreichen, weniger verbreitet sind. Wenn Sie VBA-Code für das Front-End Ihrer Tabellenkalkulation schreiben, befinden Sie sich bereits in einer neuen Dimension des Wahnsinns. Wie bei den meisten Dingen bietet der Eintritt in eine neue Dimension nur noch mehr Freiheitsgrade, um Probleme zu verursachen. Jetzt können Sie ganz einfach Programmierfehler einbauen, da Sie Zugang zu einer vollständigen Turing-Sprache haben. (Okay, ab 2021 sind auch die Excel-Formeln selbst Turing-komplett, so dass Sie auch auf diese Weise Fehler machen können. Siehe Tweet unten.) Und schließlich, nach dem Stadium des „paketierten Analyseprodukts“ für fortgeschrittene Tabellenkalkulationen (und oft auch schon davor), erreicht man einen Punkt der Komplexität, an dem die Antwort auf die Frage, wie man Probleme mit Tabellenkalkulationen minimieren kann, lautet: „Keine Tabellenkalkulationen mehr verwenden“. Oft wird diese Entscheidung getroffen, weil es für alle besser ist, eine echte Datenbank statt einer Tabellenkalkulation zu verwenden. Manchmal liegt es daran, dass man nicht mehr mit Excel-Formeln seltsame Geschäftslogik nachbilden möchte und es besser wäre, Produktionscode für diese Dinge zu verwenden. In anderen Fällen liegt es daran, dass Sie die Daten gemeinsam nutzen wollen oder dass sie mehreren Nutzern zur Verfügung stehen sollen. Sehr oft liegt es daran, dass der heiligen Excel-Datei etwas Tragisches zugestoßen ist und Daten auf tragische Weise verloren gegangen sind, und es gibt eine Motivation, es „richtig“ zu machen, jetzt, da klar ist, wie wichtig die Datei war. Idealerweise sollte man die Entscheidung treffen, bevor die Tragödie zuschlägt, aber die Menschen neigen dazu, den Status quo beizubehalten. finale-Version.54.echtjetzt.xlsxnn

Weiterführende Artikel

n

Weiterführende Artikel


Weiterlesen: Dashboard Sichtbarkeit · Controllingsoftware · Steuerbare Eingangsmetriken

Nach oben scrollen