Wissenschaftliche Statistik und Datenanalyse auf Macintosh
DataDesk ist ein sehr umfangreiches und gleichzeitig kompaktes Statistikprogramm,
das einfach unentbehrlich für die statistische Anwendung in Industrie
und Forschung ist. Es handelt sich hierbei um ein von führenden Wissenschaftlern
entwickeltes und in der Praxis erprobtes Statistikprogramm, das ohne große
Vorkenntnisse und unter optimaler Ausnutzung der Fähigkeiten des Macintoshs
jedem Anwender nach kürzester Einarbeitungszeit die Möglichkeit
bietet umfangreiche Analysen durchzuführen. Auswertungen können
hierbei sowohl grafisch als auch numerisch dargestellt werden. Über
den integrierten Makrogenerator lassen sich Arbeitsablagen automatisieren.
Datenmanipulationen
DataDesk kann anhand eines Datenbestandes einfache statistische und mathematische
Analysen mit Hilfe von eigenen bzw. von Standardfunktionen durchführen
deren Ergebnisse dem Datenbestand angefügt werden oder auch grafisch
angezeigt werden können. Es stehen hierbei standardmathematische Funktionen
wie +, -, *, /, LOG, SIN, COS, SQRT(), EXP(), DIV, MOD, LESSER(,),...,
logische Funktionen, wie NOT(), <, >, =, AND,...; Rundungsfunktionen,
wie ABS(), INT(), FLOOR(), ROUNDUP(),...; statistische Funktionen wie RANK(),
CUMSUM(), MEAN(), VARIANCE(),... und programmierbare Funktionen, wie IF
THEN ELSE, MIX,... zur Verfügung. Es besteht zudem die Möglichkeit,
Datenbestände nach Schlüsseln zu sortieren, zu transponieren,
aufzuspalten oder zusammenzufügen.
Grafische Darstellungsmethoden
Eine Besonderheit von DataDesk sind die grafischen Möglichkeiten.
DataDesk bietet eine Fülle an grafischen Darstellungsmglichkeiten,
die sich auf 2D- und 3D-Darstellungen aufteilen, sowie allgemeine und spezialisierte
Grafiken zu statistischen Tests. Die direkte Darstellung der Daten bietet
unter anderem die Möglichkeit, Grafiken als X-Y-Plots in Punkt- oder
Liniendarstellung, Histogramme, Balken-, Tortendiagramme, X-Y-Matrizenplots,
Linienplots, Wahrscheinlichkeitsplots, Rotationsplots oder Oberflächenplots
zu erstellen.
Außerdem ist es unter DataDesk möglich, die erstellten Grafiken
durch On-Screen-Editing direkt am Bildschirm zu ändern oder sich die
die Datenpunkte durch Zooming heranzuholen. Die Symboldarstellung der einzelnen
Datenpunkte, Farben, Linienformen, Achsenarten (logarithmisch, normal,
versteckt) und Skalierungen können frei gewählt werden, Grafiken
können überlagert werden. Datenpunkte können außerdem
an der Grafik direkt verschoben, eliminiert oder gruppiert werden, was
sich ebenfalls automatisch auf den Datenbestand und die damit verbundenen
Analysen und weiteren Grafiken auswirkt, diese werden dann ebenfalls erneuert.
Statistische Tests
Beschreibende Statistik, Hypothesentests
Erzeugung von Zufallszahlen nach Verteilungsfunktionen, Bernoulli-,
Binomial-, Poisson-, Gleich-, Normalverteilung, Vertrauensintervalle, multiple
Intervalle mit Bonferroni Justierung, Hypothesentests nach gegebenen Verteilungsfunktionen
mit/ohne gegebener Varianz, Vorzeichen-, Wilcoxon Vorzeichen-, Mann-Whitney
U Test, multiple Hypothesentests mit Bonferroni-Justierung, Chi-Quadrat
und Student's t-Test, Darstellung von Differenzen, multiple Vergleiche
von Mittelwerten für gleiche und ungleiche Varianzen, Boxplots mit
Histogrammdarstellung, Wahrscheinlichkeitsplots, Histogramme.
Korrelationen und Tabellen
Korrelations- und Kovarianzmatrix, Pearson-Moment-, Spearman Rankkorrelation,
Kendall's Tau, Kontingenz- und Break-Down-Tabellen.
Regressionsanalysen
Multiple lineare, partielle und Stufenweiseregressionen mit Berechnung
der Koeffizienten, Quadratsummen, t- und F-Wert, r-Quadrat Fehler, Cook-Distanz,
quadratischen Mittelwert, H-Matrix, interpolierte Werte, genormte Residuen
nach Student, Interferenzen von Regressionskoeffizienten, ANOVA von Regressionsergebnissen
sowie LOGIT Regressionen diskreten Faktoren, Maximum Likelihood-Schätzungen
und Wald-Statistiken.
Varianzanalysen
N-Wege ausgeglichene und nichtausgeglichene ANOVA, ANCOVA, MANOVA,
MANCOVA mit Meßwiederholungen und Interaktionen, Angabe von Freiheitsgraden,
Quadratsummen, Quadrat der Mittelwerte, F- und t-Wert, Histogrammdarstellung
pro Faktor, Schätzwerte, Leverage Wert, Cook Distanz, genormte Werte
nach Student, Wilk's Lambda, Hotelling-Lawley trace, Pillai's trace, Roy's
Maximumwurzel, erwartete Mittelwerttabelle, Post-Hoc Test, Least Significant
Differenzen, Scheffe-Methode, Bonferroni Annäherung.
Multivariate Analysen
Hi-Res Dendogramme, Cluster Graphen, normale und hierachische Clusteranalyse
mit einfachen und kompletten Verknüpfungen mit euklidischer Distanz,
n-dimensionale Hauptkomponentenanalyse mit normaler graphischer 2D- und
3D-Darstellung sowie als "Butterfly View", Angabe von Orthogonal-Basisvektoren,
SVD , Hauptvektoren, Eigenwerten.
Zeitreihenanalyse
Fourieranalyse, Tiefbassfilter, robuste, homothetische, LOWESS (locally
weighted regression scatterplot smoothing), TREWESS (trimmed resistant
weighted scatterplot smooth) und Median Glättung.
Im- und Export
Grafiken können über die Zwischenablage oder über Dateien
im MACPaint-Format exportiert werden. Daten können im DataDesk eigenen
Format und als ASCII-Datei exportiert und importiert werden, außerdem
kann DataDesk von 4th Dimensionen, GeoQuery und anderen DataDesk-Anwendern
verwendete Daten gleichzeitig mitbenutzen.
Spezielle Funktionen
In DataDesk sind alle grafischen und numerischen Ausgaben miteinander verknüpft,
das heißt, bei einer Änderung der Stammdaten werden alle darauf
aufbauenden Fenster automatisch aktualisiert. Es bestehen außerdem
Verknüpfungen zwischen grafischen Ausgaben, die auf denselben Datenbeständen
basieren, so dass eine Veränderung der Datenpunkte in dem einem
Plot auch gleichzeitig eine Veränderung in dem anderen hervorruft.
Makros
Die Praxis erfordert, dass auf mehreren Datenbeständen oder auch
auf verschiedenen Bereichen von ein und demselben Datenbestand dieselben Analysen und Auswertungen mehrfach ausgeführt werden müssen.
Hierzu bietet DataDesk ein sogenanntes "Analysis Template" an. Unter einem
"Analysis Template" versteht man eine Vorlage von Funktionen, Arbeitsvorgängen
und Auswertungen, die nur noch auf einen bestimmten Datenbestand angesetzt
werden muss und diesen dann nach den von Ihnen gewünschten Verfahren
komplett auswertet. Es wird somit nur noch das Starten diesen Templates
benötigt, um beliebig viele, von Ihnen einmal definierte, Arbeitsschritte
beliebig oft auf beliebig viele Daten anzuwenden.
Ausstattung und Anforderungen
DataDesk ist ein sehr kompaktes Programm, das auf allen Macintoshs ab System
6 mit mindestens 1MB RAM läuft und maximal 1,2 MB Festplattenspeicher
belegt. Der Coprozessor wird unterstützt, ist allerdings nicht zwingend
erforderlich. Ausgeliefert wird DataDesk mit zwei ausführlichen Handbüchern
und einem QuickStart Guide.
Stefan Steinhaus, webmaster@steinhaus-net.de