Skip to content
Christian Treffenstädt edited this page May 17, 2014 · 9 revisions

outliers.r: Ausreißeranalyse in Datensätzen

outliers.r (letztes Update: 09.04.2014)

Das Skript outliers.r erlaubt es Benutzern, Ausreißer in Datensätzen zu identifizieren und im Bedarfsfall Änderungen am Datensatz vorzunehmen. Dabei können z.B. einzelne Werte ersetzt oder ganze Fälle ausgeschlossen werden, welche als Ausreißer identifiziert wurden.

Liste der enthaltenen Funktionen

  • outliers.get(): Identifiziert Ausreißer anhand eines einstellbaren Kriteriums anhand ihrer Abweichung vom Mittelwert einer Variablen
  • outliers.boxplot(): Stellt die Variablen mit identifizierten Ausreißer grafisch in Form von Boxplots dar
  • outliers.deleteCases(): Löscht alle Fälle mit identifizierten Ausreißern aus einem Datensatz
  • outliers.replace(): Ersetzt identifizierte Ausreißer mit einem einzigen, einstellbaren Wert (z.B. NA)
  • outliers.replaceWithMean(): Ersetzt Ausreißer mit dem um alle Ausreißer bereinigten Mittelwert einer Variablen

Anwendungshinweise

Die Hauptfunktion des Skriptes ist outliers.get(). Mit dieser sollten Ausreißer zunächst identifiziert werden. Als Rückgabewert erhalten Nutzer ein Datenframe, welches die genaue Position, den Wert und weitere Informationen zu den identifizierten Ausreißern enthält.

Achtung: Zur Identifizierung von Ausreißern werden z-transformierte Variablenwerte genutzt. Da diese bei nicht normalverteilten Variablen nicht zuverlässig interpretiert werden können, werden alle Variablen mit identifizierten Ausreißern zusätzlich auf Normalverteilung überprüft. Sollte sich dabei zeigen, dass eine oder mehrere Variablen nicht normalverteilt sind, sollten die Ergebnisse von outliers.get() mit großer Vorsicht betrachtet werden. In solchen Fällen ist die zuverlässige Identifizierung von Ausreißern nicht gewährleistet!

Achtung: Das Skript enthält Funktionen, die das löschen oder ersetzen der als Ausreißer identifizierten Werte ermöglicht, allerdings sollte hiervon nur nach einer individuellen Überprüfung aller Ausreißer Gehrauch gemacht werden und nur dann, wenn sich das weitere Vorgehen gut begründen lässt! Dieses Skript dient in erster Linie dazu, verdächtige Fälle und Werte zu identifizieren und nicht dazu, an diesen ohne eine vorherige Prüfung Änderungen vorzunehmen.

Die neben outliers.get() enthaltenen Funktionen im Skript outliers greifen optional auf ein Ergebnisframe von outliers.get() zurück oder setzen dieses voraus. Die genau Beschreibungen aller Funktionen und ihrer Parameter findet man in der outliers.r Skriptdatei (auf englisch).

derandom.r: Auflösen von randomisierten Aufgabenreihenfolgen in Messwiederholungsdaten

derandom.r (letztes Update: 10.04.2014)

Mit derandom.r können Benutzer in Messwiederholungsdaten randomisierte Aufgabenreihenfolgen so auflösen, dass Vergleiche und Analysen auf der Ebene der einzelnen Aufgaben möglich sind Anstatt auf ebene der Messwiederholungstrials.

Liste der enthaltenen Funktionen

  • derandom(): Erlaubt das Sortieren der randomisierten Aufgabenreihenfolge nach enstprechenden Aufgabennummern. derandom() gibt dem Benutzer ein Datenframe zurück, in dem Aufgabenwerte nach Aufgabennummer angeordnet sind.

Anwendungshinweise