Publications by Statistische Datenanalyse mit R
R Tidyverse - 3 - Data Wrangling
Introduction Prerequisites In this chapter, we will introduce the dplyr package, another core member of the Tidyverse. Because we still have not discussed importing our own datasets, we will showcase data manipulation with dplyr with the nycflights13::flights dataset. We will also apply our knowledge from the previous chapter on ggplot2 by creat...
12383 sym R (19309 sym/58 pcs) 4 img
R - Anmerkungen
R Coding Style Unter Coding Style versteht man die Formatierung von Code. Ein konsistenter Coding Style erleichtert das Lesen von Code. Es ist sinnvoll, sich an gewisse Richtlinien zu halten, die sich in der R-Community etabliert haben. Der Zuweisungsoperator <- sollte von Leerzeichen umgeben sein, also: x <- c(5, 6, 10) Kommentare schreibt man m...
3317 sym R (2160 sym/44 pcs)
R Tidyverse - 2 - Visualization
Introduction Data needs to be imported, tidied, and transformed before any visualization can be created. We will discuss these steps, which are necessary for almost all real-world datasets, in the following chapters. However, because we can use tidy example datasets that are already available in R, we will focus on creating visualizations first. ...
9795 sym R (3259 sym/24 pcs) 18 img
R Tidyverse - 1 - Introduction
Tidyverse The Tidyverse is a collection of R packages that are designed to work well together. Their fundamental assumption is that data is represented in a so-called “tidy” format. This basically means that it can be represented by a table in which a row corresponds to an observation and a column corresponds to a variable (more details are a...
12115 sym R (2364 sym/72 pcs) 3 img
R Tidyverse - 5 - Tidying data
Introduction Tidy datasets are all alike, but every messy dataset is messy in its own way. — Hadley Wickham The Tidyverse revolves around tidy data. Data can be represented in several ways, but to be tidy it must have the following properties: Each variable corresponds to exactly one column. Each observation corresponds to exactly one row. E...
4871 sym R (4852 sym/29 pcs) 2 img
R Tidyverse - 6 - Examples
Example datasets COVID19 in Austria https://covid19-dashboard.ages.at/data/CovidFaelle_Timeline.csv Austrian legislative election 2019 https://www.bmi.gv.at/412/Nationalratswahlen/Nationalratswahl_2019/files/endgultiges_Gesamtergebnis_NRW19_16102019.xlsx Air quality in Graz (PM10) http://app.luis.steiermark.at/luft2/suche.php?station1=172&stat...
752 sym R (686 sym/1 pcs) 2 img
R (11) - Lineare Regression (2) (21W)
Multiple lineare Regression Die multiple lineare Regression ist eine Erweiterung der einfachen linearen Regression auf Situationen mit mehreren Prädiktoren. Das grundlegende Konzept bleibt aber unverändert, wir verwenden nach wie vor folgende Modellgleichung: \[\mathrm{outcome}_i = \mathrm{model}_i + \mathrm{error}_i\] Das Modell mit \(n\) Prä...
17394 sym R (18647 sym/24 pcs) 4 img
R (9) - Korrelation (21W)
Allgemeines Oft ist es interessant zu fragen, ob zwei Variablen eine gegenseitige Abhängigkeit zeigen. Man möchte also wissen, ob sich die beiden Variablen ähnlich verhalten oder nicht – wenn die eine Variable zunimmt, nimmt dann die andere Variable auch zu (oder ab)? Die Korrelation ist ein einfaches und populäres Maß um diese Fragestellu...
17073 sym R (3675 sym/41 pcs) 9 img 1 tbl
R (8) - Grafiken (2) (21W)
Das ggplot2-Paket Im Gegensatz zum Base-Plotting-System muss das Paket ggplot2 installiert (install.packages("ggplot2")) und geladen werden: > library(ggplot2) Das Paket ist eine Implementierung der sogenannten Grammar of Graphics, welche statistische Grafiken mit einheitlichen grundlegenden Elementen zu beschreiben versucht. Dies hat den Vorteil...
8627 sym R (2543 sym/30 pcs) 23 img
R (7) - Grafiken (1) (21W)
Allgemeines In R gibt es mehrere Pakete, mit denen man Daten grafisch darstellen kann. Grafiken, welche mit unterschiedlichen Paketen erstellt wurden, lassen sich aber nicht (einfach) miteinander kombinieren. Deshalb entscheidet man sich typischerweise vor der Erstellung einer Grafik für das zu verwendende Grafikpaket. In diesem Seminar werden w...
10841 sym R (4845 sym/37 pcs) 20 img 1 tbl