Commit d609afb2 authored by jbleher's avatar jbleher
Browse files

Added sampling

parent 6cf387d6
Loading
Loading
Loading
Loading
+35 −1
Original line number Diff line number Diff line
# ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
# Einlesen und Untersuchen der Populationsdaten ----
# ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

# Einlesen der Daten
noten <- read.csv("01_data/noten_only_urliste_tools.csv",dec = ",")
@@ -6,7 +9,8 @@ noten <- read.csv("01_data/noten_only_urliste_tools.csv",dec = ",")
noten_numeric <- as.numeric(noten$grade)

# Häufigkeitstabelle der Noten (inkl. fehlender Werte)
(freq_noten <- table(noten_numeric,useNA = "ifany"))
(freq_noten <- table(noten_numeric,useNA = "ifany")) # absolute Häufigkeiten
(relfreq_noten_sample <- prop.table(noten_numeric)) # relative Häufigkeiten

bestanden <- ifelse(is.na(noten_numeric), # fehlender Wert?
                    "nicht erschienen",   # ja -> Nicht erschienen
@@ -26,3 +30,33 @@ levels(noten_string)

# Häufigkeitstabelle Bestanden/Nicht Bestanden
(freq_noten_string <- table(noten_string,useNA = "ifany"))

# ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
# Stichproben Erstellung ----
# ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

noten_sample <- sample(noten_numeric, 100) # Zufallsstichprobe von 100 Noten

# Häufigkeitstabelle der Noten (inkl. fehlender Werte)
(freq_noten_sample <- table(noten_sample,useNA = "ifany")) # absolute Häufigkeiten
(relfreq_noten_sample <- prop.table(freq_noten_sample)) # relative Häufigkeiten

bestanden <- ifelse(is.na(noten_numeric), # fehlender Wert?
                    "nicht erschienen",   # ja -> Nicht erschienen
                    # Nein -> Noten unterteilen in bestanden und nicht bestanden
                    ifelse(noten_numeric <= 4, "bestanden", "nicht bestanden"))

# Häufigkeitstabelle Bestanden/Nicht Bestanden
(freq_bestanden <- table(bestanden,useNA = "ifany"))

# Klassifizieren der Daten enstprechend der Noten
noten_mod <- ifelse(is.na(noten_numeric),99,noten_numeric) # fehlende Werte mit 99 ersetzen
noten_string <- cut(noten_mod, 
                    breaks = c(-Inf, 1.5, 2.5, 3.5, 4.5, 5.5, Inf), 
                    labels = c("sehr gut", "gut","befriedigend", "ausreichend","ungenügend", "nicht erschienen"))
is(noten_string)
levels(noten_string)

# Häufigkeitstabelle Bestanden/Nicht Bestanden
(freq_noten_string <- table(noten_string,useNA = "ifany"))