Added sampling (d609afb2) · Commits · Johannes Bleher / ESDA_public

02_code/R/250403_Notenliste.R

+35 −1

Original line number	Diff line number	Diff line
		# ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
		# Einlesen und Untersuchen der Populationsdaten ----
		# ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

		# Einlesen der Daten
		noten <- read.csv("01_data/noten_only_urliste_tools.csv",dec = ",")
		@@ -6,7 +9,8 @@ noten <- read.csv("01_data/noten_only_urliste_tools.csv",dec = ",")
		noten_numeric <- as.numeric(noten$grade)

		# Häufigkeitstabelle der Noten (inkl. fehlender Werte)
		(freq_noten <- table(noten_numeric,useNA = "ifany"))
		(freq_noten <- table(noten_numeric,useNA = "ifany")) # absolute Häufigkeiten
		(relfreq_noten_sample <- prop.table(noten_numeric)) # relative Häufigkeiten

		bestanden <- ifelse(is.na(noten_numeric), # fehlender Wert?
		"nicht erschienen", # ja -> Nicht erschienen
		@@ -26,3 +30,33 @@ levels(noten_string)

		# Häufigkeitstabelle Bestanden/Nicht Bestanden
		(freq_noten_string <- table(noten_string,useNA = "ifany"))

		# ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
		# Stichproben Erstellung ----
		# ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

		noten_sample <- sample(noten_numeric, 100) # Zufallsstichprobe von 100 Noten

		# Häufigkeitstabelle der Noten (inkl. fehlender Werte)
		(freq_noten_sample <- table(noten_sample,useNA = "ifany")) # absolute Häufigkeiten
		(relfreq_noten_sample <- prop.table(freq_noten_sample)) # relative Häufigkeiten

		bestanden <- ifelse(is.na(noten_numeric), # fehlender Wert?
		"nicht erschienen", # ja -> Nicht erschienen
		# Nein -> Noten unterteilen in bestanden und nicht bestanden
		ifelse(noten_numeric <= 4, "bestanden", "nicht bestanden"))

		# Häufigkeitstabelle Bestanden/Nicht Bestanden
		(freq_bestanden <- table(bestanden,useNA = "ifany"))

		# Klassifizieren der Daten enstprechend der Noten
		noten_mod <- ifelse(is.na(noten_numeric),99,noten_numeric) # fehlende Werte mit 99 ersetzen
		noten_string <- cut(noten_mod,
		breaks = c(-Inf, 1.5, 2.5, 3.5, 4.5, 5.5, Inf),
		labels = c("sehr gut", "gut","befriedigend", "ausreichend","ungenügend", "nicht erschienen"))
		is(noten_string)
		levels(noten_string)

		# Häufigkeitstabelle Bestanden/Nicht Bestanden
		(freq_noten_string <- table(noten_string,useNA = "ifany"))