Category Archives: VP-SpPh 2013 Summer WA05

Update Hausaufgabe 12.06.2013: Plot Deutschlandkarte Auslaenderanteil an Schulen nach Bundeslaendern

Hausaufgabe zum 12.06.13

dat <- read.csv2("H:/R/win-library/2.15/codes/datensatz_schulen_all.csv",
                 skip=8)

names(dat) <- c("Jahr","Zahl_Bundesland","Bundesland","Schulform", 
                "Anzahl_Schulen","Anzahl_Schueluelerinsg",
                "Anzahl_Schueler_weibl","Auslaender","klasse_7",
                "Klasse_11")

library(latticeExtra)

aus <- dat$Auslaender

head(aus)
## [1]  496 6513    0 3747    0 1994

ges <- dat$Anzahl_Schueluelerinsg

head(ges)
## [1]   5861 114696      0  39363      0  51359

x <- c(1:272)  # da wir 272*12 daten im ursprünglichen datensatz

auslinsg <-aus[12*x]  # nur die ausländer aus den insgesamtzeilen

gesinsg <- ges[12*x] # nur gesamtschülerzahl von allen schulen  (immer 12te zeile)

ausinsgrel<- auslinsg/gesinsg # ins verhältnis gesetzt

head(ausinsgrel)
## [1] 0.05265 0.19084 0.07227 0.16938 0.13587 0.15405

jahre_stat <- c(rep("1995",16),rep("1996",16),rep("1997",16),rep("1998",16),
                rep("1999",16),rep("2000",16),rep("2001",16),rep("2002",16)
                ,rep("2003",16),rep("2004",16),rep("2005",16),rep("2006",16)
                ,rep("2007",16),rep("2008",16),rep("2009",16),rep("2010",16)
                ,rep("2011",16)) # erstellt die var der jahre für unseren datensatz

bl <- rep(unique(dat$Bundesland), length(unique(jahre_stat)))
bl <- gsub("Freistaat Sachsen","Sachsen", bl)
# jedes bundesland nur einmal wdhl über die länge der jahre

plottstatistik <- data.frame(ausinsgrel,jahre_stat, bl) # unser "eigener" datensatz

Update der letzten Hausaufgabe

clr <- c("#ECE7F2", "#A6BDDB", "#2B8CBE") # farben def

p <- xyplot( ausinsgrel ~ jahre_stat| bl, xlim=c(1995:2011), type="l",
             main="Auslaenderanteil in % der Bundeslaender von 95 bis 11",
             xlab="Jahre", ylab="Auslaenderanteil an Schulen in %" ,
             panel = panel.xyarea, col = c(clr[0], clr[3]))

p

plot of chunk unnamed-chunk-2

Plot auf Deutschlandkarte



load("H:/R/win-library/2.15/codes/DEU_adm1.RData")

gadm@data$NAME_1
##  [1] "Baden-Württemberg"      "Bayern"                
##  [3] "Berlin"                 "Brandenburg"           
##  [5] "Bremen"                 "Hamburg"               
##  [7] "Hessen"                 "Mecklenburg-Vorpommern"
##  [9] "Niedersachsen"          "Nordrhein-Westfalen"   
## [11] "Rheinland-Pfalz"        "Saarland"              
## [13] "Sachsen-Anhalt"         "Sachsen"               
## [15] "Schleswig-Holstein"     "Thüringen"


# datenzwei <- gsub("Freistaat Sachsen","Sachsen", plottstatistik$bl)
# plottstatistik$bl <- datenzwei

ausinsgrelkurz <- subset(plottstatistik, jahre_stat == "2010")
# reduziere datzensatz auf länge 16

daten <- gsub("ü","ue", gadm@data$NAME_1)  
# ersetzte ü durch ue der variable Name_1
gadm@data$NAME_1 <- daten

gadm@data <- data.frame(gadm@data, ausinsgrelkurz[match(gadm@data[, "NAME_1"],
                                                        ausinsgrelkurz[ ,"bl"] ),])

clrs <- colorRampPalette(brewer.pal(7,"Greens"))  # farben definieren

spplot(gadm, zcol="ausinsgrel", col.regions=clrs(16),
 main="Relativer Ausleanderanteil (in %) an Schulen pro Bundesland 2010")
 #plottet auf die karte, die gewählte var (zcol) in geg farbe

plot of chunk unnamed-chunk-3


source("H:/R/win-library/2.15/codes/publish.R")

 Interpretation der Grafik

Die von uns erstellte Karte zeigt den relativen Ausländeranteil an deutschen Schulen. Dabei sind zwei Gefälle deutliche erkennbar. So gibt es ein Ost-West-Gefälle, die Zahl der Schüler mit einem Migrationshintergrund liegt in diesen Bundesländern auf einem der niedrigsten Werte in Deutschland. Ein vorher prognostiziertes Nord-Süd- Gefälle bestätigt sich nicht so eindeutig.  Zwar haben die Bundesländer “Niedersachen” und “Schleswig-Holstein” eine viel niedrigere Ausländerquote an Schulen, das Gefälle zwischen “Hessen” und “Baden-Württemberg” ist aber marginal, weiterhin hat „Bayern eine fast so niedrigen Ausländeranteil wie die nördlichen Bundesländer.

Besonders auffällig sind die besonders hohen Zahlen in den Stadtstaaten, wie „Bremen“, „Berlin“, „Hamburg“. Sie scheinen wie kleine Inseln herauszustechen.  Die Gründe dafür sind sicherlich vielschichtig, doch der „Leuchtturmeffekt“ dieser Städte und ihre internationale Bedeutung, zieht sicher einige Migranten an. Wenn man dieser Argumentation folgt, bleibt Ostdeutschland  daher unattraktiv, da es zu den strukturschwachen Regionen zählt. Dieser Ansatz der Push-Pull-Faktoren erklärt aber die niedrige Ausländerquote in  „Bayern“ nicht. In diesem Bundesland scheinen andere äußere Bedingung zu dieser niedrigen Zahl führen. Die gehaltene Sonderstellung  „Bayerns“ und die sehr ländliche Struktur sind nur einige mögliche Ansätze.

Ein weiterer Grund für das Ost-West-Gefälle liegt sicher in der Geschichte Deutschlandes, die Anwerbung von Gastarbeiter begann in Westdeutschland in den 50er Jahren, diesen Prozess hat es schlicht in Ostdeutschland in dieser Form nicht gegeben, da die DDR-Regierung andere wirtschafliche Wege ging. Mirgartion erfolgt oft nach “hören sagen” und “Familiennachzug”.

 

Hausaufgabe 12.06.13 (Lebendgeborene in der Bundesregion 1995)

## Heute erstellen wir eine Grafik über die Lebendgeborenen je 10.000 pro
## Bundesland in Deutschland

library(sp)

library(latticeExtra)

## einlesen des Datensatzes zur Erstellung eines persönliches Datenframes

datgross <- read.csv2("H:/.ntdesktop/spezielle/datensatz/Dat.csv", 
    na.string = c(".", "-"), skip = 5)

names(datgross) <- c("jahr", "code", "ort", "bevoelkerungsdichte", 
                     "aenderung", "anteil auslaender", 
                     "Lebendgeborene_10000", "Gestorbene_10000",
                     "geb_gest_saldo 10000", "Wanderung_10000")

## Ganz wichtig dabei, die unötigen Spalten müssen weg, ansonsten kann es
## später nicht geplottet werden (eigene Erfahrung)

## gadm.org als Quelle für administrative Grenzen verschiedener Nationen
## nutzen reinladen der Daten in R

load("H:/.ntdesktop/spezielle/codes/schlandkarte.RData")

gadm@data$NAME_1

## die ü nun durch ue ersetzen, dafür wird VEktor kriiert
enamessp <- gsub("ü", "ue", gadm@data$NAME_1)

## anschließend die neuen Daten wieder in gadm@data$NAME_1 einlesen lassen
## bzw. wieder reinschreiben
gadm@data$NAME_1 <- enamessp

new <- subset(datgross, code <= 16 & jahr == "1995")

##     Wanderung_10000
## 1              77.0
## 17             37.7
## 18             91.5
## 70             24.7
## 73             49.1
## 134            54.6
## 164            74.8
## 204            31.6
## 253            56.5
## 357            28.5
## 365            28.8
## 366            75.6
## 385             1.1
## 410            33.8
## 459            -4.9
## 501             5.0


gadm$wanderung <- new$Wanderung_10000
## eigenen Fram erstellen um dadurch besser auf die Variablen zugreifen zu
## können, hierzu ansonsten auf den Blog gehen für die Anleitung

gadm@data <- data.frame(gadm@data, new[match(gadm@data[, "NAME_1"],
                                             new[, "ort"]), ])

head(gadm@data)
##    PID ID_0 ISO  NAME_0 ID_1             NAME_1 NL_NAME_1 VARNAME_1 TYPE_1
## 1 1268   86 DEU Germany    1 Baden-Wuerttemberg                       Land
## 2 1269   86 DEU Germany    2             Bayern             Bavaria   Land
## 3 1270   86 DEU Germany    3             Berlin                       Land
## 4 1271   86 DEU Germany    4        Brandenburg                       Land
## 5 1272   86 DEU Germany    5             Bremen                       Land
## 6 1273   86 DEU Germany    6            Hamburg                       Land
##   ENGTYPE_1 wanderung jahr code                ort bevoelkerungsdichte
## 1     State      77.0 1995    8 Baden-Wuerttemberg               288.7
## 2     State      37.7 1995    9             Bayern               170.0
## 3     State      91.5 1995   11             Berlin              3896.7
## 4     State      24.7 1995   12        Brandenburg                86.2
## 5     State      49.1 1995    4             Bremen              1681.6
## 6     State      54.6 1995    2            Hamburg              2261.1
##   aenderung anteil.auslaender Lebendgeborene_10000 Gestorbene_10000
## 1      45.9              13.1                109.2             94.9
## 2      59.8               9.5                105.4            102.0
## 3      -1.7              12.2                 82.5            113.1
## 4      20.9                NA                 53.1            107.9
## 5      -4.0                NA                 94.6            123.2
## 6      11.9              14.9                 93.0            118.8
##   geb_gest_saldo.10000 Wanderung_10000
## 1                 14.3            31.6
## 2                  3.3            56.5
## 3                -30.5            28.8
## 4                -54.8            75.6
## 5                -28.7            24.7
## 6                -25.8            37.7
## Farbe erstellen

clr3 <- colorRampPalette(brewer.pal(9, "Greens"))

## Plotten mit Farbe#
spplot(gadm, zcol = "Lebendgeborene_10000" ,
       main = "Lebengeborene je 10.000 im Bundesgebiet im Jahr 1995",
       col.regions = clr3(16))

plot of chunk unnamed-chunk-5

Die von uns erstellte Deutschlandkarte soll die Anzahl der Lebendgeborenen in den einzelnen Bundesländern zeigen. Eigentlich sollte deutlich werden, dass es im Osten weniger Geburten gibt als im Westen.

Es lässt sich deutlich erkennen, dass die drei Stadtstaaten eine eher geringe Geburtenzahl aufweisen. Warum diese drei “Bundesländer” von der Geburtenzahl eher gering ausfasllen mag in verschiedenen Gründen liegen und kann hier ohne wissenschaftliche Recherche nicht zu hundert Prozent dargelegt. Dennoch ist zu vermuten, dass hier vor allem de Karriere an oberster Stelle steht bevor die Kinder kommen. Hinzu kommt noch das mangelnde Kitaplatzangebot, woraufhin sich Eltern bereits teilweise Jahre im voraus einen Platz reservieren müssen.

in Badem-Württemberg und Bayern scheint dies anders zu sein. Hier werden viele Kinder geboren. Mag es sowohl an dem Arbeitsplatzangebot liegen oder aber auch zum Teil an dem starken katholischen Glauben (wie bereits erwähnt, es können nur Vermutungen aufgestellt werden).

Der Osten scheint wenig Attraktivität zu besitzen, dass Paare Kinder hier kriegen. Dies mag viel weniger an der Infrastruktur liegen da viele Kita-Plätze vorhanden sind, sondern vielmehr an der beruflichen Situation in den neuen Bundesländern. Das Ost-West-Gefälle ist durch die Farben deutlich zu erkennen.

Die Schüler sollten mit dieser Karte arbeiten und aus ihr herausziehen, dass ein Gefälle zwischen den alten und den neuen Bundesländern herrscht (Berlin ausgenommen). Hieraus könnten sich Diksussionen zu Wirtschaft in den einzelnen Regionen entwickeln. Darüber hinaus spielt auch die Abwanderung aus den einzelnen Regionen eine Rolle, sprich weniger Paare folglich weniger Kinder. Weitere Gründe sollten zusammen mit den Schülern analysiert und ahnad von weiterem Materialien erarbeitet werden.

 

Fragen zur graphischen Darstellung

Warum zeigt er die Farben nur dann in 16 verschiedenen Blautönen, wenn ich die Funktion von Tim nehme und nicht die einfache: clr = brewer(9, xxx)??? Wisst ihr eine Lösung?