Spaß mit R und Berlin Open Data I: Die Zuwendungsdatenbank

Zur Zeit beschäftige ich mich mit der statistischen Programmiersprache R, und weil das Üben mit echten Datensätzen mehr Spaß macht, habe ich mir auf OpenData Berlin einen interessanten Datensatz herausgesucht – die Zuwendungsdatenbank.

In der Zuwendungsdatenbank werden die von den Behörden ausgereichten Zuwendungen an juristische Personen veröffentlicht (ab einem Zuwendungsbetrag i. H. v. 100 Euro rückwirkend für die letzten 5 Jahre), aktuell die Zuwendungen des Jahres 2016.

Der Datensatz ist schön groß: 40.820 Zeilen, also Zuwendungen mit zehn (eigentlich neun – id ist nur eine fortlaufende Nummer) Variablen:
[1] "id" "name" "geber" "art" "jahr" "anschrift"
[7] "politikbereich" "zweck" "betrag" "empfaengerid"

Zunächst werfe ich einen Blick in die Spalte betrag:
summary(all$betrag)
Min. 1st Qu. Median Mean 3rd Qu. Max.
100 4673 16477 229216 61176 487261162

Der Mindestbetrag liegt bei 100 €, das wusste ich schon aus der Beschreibung des Datensatzes. Die Höchstzuwendung liegt bei stattlichen 487.261.162 €. Wer hat die erhalten und wofür?
> all[all$betrag == max(all$betrag),]

id name geber art jahr
9445 18889 BVG Senatsverwaltung für Stadtentwicklung und Umwelt Projektförderung 2013
anschrift politikbereich zweck betrag empfaengerid
9445 Holzmarktstraße 15-17, 10179 Berlin Verkehr U 8; Nord 487261162 hra_031152

Die BVG erhielt den Betrag für den Zweck „U 8; Nord“ in 2013.

Wieviel wurde insgesamt zugewendet?
> sum(as.numeric(all$betrag))
[1] 9356595690

Der Datensatz bildet also 9.356.595.690 € Gesamtzuwendungen in den Jahren 2012 bis 2016 ab.

Damit es auch mal etwas komplizierter wird, habe ich ein kleines Skript geschrieben, welches für jeden in der Spalte name vorkommenden Empfänger die Häufigkeit zählt, mit der er Zuwendungen erhalten hat. Das wird am Schluss per summary ausgegeben:

x <- unique(all$name)
vec <- c()
for (i in 1:length(x)) { vec <- c(vec,nrow(all[all$name == x[i],])) }
summary(vec)

Min. 1st Qu. Median Mean 3rd Qu. Max.
1.0 1.0 2.0 4.4 4.0 667.0

Die Mindestzahl an Zuwendungen liegt erwartbar bei 1, das Maximum hingegen bei imposanten 667. Inzwischen überrascht es niemanden mehr: Empfängerin war auch hier die BVG.

Fortsetzung folgt

Denn, so der Zweckverband Nahverkehr Westfalen-Lippe (NWL), künftig würden IC-Züge zwischen Berlin und Amsterdam nicht mehr in Minden, Bad Oeynhausen und Bünde halten. Auch um den Fortbestand des ICE-Haltes in Bielefeld gibt es Spekulationen. Zudem soll der planmäßige Betrieb etlicher Nahverkehrszüge gefährdet sein.

Mal eben eine komplette Region in Hannover/Osnabrück/Hamm umsteigen lassen. Keine gute Idee… wozu überhaupt noch Züge irgendwo halten lassen?

Quelle

Gelesen: Robert Menasse – Die Hauptstadt

Die Art von Buch, die sich wie Schwerstarbeit anfühlt. Also für den Autoren. Für mich als Leser war Die Hauptstadt – trotz vieler Hauptfiguren, nicht markierter wörtlicher Rede, vieler europäischer Sprachen und Ausführungen zu zahllosen Themen – außerordentlich flüssig zu lesen.

Alles ist hier Geschichte. Die Figuren bestehen aus der Geschichte ihrer Herkunft oder ihrer Väter und Großväter, die EU-Kommission ist Geschichte, derer sie sich bürokratisch-schwerfällig zu erinnern versucht, Europa selbst ist Geschichte. Das ist nichts abwegiges und verleiht allen Personen, Orten und Institutionen besondere Plastizität. Aber es ist eben auch vollkommen frei von Zukunft (und darum vielleicht umso treffender).

Was stört – und zwar nicht von ungefähr: Es gibt einen Kriminalfall in dieser Geschichte, der in eine hanebüchene Räuberpistole mündet, wie man sie eher in Dan Brown-Geschichten und/oder besonders schlechten „Tatort“-Filmen vermutet. Ich hoffte bis zum Schluss gegen alle Evidenz, dass das eine Finte oder Einbildung der Figuren sei. Sollte das zu den satirischen Einsprenkseln des Romans gehören, hat es sich mir absolut nicht erschlossen.

Davon ab: Bitte gerne lesen.

Gelesen: Ursula K. Le Guin – The Telling

59921Nach The Left Hand of Darkness und The Dispossessed ein weiterer Band aus Le Guins Hainish Zyklus.

Am interessantesten an Le Guins Science Fiction finde ich, dass die SciFi-Motive in ihren Erzählungen komplett in den Hintergrund rücken; ohne, dass das Genre verleugnet wird, oder man den Eindruck bekommt, es wäre der Autorin eigentlich peinlich. Das Ekumen ist ein loser Verbund von Welten, die vor sehr langer Zeit von Menschen besiedelt wurden und seitdem ihre Herkunft vergessen haben. Die kommen ursprünglich von der Welt Hain und auch die Erde ist eine dieser Kolonien.

Grundmotiv des Hainish Zyklus ist die Wiederentdeckung dieser Welten durch Hain, die Kontaktaufnahme und Integration in das Ekumen. In jedem Band und auf jeder Welt wird ein bestimmtes soziales, antropologisches Thema durchgespielt. Le Guin schreibt daher weniger Science als vielmehr Social Fiction.

The Telling nun lässt sich am ehesten mit Religion oder Tradition in Verbindung bringen. Vorbild war (wie ich nach der Lektüre gelesen habe) China zur Zeit des Großen Sprung nach vorn. Hier ist es die Welt Aka, auf der die Tradition erbarmungslos von einem zentralistischen Weltstaat verfolgt und ausgemerzt wird. Einschließlich Bücherverbrennungen, Arbeitslagern und Steinigungen. Nur im Verbogenen besteht das alte Wissen fort. Dieser Konflikt Tradition vs. Moderne wird im Verlauf der Novelle ausgerollt – und zwar über weite Teile leider recht plump. Schließlich ist Moderne nicht per se mit autokratischer Gewaltherrschaft verknüpft. Erst zum Ende hin wird auch die traditionelle Denkweise (mit der Le Guin unverkennbar sympathisiert) ein wenig problematisiert.