Schlagwort-Archive: Statistik

Namenlandschaften 2: Kleine Räume

Von Kristin Kopf

Heute gibt es, wie versprochen, Beispiele für Namen, die sehr kleinräumig verbreitet sind. Im ersten Teil zu Namenlandschaften habe ich geschrieben:

Wenn ich in den Süden fahre, merke ich nicht nur am isch und kannsch und weisch, dass ich zuhause angekommen bin, sondern auch daran, dass die Leute plötzlich Himmelsbach, Göppert und Ohnemus heißen.

Vielleicht hat ja jemand von euch die Namen schon kartiert und festgestellt, dass ich aus dem Ortenaukreis in Baden-Württemberg komme. Einen anderen Schluss lassen sie nämlich wirklich nicht zu:

v.l.n.r.: Ohnemus, Himmelsbach, Göppert

Weiterlesen →

Namenlandschaften 1: Große Flächen

Von Kristin Kopf

Über die Feiertage ist mir mal wieder aufgefallen, wie prägend Namen für eine Gegend sein können. Wenn ich in den Süden fahre, merke ich nicht nur am isch und kannsch und weisch, dass ich zuhause angekommen bin, sondern auch daran, dass die Leute plötzlich Himmelsbach, Göppert und Ohnemus heißen.

Und tatsächlich sind alle Namen, die mir typisch vorkamen, in “meinem” Landkreis oder einem direkt angrenzenden mit Abstand am häufigsten. Um noch mehr solcher Namen zu finden, habe ich dann die Facebookfreunde meiner Verwandtschaft durchgeschaut, was sich als exzellente Strategie erwiesen hat. (Man könnte da richtig kreativ werden mit Facebookprofilen: Öffentlich zugängliche Profile mit Wohnortangaben automatisch auswerten und damit ein “Namenprofil” eines Ortes erstellen. Namen von Leuten, die noch zur Schule gehen, könnten dabei ein stärkeres Gewicht bekommen, weil sie eher noch an ihrem Herkunftsort leben. Oder Namen von Leuten, bei denen Wohn- und Schulort identisch sind. Großstädte werden wegen der vielen Umzieherei ignoriert. Etc. Aber ich fürchte, das grenzt dann schon an Illegalität und setzt kein so gutes Zeichen in puncto Datenschutz.)

Wenn man nun Namen als typisch im Verdacht hat, wie kriegt man raus, wie häufig sie wo sind? Als am besten geeignet für solche Zwecke haben sich Daten aus elektronischen Telefonbüchern herausgestellt – darin sind die Namen ja ganz genau bestimmten Postleitzahlenbereichen zugeordnet. Mittels bestimmter Computerprogramme kann man sie dann prima auf einer Deutschlandkarte verorten.

Ideale, aber leider nicht öffentlich zugängliche Möglichkeiten dazu hat der Deutsche Familiennamenatlas (ein Projekt der Unis Mainz und Freiburg, mit Telefonbuchdaten von 2005), aber es gibt auch im Internet eine sehr brauchbare Option, auf die ich hier schon einmal verwiesen habe, nämlich Geogen (mit Telefonbuchdaten von 2002).

Unterteilt in zwei kleinere Beiträge will ich zunächst einmal zeigen, welche Namen es überall gibt und bei welchen man trotz recht weiter Verbreitung großflächige Unterschiede erkennen kann (heute) und dann die eingangs erwähnten Namen zeigen, die für einen ganz bestimmten Landkreis typisch sind und sonst fast nirgends in Deutschland auftreten (later this week). Weiterlesen →

[Werkzeug] Ngram Viewer

Von Kristin Kopf

Beim Language Log wurde ja schon ausführlich über das neuste Google-Spielzeug berichtet – man kann damit in einem Korpus, das einen Auszug aus GoogleBooks darstellt, nach Wörtern oder Wortketten suchen und sich ihren Häufigkeitsverlauf anzeigen lassen. Dabei wird die Gebrauchsfrequenz errechnet, indem das Gesuchte (das n‑gram, wobei n für die Zahl der Wörter im Suchbefehl steht) durch die Gesamtwortzahl des entsprechenden Jahres geteilt wird.

Die Sache ist für uns aus vielen tausend Gründen problematisch: wilde Textsortenzusammensetzung des Korpus – aber für Englisch gibt es immerhin Unterkorpora wie Fiction, American English und British English –, die Korpusgröße variiert stark, d.h. Funde zu einem relativ frühen Zeitpunkt (z.B. 1800) schlagen stärker zu Buche als später (z.B. 2000), auch wenn normalisiert wurde, …

Messer, Gabel, …

Ein paar mögliche Probleme habe ich mal mit der Suche nach “Messer,Gabel,Löffel” für 1900 bis 2000 durchgespielt. Man könnte hier den Eindruck erhalten, die Gabel trete am seltensten auf und das Messer sei enorm viel häufiger (alle Diagramme führen direkt zur entsprechenden Suchanfrage mit größeren Darstellungen):

Weiterlesen →

1642: Das Jahr, da die teusch Sprach verderbt war

Von Kristin Kopf

Wusstet Ihr, dass das Deutsche schon kaputt ist? Ich bin mir auch nicht sicher, wie es der wachsamen Öffentlichkeit entgehen konnte, aber im Jahr 1642 spätestens war alles verdorben. Warum und wie? Aber ja, die leidigen Fremdwörter haben die Sprache versaut und dafür gesorgt, dass man sich nicht mehr verständigen konnte. So zu lesen in diesem wunderbaren Gedicht auf Wikisource. Es richtet sich

Wider alle Sprachverderber / Cortisanen / Concipisten vnd Concellisten / welche die alte teu^otsche Muttersprach mit allerley frembden / Lateinischen / Welschen / Spannischen vnd Frantzösischen Wörtern so vielfältig vermischen / verkehren vnd zerstehren / daß Sie jhr selber nicht mehr gleich sihet / vnd kaum halber kan erkant werden.

Schlümm, schlümm.

Was haben wir noch?

Nach diversen Beschimpfungen geht es dann in Strophe 6 los mit einem Fremdwort-ABC. Ich habe mir mal den Spaß gemacht, die verhassten Wörter zu extrahieren und zu schauen, wie es heute um sie steht. Von 294 Fremdwörtern und ‑wendungen haben wir (je nach zugrundegelegter Wortliste¹) etwas mehr als ein Drittel behalten (116 bzw. 111).

Welche Rolle spielen sie?

Die Überlebenden sind zwar meist noch als Fremdwörter zu erkennen, haben sich aber heute super integriert. (Teilweise auch mit drastischen Bedeutungsveränderungen.) Viele gehören in spezifische Bereiche, wie z.B. zum Militär: Weiterlesen →