Schlagwort-Archive: Statistik

Namenlandschaften 2: Kleine Räume

Heute gibt es, wie ver­sprochen, Beispiele für Namen, die sehr klein­räu­mig ver­bre­it­et sind. Im ersten Teil zu Namen­land­schaften habe ich geschrieben:

Wenn ich in den Süden fahre, merke ich nicht nur am isch und kannsch und weisch, dass ich zuhause angekom­men bin, son­dern auch daran, dass die Leute plöt­zlich Him­mels­bach, Göp­pert und Ohne­mus heißen.

Vielle­icht hat ja jemand von euch die Namen schon kartiert und fest­gestellt, dass ich aus dem Orte­naukreis in Baden-Würt­tem­berg komme. Einen anderen Schluss lassen sie näm­lich wirk­lich nicht zu:

v.l.n.r.: Ohne­mus, Him­mels­bach, Göp­pert

Weiterlesen

Namenlandschaften 1: Große Flächen

Über die Feiertage ist mir mal wieder aufge­fall­en, wie prä­gend Namen für eine Gegend sein kön­nen. Wenn ich in den Süden fahre, merke ich nicht nur am isch und kannsch und weisch, dass ich zuhause angekom­men bin, son­dern auch daran, dass die Leute plöt­zlich Him­mels­bach, Göp­pert und Ohne­mus heißen.

Und tat­säch­lich sind alle Namen, die mir typ­isch vorka­men, in “meinem” Land­kreis oder einem direkt angren­zen­den mit Abstand am häu­fig­sten. Um noch mehr solch­er Namen zu find­en, habe ich dann die Face­book­fre­unde mein­er Ver­wandtschaft durchgeschaut, was sich als exzel­lente Strate­gie erwiesen hat. (Man kön­nte da richtig kreativ wer­den mit Face­bookpro­filen: Öffentlich zugängliche Pro­file mit Wohnor­tangaben automa­tisch auswerten und damit ein “Namen­pro­fil” eines Ortes erstellen. Namen von Leuten, die noch zur Schule gehen, kön­nten dabei ein stärk­eres Gewicht bekom­men, weil sie eher noch an ihrem Herkun­ft­sort leben. Oder Namen von Leuten, bei denen Wohn- und Schu­lort iden­tisch sind. Großstädte wer­den wegen der vie­len Umzieherei ignori­ert. Etc. Aber ich fürchte, das gren­zt dann schon an Ille­gal­ität und set­zt kein so gutes Zeichen in punc­to Daten­schutz.)

Wenn man nun Namen als typ­isch im Ver­dacht hat, wie kriegt man raus, wie häu­fig sie wo sind? Als am besten geeignet für solche Zwecke haben sich Dat­en aus elek­tro­n­is­chen Tele­fon­büch­ern her­aus­gestellt – darin sind die Namen ja ganz genau bes­timmten Postleitzahlen­bere­ichen zuge­ord­net. Mit­tels bes­timmter Com­put­er­pro­gramme kann man sie dann pri­ma auf ein­er Deutsch­land­karte verorten.

Ide­ale, aber lei­der nicht öffentlich zugängliche Möglichkeit­en dazu hat der Deutsche Fam­i­li­en­na­me­nat­las (ein Pro­jekt der Unis Mainz und Freiburg, mit Tele­fon­buch­dat­en von 2005), aber es gibt auch im Inter­net eine sehr brauch­bare Option, auf die ich hier schon ein­mal ver­wiesen habe, näm­lich Geogen (mit Tele­fon­buch­dat­en von 2002).

Unterteilt in zwei kleinere Beiträge will ich zunächst ein­mal zeigen, welche Namen es über­all gibt und bei welchen man trotz recht weit­er Ver­bre­itung großflächige Unter­schiede erken­nen kann (heute) und dann die ein­gangs erwäh­n­ten Namen zeigen, die für einen ganz bes­timmten Land­kreis typ­isch sind und son­st fast nir­gends in Deutsch­land auftreten (lat­er this week). Weit­er­lesen

[Werkzeug] Ngram Viewer

Beim Lan­guage Log wurde ja schon aus­führlich über das neuste Google-Spielzeug berichtet – man kann damit in einem Kor­pus, das einen Auszug aus Google­Books darstellt, nach Wörtern oder Wortket­ten suchen und sich ihren Häu­figkeitsver­lauf anzeigen lassen. Dabei wird die Gebrauchs­fre­quenz errech­net, indem das Gesuchte (das n-gram, wobei n für die Zahl der Wörter im Such­be­fehl ste­ht) durch die Gesamt­wortzahl des entsprechen­den Jahres geteilt wird.

Die Sache ist für uns aus vie­len tausend Grün­den prob­lema­tisch: wilde Textsorten­zusam­menset­zung des Kor­pus – aber für Englisch gibt es immer­hin Unterko­r­po­ra wie Fic­tion, Amer­i­can Eng­lish und British Eng­lish –, die Kor­pus­größe vari­iert stark, d.h. Funde zu einem rel­a­tiv frühen Zeit­punkt (z.B. 1800) schla­gen stärk­er zu Buche als später (z.B. 2000), auch wenn nor­mal­isiert wurde, …

Messer, Gabel, …

Ein paar mögliche Prob­leme habe ich mal mit der Suche nach “Messer,Gabel,Löffel” für 1900 bis 2000 durchge­spielt. Man kön­nte hier den Ein­druck erhal­ten, die Gabel trete am sel­tensten auf und das Mess­er sei enorm viel häu­figer (alle Dia­gramme führen direkt zur entsprechen­den Suchan­frage mit größeren Darstel­lun­gen):

Weit­er­lesen

1642: Das Jahr, da die teusch Sprach verderbt war

Wusstet Ihr, dass das Deutsche schon kaputt ist? Ich bin mir auch nicht sich­er, wie es der wach­samen Öffentlichkeit ent­ge­hen kon­nte, aber im Jahr 1642 spätestens war alles ver­dor­ben. Warum und wie? Aber ja, die lei­di­gen Fremd­wörter haben die Sprache ver­saut und dafür gesorgt, dass man sich nicht mehr ver­ständi­gen kon­nte. So zu lesen in diesem wun­der­baren Gedicht auf Wik­isource. Es richtet sich

Wider alle Sprachverder­ber / Cor­ti­sa­nen / Con­cip­is­ten vnd Con­cel­lis­ten / welche die alte teuotsche Mut­ter­sprach mit aller­ley frem­b­den / Lateinis­chen / Welschen / Span­nis­chen vnd Frantzö­sis­chen Wörtern so vielfältig ver­mis­chen / verkehren vnd zer­stehren / daß Sie jhr sel­ber nicht mehr gle­ich sihet / vnd kaum hal­ber kan erkant wer­den.

Schlümm, schlümm.

Was haben wir noch?

Nach diversen Beschimp­fun­gen geht es dann in Stro­phe 6 los mit einem Fremd­wort-ABC. Ich habe mir mal den Spaß gemacht, die ver­has­sten Wörter zu extrahieren und zu schauen, wie es heute um sie ste­ht. Von 294 Fremd­wörtern und -wen­dun­gen haben wir (je nach zugrun­degelegter Wortliste1) etwas mehr als ein Drit­tel behal­ten (116 bzw. 111).

Welche Rolle spielen sie?

Die Über­leben­den sind zwar meist noch als Fremd­wörter zu erken­nen, haben sich aber heute super inte­gri­ert. (Teil­weise auch mit drastis­chen Bedeu­tungsverän­derun­gen.) Viele gehören in spez­i­fis­che Bere­iche, wie z.B. zum Mil­itär: Weit­er­lesen