Kategorie-Archiv: Datengrundlagen

Korpora

Wie man den Wortschatz im Lehrbuch schätzen, ob der für Lernende geeignet ist? Hier wird mit korpuslinguistischer Methoden analysiert. Denn die Wörter, die die Fremdsprachlerner beherrschen sollen, sind die, die häufigsten benutzt werden.

Als Korpuslinguistik bezeichnet man die Beschreibung von Äußerungen natürlicher Sprachen, ihrer Elemente und Strukturen, und die darauf aufbauende Theoriebildung auf der Grundlage von Analysen authentischer Texte, die in Korpora zusammengefasst sind. Korpuslinguistik ist eine wissenschaftliche Tätigkeit, d.h. sie muss wissenschaftlichen Prinzipien folgen und wissenschaftlichen Ansprüchen genügen. (Lemnitzer/Zinsmeier 2006: 9)

Bevor wir die Forschungsfrage: “Zu welchem Häufigkeitsklasse gehört das im Lehrbuch vermittelten Vokabular?” zu untersuchen, wird zuerst den Begriff Häufigkeitsklasse erklärt.

Häufigkeitsklasse ist ein statistisches Maß für die Gebrauchshäufigkeit eines Wortes in einer natürlichen Sprache oder in einem Sprachausschnitt.

Häufigkeitsklasse wird in Grundform eines Wortes untersucht, das heißt z.B. im Artikel steht das Wort Fragen, dann ist Grundform davon „Frage“. Bei Substantiven ist dies standardmäßig der Nominativ Singular, bei Verben der Infinitiv, bei Adjektiven der Positiv. Bezogen auf die Grundformenliste von DeReWo bedeutet das: Der bestimmte Artikel  der/die/das hat HK 0, die Grundform Frage weist HK 7 auf;  der Artikel der/die/das kommt demnach 2 hoch 8(=128) mal häufiger vor als Tag.(http://www.idsmannheim.de/kl/derewo/ (28.Jan 2014))

Je kleiner die Häufigkeitsklasse ist, desto frequenter ist also das Wort. Je kleiner zudem die Häufigkeitsklasse ist, desto weniger Wörter enthält sie: jede Klasse N enthält nach dem Zipfischen Gesetz ca. 2N Wörter.

QQ图片20140129210930

Die Untersuchung des Wortschatzes basiert auf Häufigkeitsklasse, weil die Wortschatz des Lehrbuches in Grundformen des Wortes gelistet wird.

Um die Häufigkeitsklasse von den Wörtern zu untersuchen, brucht man große Kopora. Deshalb arbeite ich mit dem Deutschen Referenzkorpus: DeReKo. DEREWO ist eine Sammlung verschiedener Wortformen- und Grundformenlisten, die unter besonderer Berücksichtigung der Gebrauchshäufigkeit in Form von Korpusfrequenz erstellt werden. DEREWO-Wortlisten basieren auf dem DEUTSCHEN REFERENZKORPUS. Das ist ein Programm in der Uni Mannheim, das große Kopura anbietet.

„Datengeleiteter Kernwortschatz Deutsch“ konzentriert auf das Grundwortschatz Deutsch. Diese Webseite basiert auf den Artikel aus Spiegel online und seniorentreff.de. Damit kann man ein Suchwort eingeben, und die HK des Wortes bekommen. Das Worter soll von HK0 bis HK14 sein, ansonst gibt es ein kleines Sternchen.

QQ截图20140129214946

 

http://www.basic-german.com/(28.Jan.2014)

Ich nehme ein chinesische Deutsch-Lehrwerke als Untersuchungsgegenstand. Das sind Studienweg Deutsch. Ich lerne Deutsch mit dem Buch „Studienweg Deutsch“ während des Bachlorstudiums. Das ist ein Buch für Studierende, die Deutsch als Hauptfach an der Uni lernen. Das ist ein 4 Bändiges Buch. Für Stufe a1 bis b2 sind 3 Bücher schon genug. Deshalb untersuche ich die ersten drei Bücher.

QQ截图20140130034637QQ截图20140310222246QQ截图20140310222005