COSMAS II

Anfänglich wollte ich herausfinden, wie sich die Zusammenhänge und Begrifflichkeiten, die mit dem Wort “Wald” auftreten, seit 1900 verändert haben.

Dafür wären die Korpora geschriebener Gegenwartssprache des IDS gut geeignet. Mithilfe von  COSMAS II (Corpus Management und Analyse- Software) können die Sprachdaten genutzt werden. Das Korpus besitzt zwar ein Archiv bis 1900 im Umfang von 5,4 Mia. Wörtern, jedoch ist die Anzahl der Texte bzw. Quellen in diesem Korpus sehr gering am Anfang des 20. Jahrhunderts. Das bedeutet, dass es nicht aussagekräftig genug für die frühere Zeit gewesen wäre. Aus diesem Grund habe ich die Zeitspanne, die ich untersuchen werde, eingegrenzt. So ist Cosmas II für meine Zwecke wieder nutzbar. Es besteht hauptsächlich aus Zeitungen, aber auch Sachtexte, (populär-)wissenschaftliche Texte und Belletristik sind integriert und auch vollständig morphosyntaktisch annotiert.

Das Deutsche Referenzkorpus (als Grundlage für die über COSMAS II zugängliche IDS-Textsammlung) ist für meine Untersuchungen deshalb so interessant, da es, trotz Unausgewogenheit, das größte elektronische Korpus der deutschen Gegenwartssprache ist . So lassen sich beispielsweise “zeitliche und kontextuelle Schwankungen in der Verwendung von Wörtern entdecken” (Website ids-mannheim.de).

https://cosmas2.ids-mannheim.de/cosmas2-web/

Mithilfe von COSMAS II werde ich untersuchen, wie oft das Wort “Wald” seit 1950 aufgetreten ist. Zudem kann man mit diesem Korpus Kookurrenzanalysen machen, die sprachliche Einheiten aufzeigen, die in der Umgebung des gesuchten Wortes auftreten. So kann man z.B. die thematische Entwicklung erkennen, die seit 1950-1990 vonstatten ging.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>