Über welche Drogenerfahrungen wird am häufigsten berichtet?

Zu Beginn des Projektes interessierte uns vor allem, über welche Drogen am öftesten im Internet berichtet wird. Würde die Volksdroge Nr. 1 auch hier Spitzenreiter sein oder berichtet man im Internet nur über verbotene Substanzen? Würde sich der momentane mediale Hype um Crystal auch in unseren Daten niederschlagen? Wie untersucht man solche Fragen überhaupt? Und wie visualisiert man die Ergebnisse auf eine derartige Weise, dass auch ein der Thematik unbewanderter Rezipient Erkenntnisse daraus ziehen kann?

Das Land-der-Träume-Korpus ist nicht zuletzt auch insofern eine dankbare Untersuchungsgrundlage, da die knapp 4000 Tripberichte nach den darin beschriebenen Drogen kategorisiert sind, sodass ebendiese Drogenkategorien anschließend miteinander verglichen werden können. Allerdings sind die Einzeltexte nicht zwingend nur einer einzelnen Substanz zugeordnet, vielmehr kann der User selbst auswählen, ob es sich bei seinem Bericht um die Beschreibung eines isoliert konsumierten Mittels oder um eine Narration zu Auswirkungen eines Mischkonsums handelt. Um das Problem noch zu verkomplizieren, ist es dem Autor weiterhin möglich, die Reihenfolge der konsumierten Substanzen festzulegen. Ein Tripbericht über Mischkonsum von Cannabis und LSD wäre demnach anders einzuschätzen als einer über Mischkonsum von LSD und Cannabis – und zudem ist es unklar, ob es sich bei der festgelegten Reihenfolge um eine chronologische, quantitative oder qualitative Kategorisierung handelt. Überdies ist der Mischkonsum nicht auf zwei Elemente festgelegt, sondern kann beliebig viele Ingredienzien beinhalten:

Beispiel für Mischkonsum

Für die Untersuchung stellte sich uns folglich gleich vorweg die Frage, wie wir mit dieser Art von Textklassifikation umgehen sollten. Zum einen wollten wir einen “ungeschminkten” Sprachgebrauch untersuchen, der in den nach verschiedenen Substanzen kategorisierten Texte vorliegt. Dafür sind die Berichte über Mischkonsum mehr oder minder unbrauchbar. Zum anderen stand es natürlich auch nicht zur Debatte, jene Texte einfach wegfallen zu lassen, ohne adäquat ihre inhärente Kategorienverteilung zu untersuchen. Stichwort: USE ALL THE DATA

Das weitere Vorgehen bestand also darin, zunächst eine Rangliste der am häufigsten vorkommenden Tripberichte zu erstellen, die zu folgendem Ergebnis gelangte:

  1. Psilocybinhaltige Pilze 275
  2. Cannabis 239
  3. DXM 230
  4. Salvia Divinorum 107
  5. LSD 105
  6. Mischkonsum von Psilocybinhaltige Pilze und Cannabis 99
  7. Hawaiianische Baby-Holzrose 98
  8. Ecstasy 85
  9. DHM 70
  10. Mischkonsum von DXM und Cannabis 53
  11. Speed 47
  12. 2C-B 41
  13. Research Chemical 41
  14. Katzenminze 41
  15. Kratom 38
  16. Mischkonsum von DXM und DHM 37
  17. MDMA 37
  18. Mischkonsum von LSD und Cannabis 37
  19. Lachgas 34
  20. Muskatnuss 34
  21. keine Angabe 33
  22. Alkohol 31
  23. Mischkonsum von Ecstasy und Cannabis 30
  24. Mischkonsum von Cannabis und Psilocybinhaltige Pilze 30
  25. Mischkonsum von Cannabis und Alkohol 29
  26. … et cetera

Hinsichtlich unserer eingangs referierten Fragestellung ist hier bereits ein erstes Ergebnis zu verzeichnen: Alkohol landet auf einem abgeschlagenen 22. Platz, nur sieben Texte beschäftigen sich mit Crystal, was den 75. Rang bedeutet. Doch sind die Ergebnisse nur bedingt befriedigend, denn die Unübersichtlichkeit einer solchen Liste ist bereits hier im Blog ersichtlich: Um Werte aus dem oberen und unteren Ende der Aufzählung miteinander zu vergleichen, muss hoch und runter gescrollt werden, die rein numerischen Angaben lassen keine auf einen Blick fassbare Relationalität erkennen. Neben den rein optischen Mängeln ist außerdem die Aussagekraft der aus dem <drug>foo</drug> gewonnen xml-Tag dürftig: Es werden lediglich die absoluten Vorkommen jeder einzelnen Kombination gezählt, ohne die absolute Häufigkeit der sowohl einzeln als auch im Mischkonsum genannten Drogen zu berücksichtigen. Um die absolute Frequenz jeder kategorisierenden Drogennennung zu eruieren – sei es als Einzelvorkommen oder als Teil eines Mischkonsums – musste das Korpus mittels Perl-Scripts getrennt nach den Drogen im Einzelgebrauch und den Drogen im Mischkonsum durchforstet werden. Dieses Beispiel-Script extrahiert aus unserem Korpus sämtliche Nennungen von Drogen im Mischkonsum, zählt sie und gibt eine nach Anzahl geordnete Tabelle ähnlich der obigen als Output aus. Mit geringen Anpassungen lässt sich dieses Script auch für die Extraktion von beliebigen anderen Daten verwenden, so zum Beispiel für den Einzelkonsum.

Die absolute Häufigkeit der Drogenkategorien in Tripberichten auf Land der Träume bekommt man durch das Addieren der beiden jeweiligen Werte, jedoch gehen dadurch bereits gesammelte Informationen verloren: Mit einer Visualisierung der bereits gewonnenen Statistiken lässt sich dasselbe Ziel ohne Informationsverlust erreichen. Dafür braucht man lediglich eine entsprechend sortierte CSV-Datei und ein relativ kurzes Script für R:

Gestapeltes Balkendiagramm

Aus diesem mit RStudio erstellten Balkendiagramm ist durch die Sortierung nach Länge auf einen Blick ersichtlich, welche Droge am häufigsten zur Kategorisierung von Tripberichten verwendet wird, zudem ist das Verhältnis zwischen dem Auftreten in Mischkonsum- und Nicht-Mischkonsum-Kontexten ersichtlich. Des Weiteren zeigen sich vollkommen andere Ergebnisse als mit dem bloßen Auszählen des <drug>-Tags: Alkohol springt durch das berücksichtigte Auftreten im Mischkonsum auf den zweiten Platz, der Anteil von alkoholbezogenen Berichten ist also viel höher als zunächst angenommen, wenn man nicht nur reine Trinkgelage berücksichtigt. Cannabis steht mit überwältigendem Vorsprung an erster Stelle, sowohl was die Gesamtanzahl als auch den Mischkonsum angeht. Es lässt sich noch mehr aus diesem Graphen herauslesen: So scheinen psychedelische Drogen wie Psilocybinhaltige Pilze, DXM, Hawaiianische Babyholzrose und Salvia Divinorum in den Tripberichten eine höhere Tendenz zum Einzelkonsum zu besitzen (bei LSD und DHM ist die Tendenz nicht ganz so deutlich, aber auch vorhanden). Für Cannabis, Alkohol, Speed, Tabak und Kokain gilt laut den analysierten Daten das Gegenteil, jedoch sollte man daraus nicht ableiten, dass sie anscheinend eher in Kombination mit anderen Substanzen eingenommen als alleine. Der Rückschluss von den hier präsentierten Ergebnissen auf gesamtgesellschaftliche Konsumgewohnheiten ist nicht zulässig, da a) wahrscheinlich auf einer Internetplattform wie Land der Träume eine speziell stratifizierte Nutzergruppe zu finden ist, b) Tripberichte vermutlich nur dann überhaupt erstellt werden, wenn es etwas besonders Berichtenswertes darüber zu sagen gibt.

So stellt sich an dieser Stelle beispielsweise auch die Frage, wo denn das zu Beginn angesprochene Crystal im Schaubild abgeblieben ist: Es rangiert mit insgesamt 44 Beiträgen auf Platz 26 der häufigsten Tripberichte der Land-der-Träume-Community. Wie bereits im About-Bereich erwähnt, steht das Experimentieren mit und die technische Umsetzbarkeit von sprachdatenbezogenen Visualisierungen im Vordergrund dieses Projekts, weswegen hier nicht der Ort ist, um über Ursachen und Hintergründe der gewonnenen Einzelergebnisse zu mutmaßen: Korpusuntersuchungen und Visualisierungen sind letztlich auch konstruktive Akte, die ihre Untersuchungsgrundlage zumindest partiell auch selbst erzeugen. Ohne eine gründliche theoretische Auseinandersetzung mit sowohl den jeweiligen Daten (auch den nicht berücksichtigten) als auch der gewählten Methodik sollte nicht mehr als eine erste, vorsichtige Interpretationshandreichung formuliert werden.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>