Unvorstellbare zwei Millionen Blogposts werden Schätzungen zufolge jeden Tag im Internet veröffentlicht. Zählt man da die Artikel von klassischen Medien wie Zeitungen dazu, steigt die Menge von veröffentlichten Texten ins Unermessliche. Für alle, die sich mit der Erforschung von Sprache befassen, ist das ein einmaliger Datenschatz – der sich dank Digitalisierung nun auch für die Linguistik viel leichter heben lässt.
Für Sprachwissenschaftler wie Ursula Doleschal, die an der Alpen-Adria-Universität in Klagenfurt forscht, hat die zunehmende Verfügbarkeit von Texten in digitalisierter Form einiges an ihrer Arbeit verändert, vor allem aber erleichtert: „Wir haben neue Werkzeuge in die Hand bekommen, mit denen wir Sprache analysieren können. Wir können nun auf wirklich große Datenmengen zugreifen, das war vor der Digitalisierung in der Form nicht möglich“, sagt Doleschal.
Spracherkennung und Schreiberkennung sind Beispiele dafür, wozu die Linguistik mittlerweile in der Lage ist. Enorme Textkörper, etwa Kommentare und Forenpostings aus dem Internet, können im großen Stil analysiert werden. „Spezialisten können anhand anonymer Texte herausfinden, wie alt die Verfasser sind, welchen sozialen Hintergrund sie haben, welchen Gruppen sie zugehörig sind“, sagt Doleschal. Interesse für solches Wissen besteht vielseits –nicht zuletzt bei Technikern, die sich aufgrund der Sprachsteuerung von Geräten immer eingehender mit Sprache beschäftigen müssen.
Die Linguistik beschäftigt sich ihrerseits aber auch mit den Fragen, wie sich Sprache entwickelt und verändert, wie Menschen damit umgehen, und wie sie am besten geregelt werden kann. „Die Sprachwissenschaft zeigt auf, wo sich Menschen mit den Rechtschreibregelungen schwertun und macht Vorschläge, wie diese Regeln angepasst werden können“, sagt Doleschal. Auch wie Sprachen besser unterrichtet werden können, fällt in ihren Forschungsbereich.