Computerlingvistik: Metoder til visualisering af regional variation i sociale medier

Pia Quist, Dirk Hovy

Abstract

Med internettet og især sociale medier er det blevet muligt at analysere sprogbrug på grundlag af meget store mængder data. I dette kapitel præsenteres nogle ideer og metoder til hvordan big-data-potentialet i sociale medier kan bruges til at undersøge sproglig variation i Danmark. Ved at foretage kvantitative analyser af data fra Twitter og Trustpilot undersøges det hvordan man kan visualisere den sproglige variation der findes i data. Det sker ved at repræsentere forskellene på kort over Danmark. I kapitlet præsenteres data-dreven metode (data-driven method) som er en induktiv, kvantitativ tilgang til store datamængder, der går ud på at, uden forhåndsdefinerede hypoteser, at få mønstre og sammenhænge frem i datamaterialet. Casen, som vi præsentere i kapitlet, er eksplorativ og den første af sin art foretaget på danske data. Derfor præsenterer casen på én og samme tid ny forskning med nye erkendelser og er et eksempel på 'research in progress' som reelt rejser flere spørgsmål end den besvarer. Kapitlet giver en kort introduktion til computerlingvistik, dens metoder og erkendelsesinteresser, den konkrete case gennemgås relativt grundigt og en række nye forskningsspørgsmål og –perspektiver diskuteres.
OriginalsprogDansk
TitelSociale Medier og Sprog : Analytiske tilgange
RedaktørerAndreas Stæhr, Kristine Køhler Mortensen
Antal sider23
UdgivelsesstedFrederiksberg
ForlagSamfundslitteratur
Publikationsdato2018
Sider121-143
ISBN (Trykt)9788759325964
StatusUdgivet - 2018
NavnMedier, Kommunikation, Journalistik
ISSN1904-271X

Citationsformater