Computerlingvistik: Metoder til visualisering af regional variation i sociale medier

Pia Quist, Dirk Hovy

Abstract

Med internettet og især sociale medier er det blevet muligt at analysere sprogbrug på grundlag af meget store mængder data. I dette kapitel præsenteres nogle ideer og metoder til hvordan big-data-potentialet i sociale medier kan bruges til at undersøge sproglig variation i Danmark. Ved at foretage kvantitative analyser af data fra Twitter og Trustpilot undersøges det hvordan man kan visualisere den sproglige variation der findes i data. Det sker ved at repræsentere forskellene på kort over Danmark. I kapitlet præsenteres data-dreven metode (data-driven method) som er en induktiv, kvantitativ tilgang til store datamængder, der går ud på at, uden forhåndsdefinerede hypoteser, at få mønstre og sammenhænge frem i datamaterialet. Casen, som vi præsentere i kapitlet, er eksplorativ og den første af sin art foretaget på danske data. Derfor præsenterer casen på én og samme tid ny forskning med nye erkendelser og er et eksempel på 'research in progress' som reelt rejser flere spørgsmål end den besvarer. Kapitlet giver en kort introduktion til computerlingvistik, dens metoder og erkendelsesinteresser, den konkrete case gennemgås relativt grundigt og en række nye forskningsspørgsmål og –perspektiver diskuteres.
Original languageDanish
Title of host publicationSociale Medier og Sprog : Analytiske tilgange
EditorsAndreas Stæhr, Kristine Køhler Mortensen
Number of pages23
Place of PublicationFrederiksberg
PublisherSamfundslitteratur
Publication date2018
Pages121-143
ISBN (Print)9788759325964
Publication statusPublished - 2018
SeriesMedier, Kommunikation, Journalistik
ISSN1904-271X

Cite this