Computerlingvistik: Metoder til visualisering af regional variation i sociale medier

Pia Quist; Dirk Hovy

Computerlingvistik: Metoder til visualisering af regional variation i sociale medier

Abstract

Med internettet og især sociale medier er det blevet muligt at analysere sprogbrug på grundlag af meget store mængder data. I dette kapitel præsenteres nogle ideer og metoder til hvordan big-data-potentialet i sociale medier kan bruges til at undersøge sproglig variation i Danmark. Ved at foretage kvantitative analyser af data fra Twitter og Trustpilot undersøges det hvordan man kan visualisere den sproglige variation der findes i data. Det sker ved at repræsentere forskellene på kort over Danmark. I kapitlet præsenteres data-dreven metode (data-driven method) som er en induktiv, kvantitativ tilgang til store datamængder, der går ud på at, uden forhåndsdefinerede hypoteser, at få mønstre og sammenhænge frem i datamaterialet. Casen, som vi præsentere i kapitlet, er eksplorativ og den første af sin art foretaget på danske data. Derfor præsenterer casen på én og samme tid ny forskning med nye erkendelser og er et eksempel på 'research in progress' som reelt rejser flere spørgsmål end den besvarer. Kapitlet giver en kort introduktion til computerlingvistik, dens metoder og erkendelsesinteresser, den konkrete case gennemgås relativt grundigt og en række nye forskningsspørgsmål og –perspektiver diskuteres.

Original language	Danish
Title of host publication	Sociale Medier og Sprog : Analytiske tilgange
Editors	Andreas Stæhr, Kristine Køhler Mortensen
Number of pages	23
Place of Publication	Frederiksberg
Publisher	Samfundslitteratur
Publication date	2018
Pages	121-143
ISBN (Print)	9788759325964
Publication status	Published - 2018

Series	Medier, Kommunikation, Journalistik
ISSN	1904-271X

Cite this

Computerlingvistik: Metoder til visualisering af regional variation i sociale medier. / Quist, Pia; Hovy, Dirk.
Sociale Medier og Sprog: Analytiske tilgange. ed. / Andreas Stæhr; Kristine Køhler Mortensen. Frederiksberg: Samfundslitteratur, 2018. p. 121-143 (Medier, Kommunikation, Journalistik).

Research output: Chapter in Book/Report/Conference proceeding › Book chapter › Research › peer-review

@inbook{ca3a95dba67248aa9d50ef49359048f8,

title = "Computerlingvistik: Metoder til visualisering af regional variation i sociale medier",

abstract = "Med internettet og is{\ae}r sociale medier er det blevet muligt at analysere sprogbrug p{\aa} grundlag af meget store m{\ae}ngder data. I dette kapitel pr{\ae}senteres nogle ideer og metoder til hvordan big-data-potentialet i sociale medier kan bruges til at unders{\o}ge sproglig variation i Danmark. Ved at foretage kvantitative analyser af data fra Twitter og Trustpilot unders{\o}ges det hvordan man kan visualisere den sproglige variation der findes i data. Det sker ved at repr{\ae}sentere forskellene p{\aa} kort over Danmark. I kapitlet pr{\ae}senteres data-dreven metode (data-driven method) som er en induktiv, kvantitativ tilgang til store datam{\ae}ngder, der g{\aa}r ud p{\aa} at, uden forh{\aa}ndsdefinerede hypoteser, at f{\aa} m{\o}nstre og sammenh{\ae}nge frem i datamaterialet. Casen, som vi pr{\ae}sentere i kapitlet, er eksplorativ og den f{\o}rste af sin art foretaget p{\aa} danske data. Derfor pr{\ae}senterer casen p{\aa} {\'e}n og samme tid ny forskning med nye erkendelser og er et eksempel p{\aa} 'research in progress' som reelt rejser flere sp{\o}rgsm{\aa}l end den besvarer. Kapitlet giver en kort introduktion til computerlingvistik, dens metoder og erkendelsesinteresser, den konkrete case gennemg{\aa}s relativt grundigt og en r{\ae}kke nye forskningssp{\o}rgsm{\aa}l og –perspektiver diskuteres. ",

author = "Pia Quist and Dirk Hovy",

year = "2018",

language = "Dansk",

isbn = "9788759325964",

series = "Medier, Kommunikation, Journalistik",

publisher = "Samfundslitteratur",

pages = "121--143",

editor = "Andreas St{\ae}hr and Mortensen, {Kristine K{\o}hler}",

booktitle = "Sociale Medier og Sprog",

}

TY - CHAP

T1 - Computerlingvistik

T2 - Metoder til visualisering af regional variation i sociale medier

AU - Quist, Pia

AU - Hovy, Dirk

PY - 2018

Y1 - 2018

N2 - Med internettet og især sociale medier er det blevet muligt at analysere sprogbrug på grundlag af meget store mængder data. I dette kapitel præsenteres nogle ideer og metoder til hvordan big-data-potentialet i sociale medier kan bruges til at undersøge sproglig variation i Danmark. Ved at foretage kvantitative analyser af data fra Twitter og Trustpilot undersøges det hvordan man kan visualisere den sproglige variation der findes i data. Det sker ved at repræsentere forskellene på kort over Danmark. I kapitlet præsenteres data-dreven metode (data-driven method) som er en induktiv, kvantitativ tilgang til store datamængder, der går ud på at, uden forhåndsdefinerede hypoteser, at få mønstre og sammenhænge frem i datamaterialet. Casen, som vi præsentere i kapitlet, er eksplorativ og den første af sin art foretaget på danske data. Derfor præsenterer casen på én og samme tid ny forskning med nye erkendelser og er et eksempel på 'research in progress' som reelt rejser flere spørgsmål end den besvarer. Kapitlet giver en kort introduktion til computerlingvistik, dens metoder og erkendelsesinteresser, den konkrete case gennemgås relativt grundigt og en række nye forskningsspørgsmål og –perspektiver diskuteres.

AB - Med internettet og især sociale medier er det blevet muligt at analysere sprogbrug på grundlag af meget store mængder data. I dette kapitel præsenteres nogle ideer og metoder til hvordan big-data-potentialet i sociale medier kan bruges til at undersøge sproglig variation i Danmark. Ved at foretage kvantitative analyser af data fra Twitter og Trustpilot undersøges det hvordan man kan visualisere den sproglige variation der findes i data. Det sker ved at repræsentere forskellene på kort over Danmark. I kapitlet præsenteres data-dreven metode (data-driven method) som er en induktiv, kvantitativ tilgang til store datamængder, der går ud på at, uden forhåndsdefinerede hypoteser, at få mønstre og sammenhænge frem i datamaterialet. Casen, som vi præsentere i kapitlet, er eksplorativ og den første af sin art foretaget på danske data. Derfor præsenterer casen på én og samme tid ny forskning med nye erkendelser og er et eksempel på 'research in progress' som reelt rejser flere spørgsmål end den besvarer. Kapitlet giver en kort introduktion til computerlingvistik, dens metoder og erkendelsesinteresser, den konkrete case gennemgås relativt grundigt og en række nye forskningsspørgsmål og –perspektiver diskuteres.

M3 - Bidrag til bog/antologi

SN - 9788759325964

T3 - Medier, Kommunikation, Journalistik

SP - 121

EP - 143

BT - Sociale Medier og Sprog

A2 - Stæhr, Andreas

A2 - Mortensen, Kristine Køhler

PB - Samfundslitteratur

CY - Frederiksberg

ER -