Corpus of American Danish (CoAmDa)

Danske Stemmer-projektets database, Corpus of American Danish (CoAmDa), huses af Sprogforandringscentret ved Københavns Universitet (KUCSS), og det indgår i Sprogforandringscentrets korpus og dets korpusstruktur. Optagelserne i CoAmDa er udskrevet i programmet Transcriber og knyttet til en lydfil i Praat. Per 1. februar 2017 indeholder CoAmDa ca. 180 timers optagelser af 311 talere som samlet udgør knap 1,5 millioner ord. Korpusset er opmærket for sprog, dvs. om et ord er dansk, engelsk, spansk eller en blanding.

Corpus of North American Danish

Den nordamerikanske del af korpusset (Corpus of North American Danish, CoNAmDa) omfatter ca. 80 timer og 230 talere. Disse data har vi overtaget efter andre forskere og projekter:

  • Lektor Iver Kjær (Københavns Universitet) og professor Mogens Baumann Larsens (Aalborg Universitet) store dataindsamling fra USA og Canada fra 1960’erne og til 1980’erne. De optog 23 dansktalende udvandrere eller disses efterkommere i Canada, og 179 i USA. Heraf indgår 194 personer i korpus. 
  • Professor Tore Kristiansens (Københavns Universitet) optagelser af i alt 40 personer i Solvang, Californien, fra starten af 1990’erne. Heraf indgår optagelser med 12 personer i korpusset. 
  • Professor emeritus Christopher Hales (University of Alberta, Edmonton) optagelser af 24 dansktalende i New Denmark, New Brunswick, Canada, sidst i 1990’erne, som alle indgår i korpus.

CoAmDa repræsenterer talere født mellem 1870 og 1941, både danskfødte udvandrere og deres amerikansk- eller canadiskfødte efterkommere. Læs mere om de danske udvandrere i Nordamerika. Data har foreligget i form af spolebånd og kassettebånd. For at sikre og bevare optagelserne for eftertiden er de blevet digitaliseret (læs mere om digitaliseringen, og om muligheden for at få dine egne data digitaliseret).

Corpus of South American Danish

De argentinske data har deltagerne i Danske Stemmer-projektet Jan Heegård, Karoline Kühl og ph.d-studerende Anna Sofie Hartling samt konsulent Jon Albris indsamlet på flere rejser i 2014 og 2015. Læs mere om de danske udvandreres bosættelser og optagelsessteder her. Corpus of South American Danish (CoSAmDa) omfatter ca. 100 timer og 81 talere, som er født mellem 1911 og 1971.