Kan AI ersätta transkription? En jämförande studie av mått för Språklig stickprovsanalys (SSA) för barns narrativer

Söderbäck, Alva

Kan AI ersätta transkription? En jämförande studie av mått för Språklig stickprovsanalys (SSA) för barns narrativer

Mark

Söderbäck, Alva ^LU (2025) LOGM82 20251
Logopedics, Phoniatrics and Audiology

Abstract (Swedish): Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA).
Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna.
Resultat: En repeated-measures ANOVA visade att de två versionernas... (More); Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA).
Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna.
Resultat: En repeated-measures ANOVA visade att de två versionernas mått inte hade en signifikant skillnad. Parade t-test visade att det mått som stämde bäst överens mellan versionerna var MATTR, och det mått som stämde minst överens var MLU.
Slutsatser: Resultatet visade att AI-verktyget Whisper presterade väl och hade hög träffsäkerhet när det kommer till vissa språkliga mått som används i SSA. Framtida förbättrade AI-modeller förväntas prestera ännu bättre, och fortsatt forskning behövs. (Less)
Popular Abstract: Aims: To increase knowledge regarding how the use of AI-tools for transcription could be used to assess children’s language, and if any errors that the AI-tools make influence the measures used in language sample analysis (LSA) or not.
Method: Audio samples containing assessment of narrative development of children between the ages of three and six years were used. The audio samples were transcribed by using the AI-model “Whisper large-v2” in the programme aTrain. The transcription was split into two versions: one original version and one where any transcription errors were corrected. Then the measurements MLU, MATTR, SI and PGU, commonly used in LSA, were calculated for the two versions and compared.
Results: A repeated-measures ANOVA... (More); Aims: To increase knowledge regarding how the use of AI-tools for transcription could be used to assess children’s language, and if any errors that the AI-tools make influence the measures used in language sample analysis (LSA) or not.
Method: Audio samples containing assessment of narrative development of children between the ages of three and six years were used. The audio samples were transcribed by using the AI-model “Whisper large-v2” in the programme aTrain. The transcription was split into two versions: one original version and one where any transcription errors were corrected. Then the measurements MLU, MATTR, SI and PGU, commonly used in LSA, were calculated for the two versions and compared.
Results: A repeated-measures ANOVA showed no significant difference between the measures of the original and the corrected version. Paired t-tests showed that the measure with the least difference between versions was MATTR, and the measure with the largest difference was MLU.
Conclusions: The transcription-tool Whisper worked well and were reliable for some LSA-related measures. Future, improved AI-tools are expected to have less errors and therefore work even better, and more research on the subject is needed. (Less)

Please use this url to cite or link to this publication: http://lup.lub.lu.se/student-papers/record/9193399

author

Söderbäck, Alva ^LU

supervisor

Ketty Andersson ^LU

organization

Logopedics, Phoniatrics and Audiology

course

LOGM82 20251

year

2025

type

H1 - Master's Degree (One Year)

subject

Medicine and Health Sciences

keywords

taligenkänning, AI, narrativ förmåga, Språklig stickprovsanalys (SSA), barns språkutveckling

language

Swedish

id

9193399

date added to LUP

2025-06-16 08:23:06

date last changed

2025-06-16 08:23:06

@misc{9193399,
  abstract     = {{Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA). 
Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna.
Resultat: En repeated-measures ANOVA visade att de två versionernas mått inte hade en signifikant skillnad. Parade t-test visade att det mått som stämde bäst överens mellan versionerna var MATTR, och det mått som stämde minst överens var MLU.
Slutsatser: Resultatet visade att AI-verktyget Whisper presterade väl och hade hög träffsäkerhet när det kommer till vissa språkliga mått som används i SSA. Framtida förbättrade AI-modeller förväntas prestera ännu bättre, och fortsatt forskning behövs.}},
  author       = {{Söderbäck, Alva}},
  language     = {{swe}},
  note         = {{Student Paper}},
  title        = {{Kan AI ersätta transkription? En jämförande studie av mått för Språklig stickprovsanalys (SSA) för barns narrativer}},
  year         = {{2025}},
}

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Kan AI ersätta transkription? En jämförande studie av mått för Språklig stickprovsanalys (SSA) för barns narrativer