Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Kan AI ersätta transkription? En jämförande studie av mått för Språklig stickprovsanalys (SSA) för barns narrativer

Söderbäck, Alva LU (2025) LOGM82 20251
Logopedics, Phoniatrics and Audiology
Abstract (Swedish)
Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA).
Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna.
Resultat: En repeated-measures ANOVA visade att de två versionernas... (More)
Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA).
Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna.
Resultat: En repeated-measures ANOVA visade att de två versionernas mått inte hade en signifikant skillnad. Parade t-test visade att det mått som stämde bäst överens mellan versionerna var MATTR, och det mått som stämde minst överens var MLU.
Slutsatser: Resultatet visade att AI-verktyget Whisper presterade väl och hade hög träffsäkerhet när det kommer till vissa språkliga mått som används i SSA. Framtida förbättrade AI-modeller förväntas prestera ännu bättre, och fortsatt forskning behövs. (Less)
Popular Abstract
Aims: To increase knowledge regarding how the use of AI-tools for transcription could be used to assess children’s language, and if any errors that the AI-tools make influence the measures used in language sample analysis (LSA) or not.
Method: Audio samples containing assessment of narrative development of children between the ages of three and six years were used. The audio samples were transcribed by using the AI-model “Whisper large-v2” in the programme aTrain. The transcription was split into two versions: one original version and one where any transcription errors were corrected. Then the measurements MLU, MATTR, SI and PGU, commonly used in LSA, were calculated for the two versions and compared.
Results: A repeated-measures ANOVA... (More)
Aims: To increase knowledge regarding how the use of AI-tools for transcription could be used to assess children’s language, and if any errors that the AI-tools make influence the measures used in language sample analysis (LSA) or not.
Method: Audio samples containing assessment of narrative development of children between the ages of three and six years were used. The audio samples were transcribed by using the AI-model “Whisper large-v2” in the programme aTrain. The transcription was split into two versions: one original version and one where any transcription errors were corrected. Then the measurements MLU, MATTR, SI and PGU, commonly used in LSA, were calculated for the two versions and compared.
Results: A repeated-measures ANOVA showed no significant difference between the measures of the original and the corrected version. Paired t-tests showed that the measure with the least difference between versions was MATTR, and the measure with the largest difference was MLU.
Conclusions: The transcription-tool Whisper worked well and were reliable for some LSA-related measures. Future, improved AI-tools are expected to have less errors and therefore work even better, and more research on the subject is needed. (Less)
Please use this url to cite or link to this publication:
author
Söderbäck, Alva LU
supervisor
organization
course
LOGM82 20251
year
type
H1 - Master's Degree (One Year)
subject
keywords
taligenkänning, AI, narrativ förmåga, Språklig stickprovsanalys (SSA), barns språkutveckling
language
Swedish
id
9193399
date added to LUP
2025-06-16 08:23:06
date last changed
2025-06-16 08:23:06
@misc{9193399,
  abstract     = {{Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA). 
Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna.
Resultat: En repeated-measures ANOVA visade att de två versionernas mått inte hade en signifikant skillnad. Parade t-test visade att det mått som stämde bäst överens mellan versionerna var MATTR, och det mått som stämde minst överens var MLU.
Slutsatser: Resultatet visade att AI-verktyget Whisper presterade väl och hade hög träffsäkerhet när det kommer till vissa språkliga mått som används i SSA. Framtida förbättrade AI-modeller förväntas prestera ännu bättre, och fortsatt forskning behövs.}},
  author       = {{Söderbäck, Alva}},
  language     = {{swe}},
  note         = {{Student Paper}},
  title        = {{Kan AI ersätta transkription? En jämförande studie av mått för Språklig stickprovsanalys (SSA) för barns narrativer}},
  year         = {{2025}},
}