Kan AI ersätta transkription? En jämförande studie av mått för Språklig stickprovsanalys (SSA) för barns narrativer
(2025) LOGM82 20251Logopedics, Phoniatrics and Audiology
- Abstract (Swedish)
- Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA).
Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna.
Resultat: En repeated-measures ANOVA visade att de två versionernas... (More) - Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA).
Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna.
Resultat: En repeated-measures ANOVA visade att de två versionernas mått inte hade en signifikant skillnad. Parade t-test visade att det mått som stämde bäst överens mellan versionerna var MATTR, och det mått som stämde minst överens var MLU.
Slutsatser: Resultatet visade att AI-verktyget Whisper presterade väl och hade hög träffsäkerhet när det kommer till vissa språkliga mått som används i SSA. Framtida förbättrade AI-modeller förväntas prestera ännu bättre, och fortsatt forskning behövs. (Less) - Popular Abstract
- Aims: To increase knowledge regarding how the use of AI-tools for transcription could be used to assess children’s language, and if any errors that the AI-tools make influence the measures used in language sample analysis (LSA) or not.
Method: Audio samples containing assessment of narrative development of children between the ages of three and six years were used. The audio samples were transcribed by using the AI-model “Whisper large-v2” in the programme aTrain. The transcription was split into two versions: one original version and one where any transcription errors were corrected. Then the measurements MLU, MATTR, SI and PGU, commonly used in LSA, were calculated for the two versions and compared.
Results: A repeated-measures ANOVA... (More) - Aims: To increase knowledge regarding how the use of AI-tools for transcription could be used to assess children’s language, and if any errors that the AI-tools make influence the measures used in language sample analysis (LSA) or not.
Method: Audio samples containing assessment of narrative development of children between the ages of three and six years were used. The audio samples were transcribed by using the AI-model “Whisper large-v2” in the programme aTrain. The transcription was split into two versions: one original version and one where any transcription errors were corrected. Then the measurements MLU, MATTR, SI and PGU, commonly used in LSA, were calculated for the two versions and compared.
Results: A repeated-measures ANOVA showed no significant difference between the measures of the original and the corrected version. Paired t-tests showed that the measure with the least difference between versions was MATTR, and the measure with the largest difference was MLU.
Conclusions: The transcription-tool Whisper worked well and were reliable for some LSA-related measures. Future, improved AI-tools are expected to have less errors and therefore work even better, and more research on the subject is needed. (Less)
Please use this url to cite or link to this publication:
http://lup.lub.lu.se/student-papers/record/9193399
- author
- Söderbäck, Alva LU
- supervisor
- organization
- course
- LOGM82 20251
- year
- 2025
- type
- H1 - Master's Degree (One Year)
- subject
- keywords
- taligenkänning, AI, narrativ förmåga, Språklig stickprovsanalys (SSA), barns språkutveckling
- language
- Swedish
- id
- 9193399
- date added to LUP
- 2025-06-16 08:23:06
- date last changed
- 2025-06-16 08:23:06
@misc{9193399, abstract = {{Syfte: Att öka kunskapen om hur AI-verktyg för transkription kan användas i arbetet med att bedöma barns språkliga förmågor, samt undersöka huruvida de fel som AI-taligenkänningsproducerade transkriptioner innehåller påverkar de språkliga mått som används för språklig stickprovsanalys (SSA). Metod: Ljudfiler innehållandes en inspelad testning av narrativ förmåga för barn mellan tre och sex års ålder transkriberades med hjälp av AI-modellen ”Whisper large-v2” i programmet aTrain. Därefter skapades två versioner av transkriptionen: en originalversion, och version med eventuella fel korrigerade. Sedan jämfördes SSA-måtten MLU, MATTR, SI och PGU mellan de två versionerna. Resultat: En repeated-measures ANOVA visade att de två versionernas mått inte hade en signifikant skillnad. Parade t-test visade att det mått som stämde bäst överens mellan versionerna var MATTR, och det mått som stämde minst överens var MLU. Slutsatser: Resultatet visade att AI-verktyget Whisper presterade väl och hade hög träffsäkerhet när det kommer till vissa språkliga mått som används i SSA. Framtida förbättrade AI-modeller förväntas prestera ännu bättre, och fortsatt forskning behövs.}}, author = {{Söderbäck, Alva}}, language = {{swe}}, note = {{Student Paper}}, title = {{Kan AI ersätta transkription? En jämförande studie av mått för Språklig stickprovsanalys (SSA) för barns narrativer}}, year = {{2025}}, }