Dieser Beitrag befasst sich mit ASR-Transkripten außerparlamentarischer politischer gesprochener Kommunikation auf Deutsch, die mit dem Zweck erstellt werden, linguistische Analysen durchzuführen. Um gesprochene Dateien zu transkribieren, stellen ASR-Systeme vor allem im Falle großer Datenmengen oder langer Reden eine wichtige Ressource dar. Es ist bekannt, dass viele ASR-Systeme die Sprache tendenziell normalisieren, und in dieser Studie wird dargestellt und diskutiert, welche Probleme für linguistische Analysen entstehen können. Der Fokus liegt dabei spezifisch auf Phänomenen der Mündlichkeit wie Interjektionen und Füllwörtern, die in vielen Fällen keine eindeutig identifizierbaren lexikalischen Einheiten darstellen, aber trotzdem unerlässlicher Teil der Kommunikation sind. Diese Elemente werden von ASR-Systemen oft nicht erkannt, vor allem, wenn man öffentlich zugängliche Instrumente verwendet, wie sie in diesem Beitrag eingesetzt werden. Diese mündlichen Elemente besitzen allerdings in der politischen Sprache eine große Relevanz und sind für linguistische Analysen von großem Interesse. Der Beitrag veranschaulicht diese Problematik anhand von Beispielen und enthält die Diskussion sowohl über die Vorteile als auch die Herausforderungen ausgewählter öffentlich verfügbarer ASR-Systeme für die genannten Forschungszwecke. Abschließend wird die Hoffnung geäußert, dass die Dateien der außerparlamentarischen Kommunikation als Ressource für öffentliches aber gezieltes Modelltraining betrachtet werden können.
Zur Transkription mündlicher Phänomene in der politischen Sprache / Palladino, Marcella. - 113:(2026), pp. 55-62. ( ESSV 2026 - Elektronische Sprachsignalverarbeitung 2026 Eichstätt 04.-06.03.2026).
Zur Transkription mündlicher Phänomene in der politischen Sprache
marcella palladino
2026
Abstract
Dieser Beitrag befasst sich mit ASR-Transkripten außerparlamentarischer politischer gesprochener Kommunikation auf Deutsch, die mit dem Zweck erstellt werden, linguistische Analysen durchzuführen. Um gesprochene Dateien zu transkribieren, stellen ASR-Systeme vor allem im Falle großer Datenmengen oder langer Reden eine wichtige Ressource dar. Es ist bekannt, dass viele ASR-Systeme die Sprache tendenziell normalisieren, und in dieser Studie wird dargestellt und diskutiert, welche Probleme für linguistische Analysen entstehen können. Der Fokus liegt dabei spezifisch auf Phänomenen der Mündlichkeit wie Interjektionen und Füllwörtern, die in vielen Fällen keine eindeutig identifizierbaren lexikalischen Einheiten darstellen, aber trotzdem unerlässlicher Teil der Kommunikation sind. Diese Elemente werden von ASR-Systemen oft nicht erkannt, vor allem, wenn man öffentlich zugängliche Instrumente verwendet, wie sie in diesem Beitrag eingesetzt werden. Diese mündlichen Elemente besitzen allerdings in der politischen Sprache eine große Relevanz und sind für linguistische Analysen von großem Interesse. Der Beitrag veranschaulicht diese Problematik anhand von Beispielen und enthält die Diskussion sowohl über die Vorteile als auch die Herausforderungen ausgewählter öffentlich verfügbarer ASR-Systeme für die genannten Forschungszwecke. Abschließend wird die Hoffnung geäußert, dass die Dateien der außerparlamentarischen Kommunikation als Ressource für öffentliches aber gezieltes Modelltraining betrachtet werden können.| File | Dimensione | Formato | |
|---|---|---|---|
|
Palladino_ESSV2026.pdf
Open access
Tipologia:
VOR - Versione pubblicata dall'editore
Dimensione
997.19 kB
Formato
Adobe PDF
|
997.19 kB | Adobe PDF | Visualizza/Apri |
Pubblicazioni consigliate

I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris




