Auto Captions and Deaf Students: Why Automatic Speech Recognition Technology Is Not the Answer (Yet)

Con el rápido cambio a la enseñanza en línea debido a la pandemia, muchas universidades y escuelas están confiando en subtítulos automáticos como una forma rápida y económica de convertir las palabras habladas en texto para estudiantes sordos en aulas, eventos y actividades extracurriculares.

Aunque este tipo de tecnología de reconocimiento automático de voz (ASR) puede ser efectiva para Alexa — para pedirle a tu dispositivo doméstico que haga una lista de compras o que establezca un recordatorio — es una opción de calidad inferior en entornos educativos y puede tener repercusiones costosas para las instituciones.

El Centro Nacional de Sordos sobre Resultados en la Educación Superior (NDC) ha analizado investigaciones sobre el impacto del ASR en estudiantes sordos y describe cómo las universidades pueden reducir barreras, cumplir con las recientes decisiones legales y ofrecer un acceso equitativo.

Convertir voz en texto: humano vs. máquina

Subtítulos en tiempo real. Subtítulos cerrados. Transcripción en vivo. CART.

Hay muchos términos para describir el proceso manual de convertir el lenguaje hablado y la información auditiva en texto en tiempo real. No importa qué término uses, todos estos son servicios de reconocimiento de voz a texto que requieren la habilidad de personas capacitadas. Durante muchos años, los profesionales de reconocimiento de voz han estado proporcionando acceso a subtítulos en tiempo real para aulas, salas de tribunales, eventos artísticos, programas de televisión en vivo y más.

Con los rápidos avances en tecnología, el uso de software de Reconocimiento Automático de Voz (ASR) ha crecido significativamente. Ahora hay una tendencia creciente de usar reconocimiento automático de voz en entornos educativos, con la suposición de que las subtítulos automáticos son satisfactorios y rentables. Pero por mucho que haya avanzado la tecnología de reconocimiento automático de voz, todavía no es comparable a lo que ofrecen los profesionales de conversión de voz a texto, y los estudiantes sordos están pagando el precio.

Los subtítulos automáticos no son un acceso equitativo

Los estudiantes sordos han luchado durante mucho tiempo contra las desigualdades en la educación, incluida la falta de acceso a la comunicación. El acceso limitado al idioma y la comunicación es uno de los aspectos destacados Causas raíz de las brechas en el rendimiento postsecundario y resultados para las personas sordas.

Ya sea que las clases se realicen en línea o en persona, los estudiantes sordos se ven obligados a descifrar errores en las leyendas de ASR, sin acceso a la fuente original de la información. Además, se espera que el ASR permita a los estudiantes sordos rendir académicamente al mismo nivel que sus compañeros. Esta suposición falsa está teniendo un impacto negativo y tomando un costo único para los estudiantes sordos durante la pandemia.

Las trampas del reconocimiento automático de voz

A simple vista, el reconocimiento automático de voz (ASR) puede parecer "suficientemente bueno" al probar su aplicación en una oficina tranquila con un solo hablante. Cuando se introducen factores ambientales y otros, como acentos, hablantes femeninas, múltiples o superpuestos en discusiones grupales y distorsión de audio, la tecnología aún no ha demostrado ser comparable a un profesional capacitado en transcripción de voz a texto.

La investigación muestra que el reconocimiento automático de voz (ASR) generalmente no incluye:

Adecuado gramática y puntuación marcadores
Múltiple identificación de altavoces y cambios
Vocabulario técnico, jerga, o nombres propios
Diferenciación de homónimos
Sonidos ambientales o ruidos de fondo
Capacidad para preguntar para aclarar o solicitar que un presentador hable más fuerte

Otra trampa del ASR: los errores no pueden corregirse en tiempo real con precisión. Todos estos factores son los que los profesionales de conversión de voz a texto pueden ajustar de manera natural.

Obligaciones legales y morales a considerar

Las investigaciones recientes y las decisiones legales también enfatizan las deficiencias del ASR y las preocupaciones que las instituciones educativas deberían tener al usar la tecnología de manera generalizada en el campus. Incluyen

Reconocimiento Automático de Voz no se puede confiar en él debido a alto tasas de inexactitud.
Incluso hay más grandes disparidades en las tasas de precisión para mujeres y hablantes de minorías.
Los tribunales han acordado que Las subtítulos automáticos no brindan acceso igualitario para videos.
La Oficina de Derechos Civiles también ha dejado claro que precisión de la traducción es un criterio clave al determinar una comunicación efectiva.

El uso de ASR priva aún más a los estudiantes sordos de su acceso al lenguaje, con repercusiones intangibles por la incapacidad de obtener una educación de calidad. Varios leyes de accesibilidad existen para garantizar que las escuelas, colegios y universidades cumplan con sus obligaciones de ofrecer acceso equitativo a sus programas y servicios. Para las personas sordas, el estándar de comunicación efectiva mide si un alojamiento elimina o no las barreras a la comunicación.

El verdadero costo del reconocimiento automático de voz

Entonces, ¿por qué las instituciones eligen tecnología ineficaz en lugar de profesionales humanos capacitados? La razón principal: el costo.

La pandemia sin duda ha provocado restricciones presupuestarias más estrictas y presiones en las instituciones educativas. Cuando se requiere bajo la Ley de Estadounidenses con Discapacidades (ADA), alegar que una adaptación representa una carga financiera excesiva suele ser infructuoso para las instituciones educativas. A demostrar una carga indebida, todos los recursos disponibles para pagar el alojamiento deben ser considerados, no solo los recursos de un solo departamento académico o de la oficina de servicios para discapacitados.

Si la decisión de usar ASR para acceso en tiempo real está impulsada únicamente por el costo, considere los altos costos de las ramificaciones legales, la reputación y la carga para los estudiantes sordos de luchar por el acceso a la educación.

¿Qué pasa si un estudiante sordo prefiere ASR?

Si un estudiante sordo solicita específicamente el uso de ASR como adaptación, es importante explicar el riesgo de errores y malentendidos, así como discutir opciones para garantizar que la comunicación efectiva no se vea comprometida.

Cuando se aplica de manera adecuada a otros escenarios, el reconocimiento automático de voz (ASR) puede tener algunos beneficios:

Puede ser una herramienta provisional para situaciones uno a uno cuando personas sordas y oyentes necesitan comunicarse.
Utiliza ASR para crear transcripciones que puedan ser editadas para escribir subtítulos para videos producidos.
ASR puede ser útil para personas con discapacidades físicas, para poder escribir de forma independiente.
A algunos estudiantes también les gusta usar aplicaciones de reconocimiento automático de voz como tomar notas herramientas.

Los estudiantes sordos tienen derecho a oportunidades iguales para lograr el éxito en la educación superior. Garantizar el acceso igualitario significa trabajar con cada estudiante sordo de manera individual para determinar qué adaptaciones son necesarias y apoyarse en el estándar de la ADA de acceso efectivo a la comunicación. Considere este objetivo al trabajar con estudiantes sordos que requieren acceso en tiempo real a la transcripción de voz a texto y por qué el reconocimiento automático de voz no está a la altura de la tarea.

¿Tiene más preguntas sobre la variedad de alojamientos utilizados por estudiantes sordos? Contacta con el equipo de ayuda del NDC soporte individual gratuito

Galleta	Duración	Descripción
cookielawinfo-casilla de verificación-analítica	11 meses	Esta cookie es establecida por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies en la categoría "Análisis".
casilla de verificación funcional de cookielawinfo	11 meses	La cookie está configurada por el consentimiento de cookies de GDPR para registrar el consentimiento del usuario para las cookies en la categoría "Funcional".
casilla de verificación necesaria para cookielawinfo	11 meses	Esta cookie es establecida por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Necesarias".
cookielawinfo-casilla de verificación-otros	11 meses	Esta cookie es establecida por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies en la categoría "Otros".
casilla de verificación de rendimiento de cookielawinfo	11 meses	Esta cookie es establecida por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies en la categoría "Rendimiento".
política de cookies vista	11 meses	La cookie es establecida por el plugin de consentimiento de cookies de GDPR y se utiliza para almacenar si el usuario ha dado su consentimiento para el uso de cookies o no. No almacena ningún dato personal.

Subtítulos automáticos y estudiantes sordos: por qué la tecnología de reconocimiento automático de voz no es la respuesta (aún)

Convertir voz en texto: humano vs. máquina

Los subtítulos automáticos no son un acceso equitativo

Las trampas del reconocimiento automático de voz

Obligaciones legales y morales a considerar

El verdadero costo del reconocimiento automático de voz

¿Qué pasa si un estudiante sordo prefiere ASR?

Recursos adicionales:

Otros temas de actualidad

El empleo de personas sordas alcanza un máximo histórico mientras persisten las brechas en la fuerza laboral

Construyendo un mejor acceso a través de la toma de notas

¿Dónde están los profesionales sordos en los servicios de discapacidad?

Conéctate con Nosotros

Suscríbete para recibir actualizaciones

¿Necesitas ayuda?