Presentan interfaz que transcribe palabras que se dicen en voz baja

México., 09 de abril/Notimex. Investigadores del Instituto Tecnológico de Massachusetts (MIT) desarrollaron una interfaz de computadora que puede transcribir palabras que el usuario verbaliza de manera interna, es decir, en voz baja que no es perceptible al oído humano.

El sistema consiste en un dispositivo portátil y un sistema informático asociado, en el que los electrodos captan señales neuromusculares en la mandíbula y en la cara que se desencadenan mediante verbalizaciones internas.

Según un comunicado del MIT, las señales alimentan un sistema de aprendizaje automático que ha sido programado para correlacionar las señales con palabras de cada persona.

En Contacto (out of page)

El aparato también incluye un par de auriculares de conducción ósea, que transmiten las vibraciones a través de los huesos de la cara hacia el oído interno.

Debido a que no obstruyen el canal auditivo, los auriculares permiten que el sistema transmita información al usuario, sin interrumpir la conversación ni interferir con la experiencia auditiva del usuario.

El dispositivo es, por lo tanto, parte de un completo sistema de computación silenciosa que permite al usuario plantear y recibir de forma indetectable respuestas a problemas de computación difíciles.

En una de las pruebas que realizaron los investigadores, los sujetos usaron el sistema para detallar silenciosamente los movimientos de los oponentes en un juego de ajedrez y, de forma silenciosa, recibieron respuestas recomendadas por la computadora.

El estudiante graduado en el MIT Media Lab, Arnav Kapur, explicó que la motivación para esto fue construir un dispositivo IA, un dispositivo de inteligencia reforzada.

Para el desarrollo de esta investigación, se presguntaron si era posible tener una plataforma informática «más interna», que fusione humanos y máquinas de alguna manera y que se sienta como una extensión interna de nuestra propia cognición.

Con el uso de la interfaz prototipo portátil, los investigadores realizaron un estudio de usabilidad en el que 10 sujetos pasaron unos 15 minutos, cada uno, personalizando la aplicación aritmética a su propia neurofisiología, luego pasaron otros 90 minutos usándolo para ejecutar cálculos.

En ese estudio, el sistema tenía una precisión de transcripción promedio de aproximadamente 92 por ciento.

En el trabajo en curso, los investigadores están recopilando una gran cantidad de datos en conversaciones más elaboradas, con la esperanza de crear aplicaciones con vocabularios mucho más expansivos.

«Estamos en el medio de recopilar datos, y los resultados se ven bien. Creo que lograremos una conversación completa algún día», resaltó Kapur.

Publicaciones relacionadas

Deja una respuesta

Botón volver arriba