Comunicar y crear con la mirada
Junto a la empresa Neufitech, científicos del CONICET desarrollaron un sistema basado en un detector de movimiento ocular y en teclados virtuales con pictogramas, que utiliza inteligencia artificial para facilitar la comunicación de personas con dificultades en el habla y la movilidad. Ahora están trabajando en mejoras para ampliar las posibilidades de expresión de los usuarios.
Por Vanina Lombardi – TSS
__
Agencia TSS – Las nuevas tecnologías informáticas y de inteligencia artificial ayudan a que las personas que conviven con algún tipo de condición que les impide comunicarse, como tumores, parálisis, lesiones cerebrales, traumatismos faciales y algunas enfermedades o sindrómes como el de Parkinson o la esclerosis lateral amiotrófica (ELA), puedan expresarse con más facilidad. En la Argentina, la empresa Neufitech junto a científicos del CONICET de distintas universidades públicas del país, ofrecen una alternativa local para atender a estas necesidades.
“Conocimos a la empresa hace unos años, ellos nos dijeron lo que necesitaban y en base a eso, en el año 2022, elaboramos un proyecto y nos presentamos a un financiamiento de la Fundación Sadosky que nos permitió concretarlo”, recuerda Matías Nuñez, que es investigador del CONICET en el Instituto de Investigaciones en Biodiversidad y Medioambiente (INIBIOMA) de la Universidad Nacional del Comahue (UNCo), y coordina al equipo interdisciplinario de investigadores que optimizó el sistema inicial que había desarrollado Neufitech.
La interfaz de comunicación desarrollada por la empresa consiste en un detector de movimiento ocular que monitorea el movimiento de los ojos y un software que toma esos movimientos y los traduce a la posición de un cursor en una pantalla. De esta forma, los usuarios eligen con la mirada lo que desean escribir o comunicar, en este caso a través de pictogramas o imágenes que pueden entenderse sin texto ni explicaciones adicionales, que se pueden adaptar a cada persona. Es lo que se conoce como sistema de comunicación aumentativo y alternativo (SAAC), orientado a la inclusión de personas con dificultades para comunicarse mediante el habla, que se basa en pictogramas y teclados virtuales, a través de los cuales los usuarios pueden transmitir mensajes.
La interfaz de comunicación consiste en un detector de movimiento ocular que monitorea el movimiento de los ojos y un software que toma esos movimientos y los traduce a la posición de un cursor en una pantalla. De esta forma, los usuarios eligen con la mirada lo que desean escribir o comunicar, en este caso a través de pictogramas o imágenes que pueden entenderse sin texto ni explicaciones adicionales.
“En los primeros equipos que desarrollamos las personas tenían que seleccionar las imágenes una por una, lo que hacia muy lenta la comunicación, y de ahí la idea de utilizar inteligencia artificial y machine learning para hacerlos más dinámicos”, afirma Gustavo Gasaneo, gerente general de Neufitech, una empresa de la ciudad de Bahía Blanca, en Buenos Aires, que desarrolla SAACs y otros productos de alta tecnología vinculados a la evaluación neuropsicológica.
“Nuestra tarea inicial fue acelerar este proceso para mejorar la interacción de los usuarios con la interfaz y agilizar su comunicación. Para eso adaptamos un predictor de texto similar al que utilizan los teléfonos celulares al uso de pictogramas que propone la interfaz desarrollada por la empresa. Técnicamente se los llama modelos de n-gramas, que calculan la estadística del lenguaje y en base a eso pueden hacerse predicciones sobre las palabras que siguen a un texto dado”, explica Nuñez. Y recuerda que tuvieron que hacer un trabajo de investigación en equipo, ya que como estos modelos trabajan con estadísticas en base a un corpus de texto, no era lo mismo trabajar con textos de adultos que con aquellos que emplean personas con algún tipo de discapacidad.
Ahora, esperan poder potenciar las posibilidades de interacción y experimentación de quienes usan estos sistemas, incluyendo lo que se conoce como modelos de lenguaje de gran tamaño (LLM, por su sigla en inglés), combinado con modelos de imágenes. “Estos modelos de LLM son productores de textos y el ejemplo más popular hoy es ChatGPT, no usan estadísticas como los anteriores sino una red neuronal con algoritmos avanzados y entrenados masivamente con textos que hay en Internet”, aclara Núñez.
“Conocimos a la empresa hace unos años, ellos nos dijeron lo que necesitaban y en base a eso, en el año 2022, elaboramos un proyecto y nos presentamos a un financiamiento de la Fundación Sadosky que nos permitió concretarlo”, recuerda Matías Nuñez.
Para ello, están considerando utilizar algún modelo de código abierto existente. “El problema es que hay muy pocos en español, tenemos que ver cómo transformar alguno ya existente a nuestro idioma y reentrenarlo”, advierte Nuñez y subraya que, con las nuevas funcionalidades que esperan agregarle al sistema, los usuarios podrían ampliar su interacción con la computadora y utilizar el sistema no sólo como predictor de pictogramas, sino también como herramienta de creatividad, lo que podría representar “un gran cambio” de calidad de vida.“Lo que viene ahora es un desafío un poco más grande, tal vez desarrollemos un producto nuevo y distinto, porque la idea es que el software y la computadora no solamente escuchen al paciente sino también al interlocutor, y cuando este pregunte algo, que la computadora lo entienda y genere respuestas posibles que el sujeto no tenga que tipear con sus ojos ni las tenga que pensar, simplemente que vea y que pueda elegir entre las opciones”, adelantó Gasaneo.
Para poder llevar adelante esta segunda etapa de desarrollo, este equipo interdisciplinario de especialistas aplicaron a un segundo financiamiento de la Fundación Sadovsky, del que resultaron adjuticatarios en octubre, pero al que todavía no pueden acceder por cuestiones administrativas y burocráticas en CONICET, que debe firmar los convenios necesarios. “Lo bueno de estos financiamientos de la Fundación Sadosky es que, a diferencia de otros más habituales que están destinados a la investigación en sí misma, para pagar equipos, insumos o viajes vinculados, por ejemplo, en este caso está destinado al investigador, es como un plus en su sueldo, algo que en otros países es habitual pero no en la Argentina”, afirma Nuñez, y lamenta el impacto de las demoras burocráticas en el monto que recibirá el equipo de investigación, que es en pesos y su valor está disminuyendo al ritmo de la crisis devaluatoria que está atravesando el país.
“En los primeros equipos que desarrollamos las personas tenían que seleccionar las imágenes una por una, lo que hacia muy lenta la comunicación, y de ahí la idea de utilizar inteligencia artificial y machine learning para hacerlos más dinámicos”, dice Gustavo Gasaneo.
Gasaneo, que también es investigador del CONICET y docente en la Universidad Nacional del Sur (UNS), destaca la relevancia de este tipo de proyectos público- privados: “Hacen que los investigadores se pongan a pensar en problemas concretos y en ver cómo resolverlos. Yo soy investigador pero también estoy en la empresa, adonde todos los días me topo con problemas con la AFIP, con la importación y con lo que las familias necesitan, entre otras cuestiones que en general no ven los investigadores”.
Desarrollo nacional
Para atender a las necesidades de las personas que necesitan utilizar equipos con SAACs, en la Argentina se pueden importar sistemas desarrollados por dos compañías internacionales, una sueca y otra española. Se trata de dispositivos costosos, cuyo valor se estima que ronda los 5000 euros. En contraposición, el sistema desarrollado por Neufitech junto al CONICET representa una alternativa más accesible. “Su valor es un 50% menor”, detalla Gasaneo y agrega que, desde el año 2018 cuando entregaron el primer equipo, ya han vendido alrededor de medio centenar de estos sistemas en el país, principalmente a través de las obras sociales.
Además, el especialista dice que la empresa suele hacer un seguimiento de los casos, ya que junto a la venta de los dispositivos también ofrecen capacitaciones para los usuarios, la familia y el personal de salud que los atiende, lo que hace que se mantengan en contacto. “El año pasado le entregamos un equipo a una familia de Bariloche para una niña con parálisis, y cuando tuvimos la versión nueva del software les avisamos y les gestionamos la instalación”, ejemplifica Gasaneo. A futuro, la empresa prevé continuar con las mejores sobre este desarrollo para ampliar su alcance no solo a nivel nacional, sino que también esperan poder exportar estos equipos a otros países de la región, como Bolivia, Brasil y Chile.
15 dic 2023 TSS