Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Sistemas Multimodales
por Juan C. Dürsteler [mensaje nº 139]

La interfaz entre humanos y computadoras adolece todavía de muchas deficiencias. Los sistemas multimodales, que utilizan elementos multibiométricos, interfaces multimodales y sistemas multisensoriales están empezando a paliar muchas de ellas. 

Multimodal_es.gif (16506 bytes)
Los sistemas multimodales se apoyan en tres bases: Sistemas multisensor, mulitibiométricos e Interfaces Multimodales
Fuente: Diagrama por el autor
La comunicación entre humanos y máquinas siempre ha sido una materia difícil y tortuosa, probablemente debido a que la insuficiente sofisticación del comportamiento interno de las máquinas ha obligado a sus diseñadores a hacer que el usuario se adaptase a su funcionamiento en vez de ser al revés.

Por ejemplo, es importante que mi ordenador sepa quien soy para que identifique mi perfil, personalizando mi escritorio, y evite que otros usuarios del mismo puedan borrar accidental (o aviesamente) mi trabajo. Sin embargo el ordenador es tan tonto que no sabe reconocer quién soy sino sólo aquello de lo que me acuerdo (mi identificación y mi password) o, en el mejor de los casos aquello que poseo (una tarjeta magnética). Para cualquiera de nosotros (los humanos) saber quién es nuestro interlocutor es cuestión trivial de echarle un vistazo, o escuchar su voz.

Otro ejemplo, en el hospital en el que trabaja mi mujer, como en muchos hospitales del mundo, se está intentando eliminar al máximo el papel, gestionando por computador las historias clínicas, las recetas, especialmente las de pacientes crónicos, y otros elementos de la práctica médica. En general esto está causando grandes problemas de usabilidad que llegan incluso hasta la oposición acérrima que ha obligado al hospital Cedars-Sinai, de Los Angeles a desmantelar el sistema que pretendía instaurar.

Y es que el ordenador tradicional no es apropiado para determinadas tareas para las que se han desarrollado operativas muy eficientes, muchas veces sobre soporte de papel, como puede ser la consulta de una urgencia cara a cara con el paciente, la planificación de una carretera sobre un mapa o incluso la gestión del tráfico aéreo usando tiras de papel. Muchas de estas actividades son colaborativas, lo que hace su contrapartida digital especialmente difícil con los medios tradicionales.

Por ello está surgiendo una nueva generación de sistemas multimodales que intenta resolver muchos de estos problemas de una forma flexible, adaptable, robusta y tolerante a fallos desde la perspectiva de la sinergia entre diversas técnicas unimodales que se complementan entre si.

Esta nueva generación se basa, según Sharon Oviatt, Trevor Darrel y Myron Flickner (“Multimodal Interfaces that Flex Adapt and Persist” en Communications of the ACM Vol 47 num 1) en, al menos, tres soportes:

  • Sistemas multibiométricos, que combinan diversas técnicas biométricas que se complementan, reduciendo el margen de error.

  • Interfaces multimodales

  • Sistemas multisensor.

Los sistemas Multibiométricos intentan paliar los problemas de falso rechazo (no admitir a un usuario válido) y falsa aceptación (dar paso a un usuario no autorizado) que van del 0,2 % en el caso de los mejores algoritmos de reconocimiento de huellas digitales al 10-20% de falsos rechazos (2-5% en falsas aceptaciones ) en el caso de algoritmos de reconocimiento de voz.

Combinando diversas técnicas como reconocimiento de voz, de los rasgos faciales, de las huellas dactilares o palmares, de la geometría de la mano, del iris o de la retina se pueden compensar las deficiencias de unos y otros sistemas. A medio plazo esto debiera resolver el problema del que hablábamos al principio, los ordenadores puede que finalmente sean capaces de reconocernos.

Anoto Pen: Diagrama descriptivo de los elementos que componen este bolígrafo digital.
Fuente: Tal como se puede ver en el web site de Anoto

Por otro lado, las interfaces multimodales intentan resolver el problema de la adaptación del ordenador al usuario en vez de al revés, combinando distintas técnicas de entrada y salida de información junto con avances en cuanto a interfaces tangibles (de los que hablamos brevemente en el número 135) cuyo objetivo es convertir los objetos de nuestro entorno en elementos de interacción digital.

Por ejemplo NISChart , desarrollado por Natural Interaction Systems es un sistema orientado a los médicos que combina el reconocimiento de voz con la escritura normal sobre un papel con el formulario de siempre utilizando Anoto, un bolígrafo digital que, a la vez que escribe como un bolígrafo normal, es capaz de detectar los movimientos que se hacen sobre el papel, gracias a unas marcas impresas sobre el mismo y comunicarlos a un ordenador.

El sistema permite al médico entrar escritura, anotaciones, marcar casillas y en general todo lo que normalmente se rellena en el formulario estándar, además de recoger los comentarios hablados que éste hace. La información del formulario, junto con el reconocimiento de la escritura, de los símbolos y del habla se transmiten a una aplicación que utiliza análisis semántico y contextual para fusionar y eliminar ambigüedades y errores en las informaciones y poblar una base de datos.

De esta forma el médico en cuestión sigue realizando su trabajo de la manera habitual, el ordenador no supone una interferencia en la relación con el paciente (o, al menos no más de lo que pudiera suponer el papel y lápiz) y además se tienen todas las ventajas que ofrece la informatización.

Los sistemas multisensor dan soporte a todo este entramado de combinaciones sinérgicas multibiométricas y multimodales.

Hoy por hoy muchas de las aplicaciones son más bien bimodales que multimodales debido a la complejidad de integración de técnicas dispares. En los próximos años veremos florecer muchas de las experiencias realmente multimodales, que buscan añadir la riqueza expresiva de la interacción humana al mundo digital.


Véase también:

Enlaces de este artículo:

http://bias.csr.unibo.it/fvc2002/results/resultsAvg.asp   Test algoritmos de identificación de huellas digitales
http://www.nist.gov/speech/tests/spk/index.htm   Test algoritmos de reconocimiento de voz
http://www.anoto.com/   Anoto, bolígrafo digital
http://www.infovis.net/printMag.php?num=135&lang=1   num 135 Dispositivos Ambientales
http://www.naturalinteraction.com/nischart.html   NISChart
http://www.naturalinteraction.com/   Natural Interaction Systems
http://www.infovis.net/printMag.php?num=118&lang=1   num 118 Interfaces de Usuario Atentas
http://www.trustedreviews.com/article.aspx?head=45&page=473   Comparativa de bolígrafos digitales
© Copyright InfoVis.net 2000-2018