Smartphone, dígame: El futuro de los asistentes de voz

Smartphone, dígame: El futuro de los asistentes de voz

¿Has visto «Her»? ¿O las películas en las que aparece Iron Man? Os prometo que tienen algo en común: su manera de presentar un innovador asistente por voz. Samantha en la de chicas y J.A.R.V.I.S. en la de chicos son la pareja de ayudantes que dejan a Siri, Google Now y Cortana a la altura del teletexto (que DEP). Últimamente hacen cosas bastante curiosas, como encender luces, mandar WhatsApps o incluso pedir que suba a Facebook «mi última foto en Barcelona», y sólo tienes que pedirlo; pero yo acabo de pedirle a Siri que se actualice y entienda todo lo que le diga y me ha dicho que tengo una cafetería a 200 m, true story.

Esto lo decimos aquí porque nosotros sólo hacemos tecnologías sencillas, y un sistema capaz de reconocer comandos de voz, traducirlos a protocolos programados y establecer compatibilidades con aplicaciones nativas e instaladas no es, por ahora, una tecnología sencilla. El caso es que tenemos algo que decir, cómo no, respecto a la evolución que esto debería llevar. Cuando acaben de pulir los «no te he entendido» y los «esto es lo que he encontrado en Internet sobre Hazme la comida por favor» deberían permitirnos utilizar realmente el móvil con la voz.

asistentes voz futuro

Si quiero abrir Instagram y hacer que vaya haciendo scroll sin tener que soltar el cuchillo y el tenedor, debería poder pedirlo por voz. Si quiero que ponga una canción de Spotify y que la avance hasta donde le diga sin tener que soltar el mando de la Play, debería poder pedirlo por voz. La lista puedes seguir soñándola tú, ya has visto que molaría no tener que tocar tanto el teléfono.

«Baja, baja, baja… ¡Para! Like a esa foto.» o «Abre Pordede punto com y busca Westworld. Abre el primer resultado. Baja, baja, ahí, Temporada uno, seis, el adversario…» Es más viable de lo que parece: al fin y al cabo por cualquier app o web se navega mediante vínculos con los nombres que vemos. El sistema es capaz de buscar en pantalla los caracteres que forman las palabras que introduces mediante el reconocimiento de voz y «pulsarlos» o emular comandos como abrir apps, desplazarse, ampliar, dejar pulsado, etc. o, en el peor de los casos,introducirlos manualmente antes, como establecer que «en Instagram, dar like equivale a un doble tap en el centro de la pantalla». Todo lo que pulsamos tiene nombre, sea «Comentar» o sea «siguiente botón, siguiente, siguiente, ¡ese!». Como mucho sería necesaria una pequeña asistencia visual suplementaria que previsualizara las acciones mientras se realizan.

Y, por supuesto, compatibilidad. Compatibilidad del movil y a la tablet y al portátil y al PC y al reloj y a todo. Salvo algunos privilegiados que tienen hasta las legañas de Apple, la mayoría de la gente tiene un Android, un iPad, un Windows y ninguna forma en condiciones de juntar accesibilidades en todos sus dispositivos. Debería desarrollarse fuera de las oficinas de Google, Apple y Microsoft y llevarse bien con ellos para ser nuestro amigo en todas las pantallas que nos absorben durante el día, porque si no nos acompaña siempre, no es fiel de verdad.

Serían necesarios ciertos controles, como establecer confirmaciones para comandos como «enviar», «llamar» o «dar like», para salvar el pellejo cuando te equivocas, si hay gente cerca TROLEANDO hablando de lo mismo o si simplemente hablas sin pensar. También habría ciertos problemas con la privacidad, con los que otra persona podría pedirle cosas a tu móvil sin pasar por patrones de desbloqueo o huellas (recordamos que la gracia sería tener un control total «intangible» desde el estado de reposo bloqueado), pero no es nada que no se pueda resolver con reconocimientos de timbre de voz u otras biometrías no táctiles por desarrollar (busca el desbloqueo por emisiones otoacústicas, por ejemplo).

No es ninguna locura. Tampoco hace falta que el smartphone nos pueda psicoanalizar, sólo queremos que realmente se nos faciliten las cosas, como con aquellos gestos del Magic Trackpad o los botoncitos del volante. Las máquinas están para servirnos, ya es hora de que hagan lo que DIGAMOS.