En un año desde que conocí a Arnav Kapur, su dispositivo, AlterEgo, pasó de ser un prototipo extraño a simular la telepatía. Arnav ha sido una inspiración para mí desde que escuché por primera vez de él hace 7 años y quiero compartir su historia: Escuché por primera vez de Arnav en su video viral de ~ 1 millón de éxitos en el MIT Media Lab de 2017. Se remonta a una charla similar del mismo grupo por otro indio en 2019, Pranav Mistry, una de las principales razones por las que yo (y muchos otros) decidimos estudiar en los EE. UU. Lo conocí a través de su hermano menor, a quien había llegado a conocer a lo largo de los años (también un genio por derecho propio). Inmediatamente le pregunté: "¿Por qué no comercializaste esto? ¿Fue solo una demostración académica llamativa?" y dijo: "Lo estoy haciendo ahora. Con los LLM, creo que finalmente es el momento". Pero la primera demostración fue extraña. Tardó 15 minutos en configurarse. Era necesario pegar electrodos a las mejillas. Funcionó tal vez el 80% de las veces. La calibración para los nuevos usuarios tomó aún más tiempo. Y solo podía decir 4000 oraciones. Sin embargo, todavía se sentía como magia. Señalé una de las oraciones para que su colega Scott dijera en silencio. En segundos, apenas moviendo un músculo, recibía un mensaje de texto de esa frase en mi teléfono. ¡No podía ver su boca moverse en absoluto! Pero, ¿era realmente posible hablar en silencio? El hardware es difícil. Había demasiados sensores para que fuera utilizable. No funcionaba sin un contacto constante con la piel (la barba era un problema). Demasiado movimiento de la cabeza era un problema. La batería era externa. La calibración era demasiada fricción. ¡Y solo podías decir unas pocas frases! Avance rápido un año y tiene lo que se parece a la telepatía. Los sensores se encogieron. El dispositivo se parecía a los auriculares abiertos. No hay configuración de 15 minutos. Y puedes decir la mayoría de las palabras. Alterego lee señales neuromusculares volumétricas de grano fino en varios idiomas y las traduce a texto. Te permite entender lo que dice el usuario sin ruido mientras apenas mueve la boca. El hardware sigue siendo difícil. Y hay un largo camino por recorrer antes de que esto sea utilizable por el usuario final. Pero se necesita un gran coraje y habilidades de ingeniería excepcionales para dedicar más de una década de su vida a construir hardware que se asemeje al futuro. Necesitamos más ingenieros como Arnav y su equipo.