In un anno da quando ho incontrato per la prima volta Arnav Kapur, il suo dispositivo, AlterEgo, è passato da un prototipo malfunzionante a simulare la telepatia. Arnav è stata un'ispirazione per me da quando ne ho sentito parlare per la prima volta 7 anni fa e voglio condividere la sua storia.: Ho sentito parlare di Arnav per la prima volta dal suo video virale ~1M visualizzazioni del MIT Media Lab del 2017. Mi ha fatto tornare in mente un discorso simile dello stesso gruppo tenuto da un altro indiano nel 2019, Pranav Mistry, uno dei motivi principali per cui io (e molti altri) abbiamo deciso di studiare negli Stati Uniti. L'ho incontrato tramite suo fratello minore, che ho conosciuto nel corso degli anni (anche lui un genio a modo suo). Gli ho subito chiesto: "Perché non hai commercializzato questo? Era solo una dimostrazione accademica appariscente?" e lui ha risposto: "Lo sto facendo ora. Con gli LLM, penso sia finalmente il momento giusto." Ma la prima dimostrazione era malfunzionante. Ci volevano 15 minuti per impostarla. Gli elettrodi dovevano essere attaccati alle guance. Funzionava forse l'80% delle volte. La calibrazione per i nuovi utenti richiedeva ancora più tempo. E poteva dire solo 4000 frasi. Eppure, sembrava ancora magia. Ho puntato a una delle frasi perché il suo collega Scott la dicesse silenziosamente. In pochi secondi, muovendo a malapena un muscolo, ricevevo un messaggio di quella frase sul mio telefono. Non riuscivo a vedere la sua bocca muoversi affatto! Ma era davvero possibile il discorso silenzioso? L'hardware è difficile. C'erano troppi sensori perché fosse utilizzabile. Non funzionava senza un contatto costante con la pelle (una barba era un problema). Troppo movimento della testa era un problema. La batteria era esterna. La calibrazione era troppo complicata. E potevi dire solo poche frasi! Avanzando di un anno, hai qualcosa che somiglia alla telepatia. I sensori si sono rimpiccioliti. Il dispositivo somigliava a cuffie open-ear. Niente più impostazioni di 15 minuti. E puoi dire la maggior parte delle parole. Alterego legge segnali neuromuscolari volumetrici e dettagliati in più lingue e li traduce in testo. Ti consente di capire cosa sta dicendo l'utente senza rumore mentre muove a malapena la bocca. L'hardware è ancora difficile. E c'è ancora molta strada da fare prima che questo sia utilizzabile dagli utenti finali. Ma ci vuole un coraggio serio e abilità ingegneristiche eccezionali per dedicare oltre un decennio della propria vita a costruire hardware che somiglia al futuro. Abbiamo bisogno di più ingegneri come Arnav e il suo team.