Estou a observar um mini paradoxo de Moravec na robótica: as acrobacias que são difíceis para os humanos são muito mais fáceis para os robôs do que tarefas "não sexy" como cozinhar, limpar e montar. Isso leva a uma dissonância cognitiva para as pessoas fora do campo, "então, os robôs podem fazer parkour e breakdance, mas por que não conseguem cuidar do meu cão?" Acredite, meus pais me perguntaram isso mais do que você imagina ... O "paradoxo de Moravec dos robôs" também cria a ilusão de que as capacidades físicas da IA estão muito mais avançadas do que realmente estão. Não estou a destacar a Unitree, pois isso se aplica amplamente a todas as recentes demonstrações acrobáticas na indústria. Aqui está um teste simples: se você colocar uma parede na frente do robô que faz flips laterais, ele vai colidir com ela em plena força e fazer um espetáculo. Porque ele está apenas a sobreajustar aquele único movimento de referência, sem qualquer consciência do ambiente. Aqui está o motivo pelo qual o paradoxo existe: é muito mais fácil treinar um "gimnasta cego" do que um robô que vê e manipula. O primeiro pode ser resolvido inteiramente em simulação e transferido zero-shot para o mundo real, enquanto o último exige renderização extremamente realista, física de contato e dinâmicas de objetos do mundo real desordenadas - nada disso pode ser simulado bem. Imagine que você pode treinar LLMs não a partir da internet, mas a partir de um jogo de console de texto puramente elaborado à mão. Os robóticos tiveram sorte. Acontece que vivemos num mundo onde motores de física acelerados são tão bons que conseguimos realizar acrobacias impressionantes usando literalmente zero dados reais. Mas ainda não descobrimos o mesmo código de trapaça para a destreza geral. Até lá, ainda seremos questionados pelos nossos pais confusos.
318,95K