Última atualização do experimento - após uma inspeção mais cuidadosa, ele contém implementações mais reais dos componentes do provador, incluindo um fft bidirecional reivindicado, com benchmarks atualizados, que são mais lentos A maior parte do meu envolvimento tem sido mais do tipo "é uma implementação real? Tem certeza? Não pegue atalhos e trabalhe por um dia, se necessário" O que levanta a questão de quão bom seria um "gerenciamento intermediário alternativo para LLMs" (como @alexhevans chamou) funcionaria aqui 😅
Kobi Gurkan
Kobi Gurkan5 de jul., 09:56
ok um pouco embaraçoso - eu não tinha ferrugem instalada naquela máquina, então o código gerado nem mesmo compilou e os benchmarks eram estimativas, como @MatteoFrig60839 também notei Eu cutuquei mais para colocá-lo em um estado melhor, mas ainda não é uma implementação totalmente funcional Eu ainda ficaria muito desconfiado se estiver correto + mais rápido do que uma implementação C ++ de grau de produção cuidadosamente feita à mão o teste final de ter uma prova gerada por ferrugem verificada em um verificador c ++ - não consigo acertar por enquanto e exigiria mais estímulos seria bom se tivéssemos uma boa função de verificação de prova completa isolada em C ++ e apontem CC para isso
57