правильное замечание. да, я скептически настроен к тому, что LLM смогут создать новую, проницательную математику, потому что это требует мышления вне рамок, в чем они не сильны. но LLM могут решать очень сложные математические *задачи* (это другое), что действительно круто - пока они не требуют "новых, проницательных определений" некоторые математические задачи требуют "новых, проницательных определений", и они сложны именно из-за этого. дело не в том, что они по своей сути "тяжелые" в каком-то вычислительном смысле, а в том, что они требуют "воображения" и "креативности" для концептуализации замечательных структур, которые никто раньше не рассматривал. например, доказательство последней теоремы Ферма потребовало разработки совершенно новых математических инструментов - эллиптических кривых, модульных форм и гипотезы Таниамы-Шимуры - концепций, которые не существовали, когда проблема была впервые поставлена. так что, если бы у нас были LLM в 1650 году, независимо от того, как сильно они пытались бы решить FLT - даже если бы вы позволили им вычислять веками - они никогда бы не смогли это сделать, потому что они бы думали в рамках тех математических структур, которые существовали тогда, и буквально не было бы пути к решению. теперь, в тот день, когда LLM начнут изобретать действительно новые математические структуры, вот тогда они смогут доказывать "сложные" теоремы. это единственное, что отделяет их от возможности сделать это. теперь это ставит самый сложный вопрос: что вообще такое "новая, проницательная математическая концепция"? как это вообще можно определить? многое считается "новой концепцией". Я могу легко написать какие-то случайные слова в Lean, и я создам совершенно новую математическую концепцию, которую никто не создавал раньше. и LLM могут сделать это тоже. это достаточно просто. часть "проницательности" здесь имеет значение что делает что-то "проницательным" или "интересным"? почему комплексные числа более интересны, чем случайные определения? как мы можем объективно измерить, насколько проницательно определение в Lean?
alz
alz23 авг., 10:55
Многие люди думают, что LLM все еще не могут выполнять математические операции, но вместо этого называют специализированные "математические движки". Что многие не осознают, так это то, что на самом деле не существует таких "математических движков".
342