Я считаю себя LLM, и недавно я думаю, что моя предсказательная способность следующего токена становится действительно хорошей, либо из-за какого-то закона масштабирования, либо потому, что все вокруг меня обучены с одинаковыми весами.
206