Uma grande melhoria que notei com os LLMs mais novos é que, se eles não acertam algo na primeira tentativa, as 2ª/3ª tentativas costumam estar corretas ou pelo menos são úteis na direção certa. Há 6 meses, era mais provável que você atingisse um assíntota e que isso fosse um desperdício de tempo.