Které modely jsou nejlepšími hodnotiteli? Na @recallnet děláme interní soutěžní prototypy pro subjektivní dovednosti a GPT-4.1 mini považujeme za překvapivě schopného hodnotitele. Levný model má vkus!
21,6K