ICMLに所属していて、RLや多言語に興味がある方は、ぜひ@marafinkelsに挨拶してください。私たちは過去数ヶ月間、Geminiの重大な品質問題を解決するためのRLメソッドを出荷するために緊密に協力しました。彼女は素晴らしい研究アイデアも持っています!双子座×アカデミアが連絡を取り合うことを願っています。
Mara Finkelstein
Mara Finkelstein2024年11月27日
LLM は通常、標準テスト セットの自動メトリックを使用して評価されますが、メトリック + テスト セットは独立して開発されます。これは重大な問題を提起します:優先順位を付けるテストセットで優れているように、特に自動メトリックを設計できますか?答え:はい!
5.79K