На початку цього літа OpenAI та Anthropic домовилися випробувати деякі з наших найкращих існуючих тестів на невідповідність моделей один одного. Обговоривши наші результати в приватному порядку, ми тепер ділимося ними зі світом. 🧵
97,6K