Простая техника безопасности AGI: мысли ИИ на простом английском, просто читайте их Мы знаем, что это работает, с ОК (не идеальной) прозрачностью! Риск заключается в хрупкости: обучение с подкреплением, новые архитектуры и т.д. угрожают прозрачности Эксперты из многих организаций согласны, что мы должны попытаться сохранить это: 🧵
183,63K