Чем больше я углубляюсь в Goodfire Research, тем больше осознаю, как область интерпретируемости тихо превращается в одну из самых интересных границ в AI (особенно AI для науки). В прошлом году они опубликовали это исследование с основной идеей о том, как модель фундамента ДНК внутренне организует виды в своем эмбеддинговом пространстве таким образом, что это отражает реальное эволюционное дерево жизни. или, по сути, как модель заново открыла филогению исключительно на основе последовательностей ДНК. они изучали Evo 2 (модель ДНК, разработанную EvolutionaryScale) и обнаружили, что: + геном каждого вида отображается на векторное эмбеддинг внутри модели. + эти эмбеддинги формируют изогнутую геометрическую структуру (многообразие). + расстояния вдоль этого многообразия соответствуют фактическому эволюционному расстоянию между видами. так что внутри модели: похожие виды → близкие эмбеддинги distant species → far embeddings и структура, которая возникает, по сути, является деревом жизни. Это может доказать что-то революционное о том, как модели фундамента могут автоматически заново открывать научные структуры.