Je mehr ich in Goodfire Research eintauche, desto mehr wird mir klar, wie der Bereich der Interpretierbarkeit leise zu einer der interessantesten Grenzen in der KI (und insbesondere in der KI für Wissenschaft) wird. Sie veröffentlichten letztes Jahr diese Forschung mit der Kernidee, wie ein DNA-Grundlagenmodell Arten in seinem Einbettungsraum organisiert, auf eine Weise, die den echten evolutionären Baum des Lebens widerspiegelt. oder im Grunde, wie das Modell die Phylogenie rein aus DNA-Sequenzen neu entdeckte. Sie untersuchten Evo 2 (DNA-Modell, das von EvolutionaryScale entwickelt wurde) und entdeckten, dass: + das Genom jeder Art in eine Vektoreinbettung innerhalb des Modells abgebildet wird. + diese Einbettungen eine gekrümmte geometrische Struktur (eine Mannigfaltigkeit) bilden. + Abstände entlang dieser Mannigfaltigkeit entsprechen dem tatsächlichen evolutionären Abstand zwischen den Arten. Also innerhalb des Modells: ähnliche Arten → nahe Einbettungen distante Arten → entfernte Einbettungen und die Struktur, die entsteht, ist im Wesentlichen der Baum des Lebens. Das könnte etwas bahnbrechendes beweisen, wie Grundlagenmodelle wissenschaftliche Strukturen automatisch neu entdecken können.