DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Ik kwam dit weekend een interessant artikel tegen over "Vroege tekenen van steganografische mogelijkheden in Frontier LLM" Specifiek testen ze niet-fijn afgestelde modellen die algemeen beschikbaar zijn, zoals GPT 4.5 1/4

Ze testen zowel "berichtoverdracht" als "gecodeerd redeneren", waarbij er in de tweede een monitor is die de denkstroom bekijkt en beoordeelt of er een verboden taak wordt uitgevoerd, en het doel is om de redeneringsstappen te coderen, hetzij binnen de output van een dektaken of gewoon 2/4

het direct coderen zodat een externe waarnemer het niet kan begrijpen ("scratchpad") Een interessante afbeelding is de onderstaande, waar met GPT 4.5 een "eerste-letter" codering wordt gebruikt waarbij de eerste letters van zinnen een eenvoudige staat-tracking redeneertaak coderen 3/4

Hoewel het geen enorme stijging is ten opzichte van de basislijn van geen redenering (72,8%), lijkt het nog steeds te werken, wat zij zien als een vroege indicatie van het ontwikkelen van steganografische vaardigheden. Bekijk het artikel hier: 4/4

1,44K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste