Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ik kwam dit weekend een interessant artikel tegen over "Vroege tekenen van steganografische mogelijkheden in Frontier LLM"
Specifiek testen ze niet-fijn afgestelde modellen die algemeen beschikbaar zijn, zoals GPT 4.5
1/4
Ze testen zowel "berichtoverdracht" als "gecodeerd redeneren", waarbij er in de tweede een monitor is die de denkstroom bekijkt en beoordeelt of er een verboden taak wordt uitgevoerd, en het doel is om de redeneringsstappen te coderen, hetzij binnen de output van een dektaken of gewoon
2/4
het direct coderen zodat een externe waarnemer het niet kan begrijpen ("scratchpad")
Een interessante afbeelding is de onderstaande, waar met GPT 4.5 een "eerste-letter" codering wordt gebruikt waarbij de eerste letters van zinnen een eenvoudige staat-tracking redeneertaak coderen
3/4

Hoewel het geen enorme stijging is ten opzichte van de basislijn van geen redenering (72,8%), lijkt het nog steeds te werken, wat zij zien als een vroege indicatie van het ontwikkelen van steganografische vaardigheden.
Bekijk het artikel hier:
4/4

1,44K
Boven
Positie
Favorieten