När du tänker på det är stokastisk gradient descent på FP8 bara Yatzy i skala
1,4K