als je erover nadenkt, is stochastic gradient descent bij fp8 gewoon yahtzee op schaal
1,4K