Quand on y pense, la descente de gradient stochastique en fp8, c'est juste du Yahtzee à grande échelle.
1,39K