Wszyscy zawsze pytają, jak @GroqInc jest tak szybki i czy kwantyzujemy, aby super obniżyć jakość modelu w celu osiągnięcia tego. Odpowiedź brzmi: nie, a dzisiaj wyjaśniamy, jak to robimy.
12,75K