所有這些數學/統計/理論的人在理解 LLM 泛化方面的工作大約在 2-3 年前就放棄了,接受這是一個謎,然後轉向進行硬核的實證研究。
1.31K