上周开始为我们的计算机科学专业开设一个关于神经网络的课程。我的计划是从早期经典(麦卡洛克-皮茨,罗森布拉特)开始,经过所有里程碑论文的相关发展,一直到《Attention Is All You Need》。我们通过对概念进行非常详细的数学分析、进行大量数值实验以及对我们定义的每个概念进行实践经验来建立理解。
我必须承认,我没有想到在调整网络权重、内化核心原则以及纯粹实验中会如此有趣。我已经为第一个月的实验准备好了第一批笔记和应用程序。
欢迎提出建议和想法。我会将我的笔记向所有人开放,所以我很好奇是否有任何不准确之处或我可能遗漏的明显要点。