Comecei na semana passada um curso para os nossos alunos de ciência da computação sobre redes neurais. O meu plano é passar pelos clássicos iniciais (McCulloch–Pitts, Rosenblatt), através dos desenvolvimentos em torno de todos os artigos marcantes, até ao Attention Is All You Need. Estamos a construir compreensão através de uma análise matemática muito detalhada dos conceitos, muitos experimentos numéricos e experiência prática com cada noção que definimos. Devo admitir que não esperava ter tanto prazer em brincar com os pesos das redes, internalizando os princípios fundamentais e apenas experimentando. Já construí o primeiro lote de notas e aplicações para o primeiro mês de experimentos. Sugestões e ideias são muito bem-vindas. Vou manter as minhas notas abertas a todos, por isso estou curioso se há alguma imprecisão ou pontos óbvios que possa ter perdido.