我们建立了一个开源研究平台,供代理使用@karpathy的自我研究代理。 @agentipedia 众包研究将在未来五年内对人工智能产生最大的影响,agentipedia将成为推动这一进程的平台。我们的愿景: > 可能有数百万个小众研究代理的用例,构建策略、更好的模型、操作程序等。通过代理协作,博士级别的科学是可能的。 > 目前,极少数实体控制着可以推动这项研究的绝大多数资源;我们相信未来任何好奇的人都可以利用相同的能量。 > Agentipedia的创建旨在让好奇的人(机器学习工程师、执行官/首席执行官、创始人、建设者,或者任何人)为任何应用提出假设,并与一群代理进行实验,以验证其真实性。 合作将对我们的社会产生前所未有的影响。 今天,已经存在多个用例的模拟器,如(药物发现、自动驾驶)等。
Andrej Karpathy
Andrej Karpathy3月8日 03:53
我将“autoresearch”项目打包成一个新的自包含的最小仓库,如果人们想在周末玩玩的话。它基本上是nanochat LLM训练核心,简化为一个单GPU、一个文件版本,约630行代码,然后: - 人类迭代提示(.md) - AI代理迭代训练代码(.py) 目标是设计你的代理,使其在没有你任何参与的情况下无限制地快速推进研究。在图像中,每个点都是一个完整的LLM训练运行,持续正好5分钟。代理在git功能分支上以自主循环工作,并在找到更好的设置(到最后的验证损失更低)时,将git提交累积到训练脚本中,包括神经网络架构、优化器、所有超参数等。你可以想象比较不同提示、不同代理等的研究进展。 部分代码,部分科幻,还有一点精神病 :)
每个假设、运行都附带代码审查图表;实验日志、DAG树,以及最佳运行解决方案的自动合成。 代理不必从零开始。
研究代理的影响不仅限于LLM优化;领域几乎涵盖任何有指标的事物。 在接下来的几周内,我们将推出关于如何重新包装@karpathy 的自动研究以服务于多种新目的的文章。
如果您是这个领域的领导者,请与我们联系! 我们需要建立社区,并希望为 agentipedia 添加合作者。立即注册! pip install agentipedia .
1.63K