今天我们发布了ether0,这是我们的第一个科学推理模型。 我们在多个化学分子设计任务上使用RL训练了Mistral 24B。值得注意的是,我们发现LLMs在某些科学任务上比从头开始在相同数据上训练的专门模型更具数据效率,并且在这些任务上可以大大超越前沿模型和人类。对于至少一部分科学分类、回归和生成问题,后训练的LLMs可能提供比传统机器学习方法更具数据效率的方法。1/n
90.23K