我们自己是将AI热情应用于科学工作流程的用户。每天的工作都让人感到非常兴奋。但AI对科学作为一个机构的影响,而不是对个别科学家的影响,是一个不同的问题,需要不同类型的分析。写这篇文章在很多情况下需要与我们自己的直觉作斗争。如果你是一位同样对使用这些工具感到兴奋的科学家,我们敦促你牢记这一差异。 AI会减缓科学进程吗?面对生产-进展悖论 悲剧的是,有许多AI科学工具可以真正产生影响,比如用于标记科学代码中潜在错误的AI。但实验室却专注于其他事情,比如文献综述/“深度研究”。这并不是一个实际的瓶颈,因此无论你多快都无所谓。与此同时,短路人类理解的风险是巨大的。 评估是问题的一部分。关于文献综述工具,可以问三种问题:它是否节省了研究者的时间,并产生与现有工具相当的结果质量?使用该工具对研究者理解文献的影响与传统搜索相比如何?如果该工具被广泛采用,对社区的集体影响将是什么?例如,是否每个人最终都会引用同几篇论文? 目前,只有第一个问题被视为评估的一部分。后两个问题超出了范围,甚至没有建立测量的标准方法或指标。这意味着AI科学评估必然会提供一个高度不完整和偏见的工具有用性的图景,并最小化其潜在危害。 最终,这归结为AI科学实验室,尤其是大型AI公司的扭曲激励。他们想要引人注目的“AI发现X!”的头条,以维持AI将解决人类问题的叙述,这为他们赢得了有利的政策待遇。我们并不指望这种情况会改变。 但意识到当前轨迹存在严重问题是一个良好的第一步,这也是我和@sayashk这篇文章的目标。
6.36K