标签 Nature 下的文章

Nature丨清华等团队揭示AI科研双重效应:个人效率亦或是科学边界

0%
icon展开列表
Nature丨清华等团队揭示AI科研双重效应:个人效率亦或是科学边界
今天
img
刚刚,喝到了千问APP给我点的奶茶
今天
img
人脸机器人登上Science Robotics封面:用AI教会仿生人脸机器人「开口说话」
今天
img
实测夸克「千问划词快捷指令」,这7个邪修Prompt,建议收藏
今天
img
已证实!清华姚班陈立杰全职加入OpenAI,保留伯克利教职
今天
img
解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估
今天
img
5分钟定制一个AI采购专家:讯飞发布“招采智能体工厂”,重新定义行业开发范式
今天
img
Agent时代,为什么多模态数据湖是必选项?
今天
img
大模型长脑子了?研究发现LLM中层会自发模拟人脑进化
今天
img
性能提升60%,英特尔Ultra3这次带来了巨大提升
01月14日
img
继宇树后,唯一获得三家大厂押注的自变量:具身模型不是把DeepSeek塞进机器人
01月14日
img
Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起
01月14日
img
端到端智驾新SOTA | KnowVal:懂法律道德、有价值观的智能驾驶系统
01月14日
img
仅用10天?Anthropic最新智能体Cowork的代码竟然都是Claude写的
01月14日
img
AAAI 2026|AP2O-Coder 让大模型拥有「错题本」,像人类一样按题型高效刷题
01月14日
img
用AI从常规病理切片重建空间蛋白图谱:基于H&E图像的高维蛋白质表达预测
01月14日
img
京东首届AI影视创作大赛启动 最高奖金10万元邀全民共创AI视频
01月14日
img
合合信息多模态文本智能产品“上新”,覆盖AI教育、AI健康、AI Infra多元场景
01月14日
img
500万次围观,1X把「世界模型」真正用在了机器人NEO身上
01月14日
img
跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述
01月14日
img

Nature丨清华等团队揭示AI科研双重效应:个人效率亦或是科学边界

图片

编辑丨&

在过去十年里,人工智能几乎渗透进所有自然科学领域:从蛋白结构预测,到材料筛选,再到自动化实验与论文写作。AI 被反复证明能「加速发现」,但一个更深层的问题长期被忽略——当越来越多科学家依赖 AI,科学整体究竟发生了什么变化?

为了突破这一局限,来自清华大学等的徐丰力、李勇教授团队最终推出了「全流程、跨学科的科研智能体系统」—OmniScientist。他们通过对跨越 45 年、覆盖 4100 余万篇科研论文的分析,首次全景式揭示了 AI 工具融入科学研究后所带来的复杂图景。

相关研究内容以「Artificial intelligence tools expand scientists’ impact but contract science’s focus」为题,于2026 年 1 月 14 日发布在《Nature》。

图片

论文链接:https://www.nature.com/articles/s41586-025-09922-y

个人扩张与集体收缩

研究团队构建了一个基于 BERT 的语言模型,用于识别「AI 增强型科研论文」。不同于关键词匹配,他们直接让模型学习论文标题与摘要中的语义特征,判断研究是否在方法层面实质性使用了 AI。

最终研究覆盖了 1980–2025 年间的 41,298,433 篇论文,横跨生物、医学、化学、物理、材料与地质六大自然科学领域,并按 AI 发展阶段划分为:传统机器学习 → 深度学习 → 生成式 AI 三个时代。

图片

图 1:AI 在科学领域应用普及率的提升。

在此谨将研究结果分为个人与学术界两个层级进行解读。

对于研究者个人而言:与未使用 AI 的同行相比,采用 AI 的研究者年均发表论文数量高出 3.02 倍,获得的引用量高出 4.84 倍。他们的职业发展也明显提速,从「初级研究者」晋升为「资深研究者」的平均时间缩短 1.37 年。AI论文本身也更具影响力,年均引用量高出 98.70%,且更多发表于高影响力期刊。

但对于学术界可能不算什么好事:尽管个体论文影响力增强,但 AI 驱动的科学研究,其集体关注的科学主体空间收缩了 4.63%。这意味着 AI 研究倾向于更集中地围绕已有热门主题展开,而非开拓新的知识疆域。在超过 70% 的细分研究领域中,都观察到了这种知识范围的收缩现象。

图片

图 2:AI 的采用与自然科学领域知识广度的收缩相关。

究其原因,并非是 AI 不善于创新,而是它更容易在数据充足、问题定义清晰、评价标准明确的领域发挥优势。这使得研究资源、注意力与后续工作,持续向「已有数据密集区」聚集——例如成熟学科、热门问题、已有大规模数据集的方向,而冷门问题、新领域、缺乏标准数据的问题则进一步边缘化。

除此之外,AI 研究催生的后续科学互动模式也发生了变化。单篇 AI 论文能启发较广的知识衍生范围,但后续引用该原始工作的论文之间,彼此相互引用的「后续互动」程度降低了 22%。

这种「孤星」结构,与 AI 领域的学术认可分配不均现象,加剧了科学研究的选择偏颇。

效率与探索之间的张力

这项研究触及了科学发展的一个根本性张力:在追求研究效率、产出速度和个体成功的激励下,AI 工具正将科研资源引向那些最容易通过数据驱动模型取得快速进展的领域。这固然能加速解决现有范式内的核心问题,提升效率,但可能同时削弱了对数据匮乏、高风险、高不确定性的原创性、颠覆性问题的探索动力。

研究团队指出,这种趋势可能导致科学界困于现有认知的「局部最优解」,而减少了在更广阔、更多元的未知领域进行「分散搜索」的机会。长此以往,科学发现的内涵可能从「提出新问题」向「优化旧方案的答案」倾斜。

图片

图 3:AI 领域后续参与度降低且重叠研究更多。

该研究实质上是在呼吁一种更全面、更平衡的 AI 赋能科学愿景。研究者建议,未来的 AI 系统不应仅仅作为认知能力的放大器,更应发展为感知与实验能力的拓展器。

这意味着 AI 需要帮助科学家去探索、选择并收集来自此前难以触及领域的新型数据,例如设计新型实验、操控机器人实验室、或模拟极端条件,从而主动创造知识探索的新前沿,而非仅仅在现有数据上精耕细作。

笔者小结

作为科技前沿的参与者与旁观者,笔者在日常中也常能看到 AI 闪烁的发光点。遍历内容,却发现这些发光点大都依托在已有的实验基础之上,算是站在了巨人的肩膀上更进一层。

AI 带来的学术突破似乎已经将重点从学术转变为了 AI,各类大模型、智能框架的产生,都是为了方便研究者快速完成实验、达到理想中的结果。这并非不是 AI 所带来的时代红利,但人类总要保持对探索未知的热忱。

论文中表示,分析的局限,包括识别方法可能遗漏未明确提及的 AI 使用、主要聚焦自然科学而未涵盖人文社科等。生成式 AI 的影响也尚数据来充分评估。但在 AlphaFold、自动化实验室和大模型辅助写作不断加速科研的当下,这种张力,可能正是未来科学必须正视的问题。

相关报道:https://www.science.org/content/article/ai-has-supercharged-scientists-may-have-shrunk-science

nature 是一款较新的编程语言,其轻量简单,易于学习。在设计理念和运行时架构上参考了 golang ,同时有着更丰富的语法特性,更适用于业务开发,并在持续探索更广泛的应用领域。

性能是衡量编程语言核心竞争力的关键指标,接下来我们将从 IO 并发、CPU 计算、C 语言 FFI 、协程性能四个维度,并以 golang 作为基准对 nature 编程语言进行性能测试。

测试环境

配置项详情
宿主机Apple Mac mini M4 ,16GB 内存
测试环境Linux 虚拟机( Ubuntu 6.17.8 ,aarch64 架构)
编译器 / 运行时版本Nature:v0.7.0 ( release build 2025-12-15 )
Golang:go1.23.4 linux/arm64
Rust:cargo 1.85.0
Node.js:v20.16.0

所有测试均采用相同的代码逻辑实现,文中代码示例均以 nature 编程语言为例。

IO 并发

IO 并发是网络服务的核心能力,本测试通过 HTTP 服务端压力测试,综合考察语言的 IO 调度、CPU 利用率与 GC 稳定性。

nature 代码示例

import http  
  
fn main() {  
    var app = http.server()  
  
    app.get('/', fn( http.request_t req, ptr<http.response_t> res):void! {  
        res.send('hello nature')  
    })  
  
    app.listen(8888)  
}

ab 工具测试命令

ab -n 100000 -c 1000 http://127.0.0.1:8888/
  • -n 100000: 总请求数 10 万次
  • -c 1000: 并发数 1000

测试结果

Nature vs Golang: 性能基准测试3

可以看到 nature 在 HTTP 并发性能上超越了 golang ,这对于早期版本的编程语言来说可以说是不错的成绩。

由于 nature 和 node.js 均使用 libuv 作为 IO 后端,所以 node.js 也参与到基准测试中(libuv 线程不安全,node.js 和 nature 的事件循环均在单线程中运行),但 nature 作为编译型语言其并发处理能力远胜过 node.js 。

CPU 计算

使用经典的递归斐波那契数列计算 fib(45) 来测试语言的 CPU 计算与高频函数调用开销。

nature 代码示例

fn fib(int n):int {
    if (n <= 1) {
        return n
    }
    
    return fib(n - 1) + fib(n - 2)
}

测试方法

time ./main
1134903170./main  2.50s user 0.01s system 101% cpu 2.473 total

测试结果:

Nature vs Golang: 性能基准测试2

nature 和 golang 均采用自研的编译器后端,性能上也相差无几。而耗时高于 rust 的主要原因之一是两者在函数运行前进行了额外处理。

golang 采用了抢占式调度,不需要关注 GC safepoint ,但仍需要关注协程栈是否需要扩容,也就是下面的汇编指令

nature 采用了协作式调度,所以需要处理 GC safepoint 。但 nature 采用共享栈协程,所以不需要关心栈扩容问题。

nature 的 safepoint 实现仍有优化空间,若后续采用 SIGSEGV 的触发模式,函数调用性能将会得到进一步提升。

nature 和 golang 采用了截然不同的调度策略和协程设计方案,这会带来哪些不同呢?不妨看看后续的测试 👇

C 语言 FFI

通过调用 1 亿次 C 标准库中的 sqrt 函数,测试与 C 语言的协作效率。

nature 代码示例

import libc  
  
fn main() {  
    for int i = 0; i < 100000000; i+=1 {  
        var r = libc.sqrt(4)  
    }  
}

测试结果

Nature vs Golang: 性能基准测试1

可以看到在 C FFI 方面,nature 相较于 golang 有着非常大的优势,这是因为 golang 的 CGO 模块有着非常高的性能成本,独立栈协程和抢占式调度设计与 C 语言难以兼容,需要经过复杂的处理。

而 nature 的共享栈和协作式调度设计与 C 语言更兼容,不仅仅是 C 语言,只要符合 ABI 规范的二进制库,nature 都能直接进行调用。

在高性能计算、底层硬件操作等场景中,nature 可无缝集成 C / 汇编编写的核心模块,弥补 GC 语言在极致性能场景下的不足,兼顾开发效率与底层性能。

协程

协程是现代并发编程的核心组件,本测试通过 “百万协程创建 + 切换 + 简单计算” 场景,评估 Nature 与 Golang 的协程调度效率、内存占用与响应速度。

nature 代码示例

import time  
import co  
  
var count = 0  
  
fn sum_co() {  
    count += 1  
    co.sleep(10000)  // ms, Remove this line if no sleep
}  
  
fn main() {  
    var start = time.now().ms_timestamp()  
    for int i = 0; i < 1000000; i+=1 {  
        go sum_co()  
    }  
  
    println(time.now().ms_timestamp() - start)  // create time
    
    int prev_count = 0  
    for prev_count != count {  
        println(time.now().ms_timestamp() - start, count)  
        prev_count = count  
        co.sleep(10)  
    }  
    println(time.now().ms_timestamp() - 10 - start) // calc time
    co.sleep(3000) // ms
} 

测试结果

Nature vs Golang: 性能基准测试4

语言创建耗时(ms)计算耗时(ms)无 sleep 计算耗时(ms)占用内存
Nature540564170900+M
Golang100010151402500+M

nature 的协程在综合性能上非常优秀,内存占用更是远低于 golang 。而这是建立在 nature 的协程调度器未进行优化的前提下,预计在后续的版本中 nature 的协程调度器会进一步优化,届时将会有更加亮眼的表现。

总结

这是一次非专业的性能测试,但在粗略的测试中,nature 编程语言展现出了超越预期的能力与潜力。作为早期的编程语言,其运行时和编译器还有着非常大的优化空间,在正式版本发布时性能将进一步提升。

以现在的性能表现来看,nature 无疑是值得关注和尝试的编程语言,尤其是在云原生、网络服务、API 开发等服务端开发领域。


这是 nature 编程语言的官网 https://nature-lang.cn/ 如果你感兴趣的话也可以加入讨论组,v ➡️ nature-lang


📌 转载信息
原作者:
weiwenhao
转载时间:
2025/12/26 11:46:26