GPT-5.4 正式发布：AI 开始替你「动鼠标」，我们的工作流程正在被重写

2026-03-10 AI资讯

─────── CONTENT ───────

你的电脑开始「自己动」了

2026年3月8日凌晨，OpenAI 扔下一颗重磅炸弹——GPT-5.4 正式发布。

这不是一次普通的模型迭代。GPT-5.4 是首个具备原生计算机操作能力的通用 AI 模型。简单来说，它不再需要你去操作 Excel、PPT、邮件客户端——它直接替你点鼠标、敲键盘、跨应用执行复杂任务。

在 OSWorld 基准测试中，GPT-5.4 达到 75.0% 的成功率，正式超过人类平均水平的 72.4%。

这意味着什么？AI 从「会聊天」正式进化到了「会干活」。

根据 OpenAI 官方数据和早期用户实测：

更关键的是，GPT-5.4 无需额外插件，直接通过截图识别界面、发出鼠标键盘指令，实现跨应用工作流自动化。

ChatGPT 桌面客户端已上线该功能，订阅用户可直接升级体验。

OpenAI 同步推出 GPT-5.4 API，支持开发者自定义操作流程和技能插件。

可以预见，很快就会出现专门「替人做 PPT」「自动整理发票」「一键生成周报」的 AI 技能插件生态。

GPT-5.4 的发布，标志着一个趋势加速到来：

人类的工作，正在被拆解成 AI 可执行的「原子操作」。

过去我们用鼠标和键盘与计算机交互，未来我们可能只需要说一句话，AI 就完成了一整套跨应用操作。

但这也意味着，「会用软件」这个技能正在贬值。未来值钱的能力，是定义问题、判断结果、创造性思考——而不是记忆 Excel 快捷键。

就在 GPT-5.4 发布的同时，工信部网络安全威胁和漏洞信息共享平台发布预警：

OpenClaw（俗称「AI 龙虾」）被曝存在严重安全隐患。大量实例裸奔公网，可能成为黑客攻击的入口。

这提醒我们：AI Agent 的能力越强，安全边界就越重要。当 AI 真正开始「操作我们的电脑」，权限管理和数据隔离将成为核心议题。

GPT-5.4 不只是一个新模型，它是一个信号：

AI 从「副驾驶」变成「执行者」的时代，已经来了。

对于打工人来说，这既是威胁也是机会——威胁是那些重复性的桌面操作工作将加速被替代；机会是，我们可以把更多时间花在真正需要人类创造力的事情上。

你会把日常办公任务交给 GPT-5.4 吗？

欢迎在评论区聊聊你的看法。

本文部分信息参考 OpenAI 官方公告及行业媒体报道

─────── EOF ───────

─────── COMMENTS ───────

$ cat comments.md

💬 使用 GitHub 账号登录即可发表评论