GPT-5.4 正式发布:AI 开始替你「动鼠标」,我们的工作流程正在被重写
你的电脑开始「自己动」了
2026年3月8日凌晨,OpenAI 扔下一颗重磅炸弹——GPT-5.4 正式发布。
这不是一次普通的模型迭代。GPT-5.4 是首个具备原生计算机操作能力的通用 AI 模型。简单来说,它不再需要你去操作 Excel、PPT、邮件客户端——它直接替你点鼠标、敲键盘、跨应用执行复杂任务。
在 OSWorld 基准测试中,GPT-5.4 达到 75.0% 的成功率,正式超过人类平均水平的 72.4%。
这意味着什么?AI 从「会聊天」正式进化到了「会干活」。
实测:40 分钟 vs 3 小时
根据 OpenAI 官方数据和早期用户实测:
- 原本耗时 2-3 小时的「Excel 报表制作 + PPT 排版 + 邮件发送」全流程
- GPT-5.4 端到端 40 分钟搞定
- 成本仅为 Claude Opus 4.6 的 一半
- 20 美元订阅额度就支持大规模使用
更关键的是,GPT-5.4 无需额外插件,直接通过截图识别界面、发出鼠标键盘指令,实现跨应用工作流自动化。
ChatGPT 桌面客户端已上线该功能,订阅用户可直接升级体验。
开发者生态爆发
OpenAI 同步推出 GPT-5.4 API,支持开发者自定义操作流程和技能插件。
- 首日超过 1.2 万名开发者注册
- 技能市场上架 300+ 预训练操作模板
- 覆盖财务、人事、运营、市场等核心岗位
可以预见,很快就会出现专门「替人做 PPT」「自动整理发票」「一键生成周报」的 AI 技能插件生态。
效率背后:我们的工作正在被「翻译」
GPT-5.4 的发布,标志着一个趋势加速到来:
人类的工作,正在被拆解成 AI 可执行的「原子操作」。
过去我们用鼠标和键盘与计算机交互,未来我们可能只需要说一句话,AI 就完成了一整套跨应用操作。
但这也意味着,「会用软件」这个技能正在贬值。未来值钱的能力,是定义问题、判断结果、创造性思考——而不是记忆 Excel 快捷键。
争议与隐忧:安全警报同时拉响
就在 GPT-5.4 发布的同时,工信部网络安全威胁和漏洞信息共享平台发布预警:
OpenClaw(俗称「AI 龙虾」)被曝存在严重安全隐患。大量实例裸奔公网,可能成为黑客攻击的入口。
这提醒我们:AI Agent 的能力越强,安全边界就越重要。当 AI 真正开始「操作我们的电脑」,权限管理和数据隔离将成为核心议题。
写在最后
GPT-5.4 不只是一个新模型,它是一个信号:
AI 从「副驾驶」变成「执行者」的时代,已经来了。
对于打工人来说,这既是威胁也是机会——威胁是那些重复性的桌面操作工作将加速被替代;机会是,我们可以把更多时间花在真正需要人类创造力的事情上。
你会把日常办公任务交给 GPT-5.4 吗?
欢迎在评论区聊聊你的看法。
本文部分信息参考 OpenAI 官方公告及行业媒体报道