⚡ 智能体觉醒 · 原生操控电脑 & 办公长“眼睛”
2026年3月6日 · 前沿日报 —— 微软Copilot迎来视觉革命,OpenAI携GPT-5.4强势进军金融与自动化,亚马逊AI深入医疗行政。三箭齐发,重新定义人机协作。
🧠 OpenAI · GPT-5.4 旗舰登场 & 金融工具套件
🧠⚡
GPT-5.4
原生电脑操控 · 100万token
GPT-5.4
原生电脑操控 · 100万token
真正的“智能体”里程碑: GPT-5.4 深度融合推理、编码与智能体工作流,成为OpenAI首款原生支持电脑操作的通用模型。它不仅“看懂”屏幕,更能模拟键盘鼠标跨应用执行任务[citation:4]。
📊 专业优化 处理表格/演示文稿效率飙升,错误率较前代降低33%[citation:4]。
| ✨ 核心升级 | 📋 具体描述 |
|---|---|
| 🖥️ 原生电脑操控 | 直接解读屏幕画面,调用鼠标键盘完成跨软件工作流(如自动整理Excel并生成PPT)[citation:4] |
| 📈 100万token上下文 | 支持超长任务规划与全流程验证,一次性分析《三体》三部曲体量的文档[citation:2][citation:4] |
| 💰 金融工具套件 | 集成FactSet、Third Bridge数据,直接在Excel/Sheets中构建财务模型、撰写投资备忘录[citation:7][citation:8] |
| 🔍 思考过程可视化 | GPT-5.4 Thinking版本可实时展示推理步骤,用户可中途调整需求[citation:4] |
👁️ 微软 Copilot · 内置截图理解(Microsoft 365)
📸
Copilot 长“眼睛”了
原生截图工具无缝嵌入,告别保存-上传的繁琐[citation:1]
🆕 本月更新内容(路线图ID: 558105)[citation:1]
- 一键截图分析 – 在Word/Excel/Teams中点击Copilot专属按钮,直接截取当前画面并作为上下文提问。
- 视觉上下文理解 – AI不仅能读文字,还能“看懂”图表布局、UI界面,提供更精准的操作建议。
- 隐私安全设计 – 不同于Recall的自动截屏,此功能完全由用户主动触发,避免隐私争议[citation:1]。
🏥 亚马逊 · Amazon Connect Health (医疗AI代理)
$99
每用户/月
最多处理600次就诊
专为医疗机构打造的自动化代理[citation:2]
自动执行预约安排、文档记录、患者身份验证。已与EHR软件商、患者互动公司建立合作,直击重复行政任务。
| 核心功能 | 具体场景 |
|---|---|
| 📅 智能预约 | 自动匹配医生排期与患者时间,减少前台工作量 |
| 📋 临床文档辅助 | 从问诊对话中提取关键信息,生成结构化病历 |
| ✅ 身份验证 | 集成多因子验证,确保患者数据安全 |
⚡ 今日AI三叉戟:GPT-5.4迈向自主智能体 · Copilot长出眼睛 · 亚马逊深耕医疗。未来工作,正在定义。
| 资讯综合自IT之家、澎湃新闻、每经网、金十数据等 | 发布日期 2026.03.06 |
© 版权声明
本站所有图文及视频均来源于网络收集,文章均由Ai工具原创编辑,观点仅供参考!如无意中侵犯了某媒体或个人的知识产权,请来信或来电告之,本站将立即给予删除。文章版权归作者所有,未经允许请勿转载。
下一篇
没有更多了...
暂无评论...






















渝公网安备50011802010872