腾讯WorkBuddy发布升级:支持微信一键直连与自动化任务执行
腾讯云代码助手团队升级WorkBuddy桌面智能体,新增微信扫码一键直连功能,用户可通过手机微信远程操控PC端智能体。同时,产品接入企业微信WebSocket长链接,提升了远程连接的稳定性和断连重连效率。
基准测试不等于真实能力?研究称AI代码“通过率”或被高估最高达7倍
研究指出,SWE-bench Verified基准测试可能高估AI编程能力。该测试中被判“通过”的AI代码方案,约一半在实际项目审核中会被拒绝,显示自动化评测与真实工程质量存在明显差距。这一发现对AI辅助软件工程评估标准提出了重要质疑。
多款 AI 机器人安全护栏遭挑战:调研显示仅 Claude 系统性拒绝协助暴力策划
CNN与反数字仇恨中心联合测试显示,主流AI聊天机器人在模拟青少年暴力倾向情境下,安全机制普遍薄弱,难以有效防范风险。
算力竞赛新布局:Meta 计划于 2027 年底前部署四代自研 AI 芯片
Meta计划在2027年底前部署四代自研AI芯片,以减少对英伟达等外部供应商的依赖,为AI业务提供定制化算力支持,以在全球AI竞赛中掌握主动权。
Anthropic 更新 Claude Excel 与 PowerPoint 插件:新增共享上下文与可复用工作流
Anthropic升级Claude的Excel与PowerPoint插件,新增共享上下文、可复用工作流程和更广泛云平台支持。用户可在同一会话中跨应用操作,Claude能连续读取Excel数据、编辑公式并同步修改PPT内容,无需重复输入,显著提升办公协作与数据分析效率。
端侧 AI 新突破:联想官宣首发一键部署 OpenClaw 的 AI 平板
联想小新宣布在平板行业首发端侧一键部署OpenClaw AI技术,覆盖小新Pro 13等多款高端平板,推动“龙虾”系列智能体从PC向安卓平板扩展。其核心PadClaw技术实现完全本地化处理,相比云端AI,在交互性、响应速度和隐私保护方面更具优势。
美团升级“星眸”大模型,外卖食安开启“全天候监工”模式
美团升级“星眸”AI系统,通过多模态大模型与软硬件结合,实现后厨风险秒级阻断,推动餐饮监管从事后追责转向事前预警。该系统已完成超19亿次巡检,成为全天候数字化督导,提升外卖行业卫生规范水平。
消息称微信自有独立 AI 模型曝光并计划年内落地
微信正秘密研发自有AI模型,已完成基础建设并内部命名,预计2026年对外推出。此举旨在摆脱对第三方系统的依赖,通过内置AI工具增强社交与工具功能。该模型核心目标将全面接入微信小程序生态。
Perplexity 版“小龙虾” Personal Computer发布:基于 Mac mini 的全天候 AI 智能管家
Perplexity推出云端智能体服务Personal Computer,通过苹果Mac mini作为本地支点,将用户本地文件、应用与云端AI结合,打造全天候智能助手。它旨在超越传统问答模式,成为主动协作的专属智能系统。
谷歌 Gemini 侧边栏推向全球,印度、加拿大用户率先体验
谷歌正加速将Gemini模型整合至Chrome浏览器侧边栏,现已扩展至印度、加拿大和新西兰等地区。用户无需切换标签页即可通过侧边栏直接使用AI功能,标志着谷歌全球化协同办公战略迈出关键一步。