腾讯混元Hy3preview上线两周Token调用量增至10倍,位居OpenRouter周榜第一
腾讯混元大模型Hy3preview上线两周后,Token调用量已达前代Hy2的10倍以上,呈现爆发式增长。代码编写与智能体构建是主要驱动力,推动腾讯内部应用WorkBuddy、Codebuddy等调用量增长超16.5倍,同时在外部开发者市场也保持领先。
谷歌Gemma4 推理速度狂飙 3 倍,离线大模型时代真的来了
谷歌近日为开源模型Gemma4推出多Token预测(MTP)起草器,利用推测解码架构将推理速度提升最高3倍,同时保持输出质量和逻辑能力。该模型发布后下载量迅速增长,成为全球最受关注的开源模型之一。
千问PC端上线AI语音输入,各类应用里“开口”直接用千问
5月7日,千问在PC端推出AI语音输入功能,用户可通过快捷键在桌面应用中使用。该功能支持口语去语气词、纠错、格式化整理,并能基于上下文智能回复,直接执行创作、问答、翻译等指令。例如,处理口误口语“会议定在两点……不对三点”时,能准确解析语义,展现出强大的语义理解能力。
OpenAI 联合英伟达等巨头发布 MRC 协议,重塑大规模 AI 训练网络架构
OpenAI联合AMD、博通、英特尔、微软及英伟达等五大巨头,发布多路径可靠连接(MRC)协议,旨在解决大规模AI训练中的网络延迟与故障问题。该协议已通过开放计算项目(OCP)开源,并推动从三层架构向两层设计的转变,以击碎“单点故障”,提升训练稳定性与效率。
Anthropic 联手 SpaceX 豪掷算力,Claude 付费用户迎来“无限速”时代
人工智能公司Anthropic宣布,因算力资源突破,所有Claude付费订阅用户(包括Claude Code Pro、Max、Team及企业版)的使用速率翻倍,并取消高峰期限制,显著提升响应速度和用户体验。
腾讯发布OpenSearch-VL:开源多模态深度搜索 agent 的“全家桶”方案
腾讯混元联合UCLA、港中文等机构,针对多模态大语言模型(MLLMs)从“被动理解”向“主动推理”进化的需求,开源了多模态搜索智能体。此前,高质量数据、自动化轨迹合成路径及训练配方的缺失,导致顶尖智能体难以复现。此次开源旨在打破僵局,推动社区发展。
OpenAI 巨资布局 AI 算力 500 亿美元投入引发行业军备竞赛
OpenAI总裁Greg Brockman披露,公司计划在2026年前投入高达500亿美元提升计算资源,以应对AI大模型训练和推理对算力的激增需求。这一投资较2017年的约3000万美元增长了数千倍,标志着生成式AI从实验阶段迈向大规模商业化。
Arm 预计明年 AI 芯片销售将达 20 亿美元
英国半导体公司Arm宣布,其首款自研AI芯片预计明年销售额达20亿美元,市场需求强劲。此举标志着Arm在AI领域的重要突破。作为软银旗下企业,Arm在全球半导体市场占据关键地位,技术广泛用于电子设备。新芯片的推出正值AI技术高速发展、行业对高效能计算需求激增之际。
Snap 与 Perplexity 的 4 亿美元合作关系 “友好结束”
Snap与Perplexity的AI搜索合作协议于第一季“友好结束”。原计划Perplexity一年内支付4亿美元整合至Snapchat,但因未达成广泛推广方案而终止。此前部分用户已进行整合测试。
无问芯穹完成超7亿元融资 加速从“电能”到“Token”效率跃升
无问芯穹完成超7亿元融资,创中国AI原生基础设施公司融资规模新高。本轮由杭州高新金投集团与惠远资本联合领投,多家机构跟投,老股东持续加码。资金将用于夯实多元异构技术扩大算力规模、强化软硬协同提升效率。