华为是怎么让大模型提速的? 没有人不在期待大模型能够成为下一个电动车,作为代表中国的新兴产业,在世界范围内掀起狂澜。然而主流的MoE架构大模型,却苦于其结构上的“先天不足”:巨大的硬件成本与多重拖累效率的环节,使得中国企业在这场芯片堆砌与效率挖掘的苦径上难以提速。作为智能基础设施提供商,华为在这场战役中另辟蹊径,利用其在数学算...
百度AI,进入回报期 被资本市场低估的百度,如今已靠着AI实现快速增长。5月21日美股盘前,百度发布2025年第一季度(Q1)财报,为真实反映百度基本面,本文仅讨论百度核心(百度集团剔除爱奇艺)的业绩表现:-核心收入稳步增长:25Q1百度核心总营收约255亿元,净利润76亿元,同比增长48%; -智能云增速领跑:25Q1...
华为+DeepSeek,终于不再“服务器繁忙”? 没有人不在期待大模型能够成为下一个电动车,作为代表中国的新兴产业,在世界范围内掀起狂澜。然而主流的MoE架构大模型,却苦于其结构上的“先天不足”:巨大的硬件成本与多重拖累效率的环节,使得中国企业在这场芯片堆砌与效率挖掘的苦径上难以提速。作为智能基础设施提供商,华为在这场战役中另辟蹊径,利用其在数学算...
对话季宇:大模型非必须在GPU跑,CPU内存带宽已足够 出品 | 环球财经网科技组作者 | 丸都山编辑 | 苗正卿头图 | 行云集成电路在北京万泉河畔的一幢写字楼内,我初次见到季宇。他的身上有着多个令人瞩目的标签:前华为“天才少年”;昇腾编译器专家;清华大学计算机科学博士;CCF(中国计算机学会)优秀博士学位论文获得者。两年前,季宇从华为离职后,创办了行...
R2来之前,DeepSeek又放了个烟雾弹 出品|环球财经网科技组作者|宋思杭编辑|苗正卿头图|视觉中国5月前后,DeepSeek的动作倒是频繁,却都不是大家期待的R2。不过,一系列前菜已经给R2做足了铺垫。5月14日,一篇DeepSeek V3论文,揭示了梁文峰是如何做到“极致降本”的。这篇论文也让业界得以一窥这家以技术立身的公司,其“内功...
DS爆火100天,创业者想拜拜梁文锋 本文来自微信公众号:字母榜,作者:马舒叶,编辑:赵晋杰,题图来自:AI生成2024年底还徘徊在倒闭边缘的张旸(化名),年初就接到了DeepSeek带来的泼天富贵。“没能倒闭,全靠DeepSeek。”作为一家AI硬件企业的创始人,张旸去年把国内大小投资机构的码头拜了个遍,尽管出身大厂,却没拿着高管ti...
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻 出品|环球财经网商业消费组作者|苗正卿题图|环球财经网拍摄5月8日,在海淀大恒科技中心的阶跃星辰北京办公地,阶跃星辰创始人、CEO姜大昕身着深色西服、蓝色衬衫出现在阶跃星辰北京办公地的会议室里。他保持了一贯的风格,如二十一年前在新加坡南洋理工教书时,像老师一样在屏幕前平静地讲述自己对于多模态模型行业...
GPT-4o过于谄媚,“赛博舔狗”惹争议 出品|环球财经网科技组作者|孙晓晨编辑|苗正卿头图|视觉中国针对GPT-4o“过于谄媚”的表现,OpenAI首席执行官奥特曼公开承认该问题,表示会尽快修复。据奥特曼在社交平台X发布的讯息,OpenAI已开始回滚GPT-4o的最新更新,截至当地时间4月29日,免费版本已100%回滚完成,预计晚些时候,...
饥渴的大厂,面对大模型还需新招 本文来自微信公众号:王智远,作者:王智远昨天晚上,跟朋友聊起大模型。他说现在各家都“卷”到一个新阶段,模型之间差距已经很小,只能用“遥遥领先”或者“吊打同行”这种词来形容。从基准测试和数据来看,很多模型都远超 DeepSeek R1、GPT-4o,但继续往下比的空间已经不大了,真正的差异更多在使用方...
对话西门子:为什么说Industrial Copilot是未来工业环境中人类的最强辅助 出品|环球财经网智库作者|冀玉洁头图丨西门子当身处成都高新区西门子工厂车间,在全自动化生产线上,几乎看不到多少操作工,只有少数工人在生产线后,操作鼠标、键盘,发出指令。这是西门子在中国的首座数字化工厂,也是WEF评选的数字化和可持续“双灯塔”工厂。这座“灯塔工厂”已经部署了近 100 个 AI 项目...