华为的准万亿大模型,是如何训练的?

三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的「石器时代」中,为后世留下了变革的火种。近十年前,美国硅谷的互联网巨擎在理论和工程等方面,突破了MoE模型的原始架构,让这个原本被置于学术高阁的理念,化身成为了随后AI竞争的导火索。如今,后发优势再一次来到了大洋此岸,...

训练大模型,终于可以“既要又要还要”了

三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的「石器时代」中,为后世留下了变革的火种。近十年前,美国硅谷的互联网巨擎在理论和工程等方面,突破了MoE模型的原始架构,让这个原本被置于学术高阁的理念,化身成为了随后AI竞争的导火索。如今,后发优势再一次来到了大洋此岸,...

首次打榜就登顶,华为盘古如何以小胜大?

三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的「石器时代」中,为后世留下了变革的火种。近十年前,美国硅谷的互联网巨擎在理论和工程等方面,突破了MoE模型的原始架构,让这个原本被置于学术高阁的理念,化身成为了随后AI竞争的导火索。如今,后发优势再一次来到了大洋此岸,...

智驾的遮羞布被掀开

出品丨环球财经网汽车组作者丨肖漫头图丨电影《终极对弈》“企业做宣传时,讲得天花乱坠,说是端到端、数据驱动,有各种各样的新词,但对普通消费者来说,很简单,上车以后 5 分钟能不能感觉产品是完全与众不同的,是可以信赖的,这样的产品才能去卖。”今年年初,地平线苏箐在媒体交流会中有感而发的这段话,仍旧警示车...

谁能成为中国版的AI Google?

本文来自微信公众号:王智远,作者:王智远,题图来自:AI生成上周,被谷歌 I/O 发布会“刷屏”了。各种重磅模型、产品更新、技术演示,还有关于“谷歌又领先了”的讨论,在朋友圈铺天盖地。这些内容,大家已经看得不少,这里也不再多讲。但如果只盯着功能细节和技术亮点,就很容易陷入局部,忽略背后更深层的动因。...