网页客服,欢迎咨询
联系我们
      工作时间
  • 周一至周五:09:00-17:30
  • 周六至周日:10:00-16:00
一城之力反超美国巨头们,杭州这几家企业火了
2024-12-31 21:40:36 84603
  • 收藏
  • 管理

    一城之力反超美国巨头们,杭州这几家企业火了

    杭州AI一夜火了。

    有网友调侃道,很有意思啊!我们小小的杭州,干掉美国三大科技巨头。

    一城之力反超美国巨头们,杭州这几家企业火了

    一家名叫幻方量化(Deepseek)的AI公司,干出来拼多多式的伟业,让全世界为之震撼,把AI训练成本直接打下来99%,打破了OpenAl的霸权;

    一家名叫宇树(Unitree)的机器人公司,干掉了美国最知名的工程与机器人设计公司波士顿动力,秒杀原本的液压技术路线,反超波士顿动力的机器狗;

    一家名叫毫微(Nano Labs)的无晶圆厂IC设计公司,刚刚推出FPU3.0 AI ASIC设计架构,同类产品已超英伟达的五倍以上。

    在科技圈,一直流传着“AI四小龙”商汤、旷视、云从、依图科技;“大模型六小虎”智谱、MiniMax、月之暗面、百川、零一万物、阶跃星辰。现在,杭州也有了自己的AI三支柱。

    改变AI时代的底层逻辑

    众所周知,AI大模型越智能,支持的场景越多,就意味着它需要的芯片和算力就越多。

    全世界的算力需求,让英伟达从一家显卡厂商,硬生生蜕变成一家三万亿美元市值的巨无霸。

    但哪怕是英伟达、AMD、英特尔等全部半导体公司加起来,也满足不了AI市场逐年上扬的算力需求。

    就在所有AI公司都苦于算力缺口之际,来自中国杭州的一家AI创企幻方量化,发布了一个参数量高达671B的大模型:DeepSeek-V3。

    更让人惊讶的是,DeepSeek-V3仅仅只用了2048块GPU训练了2个月,且只花费557.6万美元。对比OpenAI的GPT-4o,它的训练成本约为1亿美元,至少在10000个GPU的计算集群上训练。

    也就是说,幻方量化只用了五分之一的芯片,二十分之一的成本,就训练出一个参数量第一梯队的大模型。

    DeepSeekMoE

    DeepSeekMoE

    这样的成绩瞬间引爆了整个AI市场。

    前OpenAI联合创始人、Tesla AI团队负责人Andrej Karpathy在社交平台发文赞叹道:”Llama 3 405B使用了3080万GPU小时,而DeepSeek-V3看起来是一个更强大的模型,仅使用了280万GPU小时(计算量约为十分之一)。“

    “如果DeepSeek-V3的优良表现能够得到广泛验证,这一模型将是在资源受限的情况下,在研究和工程方面让人印象深刻的一次展示。”

    据DeepSeek-V3研发团队表示,之所以能用较低的价格完成高难度大模型训练,主要是采用了高效推理的多头潜在注意力(MLA)和用于经济训练的DeepSeekMoE。

    多Token预测目标(Multi-Token Prediction,MTP)有利于提高模型性能,可以用于推理加速的推测解码。并采用一种创新方法,将推理能力从长思维链模型(DeepSeek R1)中,蒸馏到标准模型上。

    这种“分布式推理”的方式早有人提出,例如OpenAI联合创始人兼前首席科学家Ilya Sutskever就曾经说过:“我们已经达到了数据峰值,AI预训练时代无疑将终结。”

    但没想到的是,一直将中国大模型视为“廉价替代品”的美国企业,在“分布式推理”领域上,被一家中国杭州的企业先拔头筹,用技术给他们好好上了一课。

    可以说,DeepSeek-V3让AI世界享受到了拼多多式的快乐。

    从机器人到半导体设计

    如果说DeepSeek-V3的出现,让硅谷巨头们真切意识到中国AI产业的进步速度,而宇树(Unitree)和毫微(Nano Labs)则继续让他们处于“持续应激”之中。

    前不久,宇树发布了旗下行业级机器狗B2-W(B2机器狗的进阶版)的炫技视频,在视频中,B2-W机器狗演示了如何爬山、涉水、越障,克服崎岖地形、颠簸路面流畅行走。

    除此之外,B2-W机器狗还能完成高难度的杂技动作:原地旋转稳停、两足倒立旋转、2.8米高楼飞跃。另外,该机器人可负载40千克行走,一个成年男性的重量不在话下。

    宇树B2-W机器狗视频引发了全网热议,就连太平洋彼岸的马斯克,也忍不住转发并评论称赞。

    B2-W机器狗不仅仅是一个“高价宠物”,它最适合的场景是专业领域,比如安防巡检、勘测探索、公共救援、医疗防疫陪护等危险厂家,让人员避免事故风险。

    据新华社12月14日报道,警用机器狗加入成都市公安局高新区分局巡逻大队,开展安全巡逻和宣防工作。

    值得一提的是,机械狗原本是美国高科企业的代表,就比如波士顿动力,从2005年就开始研发出第一款“大狗机器人”。

    彼时,宇树基本上只是波士顿动力的跟班,跟着大佬的脚步一点点“照猫画虎”,从产品形态再到商业生态位,宇树一直走的是波士顿动力“平替版”路线。

    然而仅仅只过了数年时间,宇树就成功研发出运动性更高、平衡性更强的动轮方案,取代了波士顿动力的四足方案,一年时间里完成了能在户外环境里跋山涉水的训练。

    不少波士顿动力的死忠粉纷纷破防,还觉得宇树B2-W机器狗的视频一定是AI生成的CGI画面。

    宇树B2-W机器狗除了大模型和机器人,在半导体领域,也有一家杭州公司,对“巨人”英伟达发起了冲锋。

    那就是毫微(Nano Labs)。

    12月26日,Nano Labs正式推出FPU3.0,采用ASIC架构,在能效上实现了五倍的提升,树立了能源高效、高性能ASIC的新标准。能广泛应用于AI推理、边缘AI计算、5G数据传输处理和网络加速等领域。

    作为AI与区块链技术的老玩家,Nano Labs是国内领先的无晶圆厂IC设计公司,从2022年就陆续推出多款HTC和HPC芯片设计的全新基础构架芯片。

    目前来说,ASIC架构芯片已经成为AI世界的主流选择。

    在执行大规模特定的AI任务时,ASIC可以针对特定应用设计的专用芯片,进一步提高计算的效率、降低功耗并提高性能。

    摩根士丹利在12月15日发布研报《AI ASIC 2.0:潜在赢家》认为ASIC凭借针对性优化和成本优势,有望逐步从英伟达GPU手中争取更多市场份额。

    预计AI ASIC市场规模将从2024年的120亿美元增长至2027年的300亿美元,年复合增长率达到34%。

    目前,ASIC芯片朋友圈逐步扩大,谷歌、Meta、微软、亚马逊等大厂都将推出自家AI ASIC芯片。

    为什么是杭州?

    “中美贸易战里最大矛盾,是华盛顿市宾夕法尼亚大街1600号临时居民与深圳市南山区粤海街道企业之间的纠纷。”

    这是前几年最火热的段子,而“华盛顿市宾夕法尼亚大街1600号”是指美国白宫;

    “深圳市南山区粤海街道企业”则是指华为、大疆、中兴、腾讯等坐落在深圳南山区粤海街道的中国科技大厂们。

    如今中美贸易战热度降低,科技斗争的矛盾点逐渐转移到了当下互联网的核心:AI。

    同样,和美国科技巨头的对抗前线,也从深圳南山区转移到杭州。

    很多人不知道,早在AI浪潮之前,杭州就已经被称为人工智能的“东方硅谷”,更是国内第一座“人工智能之城”。

    杭州城市大脑

    杭州城市大脑

    2016年10月,杭州成为全世界第一个启动“城市大脑”基础建设。

    杭州将安装一个人工智能中枢:杭州城市数据大脑。让数据帮助城市来做思考和决策,将杭州打造成一座能够自我调节、与人类良性互动的城市。

    美国著名城市理论家、社会哲学家Lewis Mumford在著作《技术与文明》中提及,人类城市发展分成三个阶段:古希腊城市(初始文明),中世纪基督教城市(商业文明),近代和现代工业城市(工业文明)。

    全世界第一个启动城市大脑的杭州,将对城市文明发起第四次浪潮,一个基于互联网、数据和人工智能的“科技之城”。

    如果你问我,为何是杭州?为何是他们?为何是今年?

    那么这就是答案。



    上一页:小桔充电发布2024年度报告:已累计服务超2300万用户,充电度数约245亿度 下一页:零售电商年度趋势:巨头上演“大换手”
    全部评论(0)