美团 杀疯了 黄仁勋的物理AI全球 字节 阻击 !联手投资00后大模型 媒体AGI (美团杀孰)

2025年开年,张一鸣和王兴要在 AI 范围“大干一场”。

1月13日信息,00后团队创立的3D生成大模型公司“影眸科技”今天宣布成功数千万美元 A 轮融资。本轮由美团龙珠、字节跳动领投,老股东红杉中国种子基金及奇绩创坛继续跟投,光源资本担任独家财务顾问。

影眸表示,此次融资将进一步推进3D大模型的前沿探求,同时推进以3D生成大模型Rodin为中心的Hyper3D系列产品在全球市场的商业化落地。目前,Rodin上线45天后即成功100万美金年经常性支出(ARR),并继续高速增长。

理想上,这不是字节跳动、美团初次入局 AI 范围。美团除了收买光年之外,还投资了“大模型独角兽”智谱,智能龙头宇树科技、具身机器人公司银河通用等多家 AI 相关公司;字节跳动则投资深圳未来机器人、智能机器人公司Syrius炬星、AI芯片龙头“摩尔线程”等项目,并且自家发力豆包大模型、火山引擎MaaS等多个 AI 技术服务。

如今,美团、字节跳动初次规划3D生成大模型赛道——而3D生成常被以为是“全球模型(World Model)”的 “最后一块拼图”。同时,英伟达CEO黄仁勋近期在CES 2025上公布开源“全球模型”平台Cosmos,为机器人、智能驾驶汽车等提供物理 AI 系统,凸显英伟达从GPU(图形处置器)芯片到模型层启动 AI 产业链规划。

上周CES 2025展会时期,智源研讨院开创理事长,美国国度工程院外籍院士张宏江对媒体AGI表示,物理模型、全球模型其实是人类走向通用人工智能(AGI)的必经之路,2025年 AI 范围肯定会有一些一日千里的进度。但同时,AGI落地依然还有很长的路要走。

很显然,作为英伟达在中国的两大协作同伴,字节跳动、美团投资“全球模型”相关企业影眸科技,片面“阻击”了黄仁勋的物理 AI 全球。

00后团队发力AI 3D大模型,大厂下注前夕迟迟未融资

这家被美团、字节跳动同时瞄准的影眸科技,成立于2020年,孵化自上海科技大学外部,是一个拥有00后开创研发人员的公司。

影眸科技开创人包括四位——吴迪、张启煊、张龙文、曾初啸,团队平均年龄 24 岁,努力于打造最贴近行业规范(Production-Ready)的 3D 大模型产品,协助用户成功高效简易的 3D 创作。

成立四年来,影眸科技研发团队与上科大共同提出的可控 3D 原生 DiT生成框架 CLAY 与 3D 服装生成框架 DressCode,均获计算机图形学顶会 ACM SIGGRAPH 2024 最佳论文提名,其研讨将 3D 生成质量带入一个新的高度,被以为是新一代 3D 生成基础框架。

2024年3月,影眸科技公布3D生成平台Rodin Gen-1,拥有逾越40亿参数,经过输入图像或文字,能够生成规范网格的高质量四边面几何模型及PBR材质,并于去年7月成功100万美金年经常性支出(ARR),坚持高速增长,是事先最高商用规范的3D生成工具。

2024年底,影眸科技公布 Rodin Gen-1.5 版本,经过新一代 3D 原生表达,片面处置行业内终年存在的薄面与边缘锐度疑问,再次提高3D生成全行业商用规范,并且引发对全球 3D 生成范围的关注。

但是在本轮字节、美团领投影眸科技之前,该公司一度Drop了融资。据暗涌报道,2023年10月,消耗半年、简直倾注一切精气的一轮融资被drop后,影眸科技开创人吴迪整集团都是懵的。来不及思索更多,影眸科技启动了成立以来第一次性性大规模人员调整。吴迪本想迅速融一轮小钱保证公司运营,但融资的失利坚决了他们拓展全品类3D资出现成才干的想法。

“在提效游戏工业上,3D生成能做的远不及Midjourney。之前在实验室,我们觉得技术等于产品等于公司,但其实技术不等于产品,也不等于公司。所以影眸这次把商业化瞄准“游戏外包”,在游戏建模环节,从原画到建模完毕,存在一系列或许要返工数次的“废稿”。如今,原画的三视图成功后,可以先用Rodin生成建模草稿,详细细节再由建模师调整,在建模最末尾的中模或预览阶段增加本钱,或是运转于一些周边的不关键资产。”影眸科技团队表示。

理想上,过去几年里,生成式 AI 技术曾经在文字、图像、音频、视频取得严重进度,而3D生成常被以为是“全球模型”的“最后一块拼图”。

所谓“全球模型”,是一种模拟理想全球复杂性的计算机模型,它经过整合各种数据和信息,来预测和解释全球各地的现象和事情,从而协助人们更好地了解全球运转的形式,并作出决策。相比于大言语模型,“全球模型”事以视觉感知为中心,用“预测下一个token”这种看似只包括地道统计概率的目的来训练模型言语和深度学习,成功从机器学习到物理 AI 全球。

2024年,AutoDesk、Meta、英伟达、腾讯、微软等纷繁推出了自己的 3D 生成大模型,积极规划这一前沿范围,同时也是大厂想要经过投资规划抢占未来内容外形的关键范围之一。网易云音乐前高管王诗沐成立的AI 3D创业公司全灵(SEELE)日前成功千万级美元Pre-A轮融资,投资方包括百度战投、美图投资、富坤创投、Webtime Information S&T等。

黄仁勋以为,“全球模型”是物理 AI 时代的技术环节之一。“机器人技术的 ChatGPT 时辰行将到来。与大言语模型一样,全球基础模型关于推进机器人和智能驾驶汽车开发至关关键,但并非一切开发者都具有训练自己的全球模型的专业知识和资源。我们创立Cosmos是为了让物理 AI 普及化,让每个开发者都能用上通用机器人技术。”

图灵奖得主、Meta AI首席迷信家杨立昆(Yann LeCun)提到,大模型(LLMs)无法抵达人类智能,不是 AI 技术真正的展开方向。ChatGPT等生成式 AI 产品永远无法成功像人类一样的推理和方案才干,而是以为在机器中发明“超级智能”,研发下一代 AI 系统——全球模型,才是真正的AGI。

“不要学习大模型,这些技术掌握在大公司的手中,你没有什么可以做的。你应该研讨下一代 AI 系统,以打破大模型的局限性。”杨立昆和李飞飞都以为,“全球模型”处置了很多未来 AI 在视觉感知层面的应战。

字节、美团把 AI 当作“一号工程”

自ChatGPT公布以来,字节跳动和美团这两家互联网巨头片面发力 AI 技术和落地,但两家出现形式各不相反。

其中,美团关于 AI 的规划处于“半遮半掩”,比拟地下的是对 AI 范围的投资和收买。

2023年6月,美团收买了王慧文创立的AI公司光年之外,收卖价约为人民币20.65亿元;2023年11月,美团开放的大模型“通慧”取得备案审批,可以对外启动服务。同时,美团外部也有科技创新、算力业务部门以及投资业务,已投资智谱、宇树科技、银河通用机器人、小雨智造等企业。

2024年5月,美团对外内测了一款基于生成式 AI 技术的语义了解文娱小程序“妙刷”,用户经过上传图片,智能识图并输入“梗文字”,并且美团还推出AI运转如“Wow”、“问小袋”和“AI写真馆”等。此外,美团还探求过AI+配件,研发了一款名为“俏鱼”的AI运转,并和儿童穿戴设备厂商“小天分”达成协作。

媒体AGI了解到,目前美团战投、美团龙珠外部关于 AI、机器人等先进科技范围的投资十分关注,美团外部也一直注重算法技术、模型技术的运转落地。

字节跳动关于 AI 的关注力度更大,除了投资多家 AI 公司外,字节外部也拥有豆包大模型,近期,智源研讨院公布最新评测,触及国际外100多个开源及商业闭源大模型,豆包大模型在中文才干评测、言语模型评测、视觉言语模型等范围表现优秀,远超大模型“六小虎”、百度、腾讯等公司研发的多款 AI 大模型才干,位居榜首。

同时,字节跳动还在“卷”算力。研讨机构Omdia报告显示,字节跳动2024年推销约23万片英伟达GPU芯片,成为英伟达全球第二大买家,跨越Meta、亚马逊和谷歌等美国科技巨头。

往年11月的全球月生动排行榜上,豆包App的MAU(月生动用户数)靠近6000万,仅次于OpenAI的ChatGPT,位列全球第二;截至2024年底,豆包大模型日均tokens经常经常使用量逾越4万亿,公布7个月以来增长逾越33倍。

2024年12月18日,火山引擎总裁谭待宣布,豆包视觉了解模型输入多少钱仅为0.003元/千tokens,1块钱可处置284张720P的图片,比行业多少钱廉价85%。

谭待对媒体AGI披露,目前国际安卓手机大部分都在和豆包协作,对手机厂商来说,会在某些场景用豆包,某些场景用其他的大模型,或许某一个场景混合经常经常使用,对企业用户来说,必需也要求一个多云或许多模型的战略,“最终还是才干更好、本钱更低,就会用谁,这笔账就很好算。”

谭待强调,以后字节并不关注市场竞争,由于大模型市场仍处于早期阶段,更多是场景、需求能否被满足。终年来看,大模型C端和B端、虚拟和理想全球场景都应该齐头并进度开。

“这个市场还在很早期,或许千分之一刚刚开收回来。这个时辰其实不用关心竞争的疑问,要求关心的是用户的需求有哪些还没有被满足。”谭待表示,最关键的是能不能把东西做好,把方案的落地运转做好。

OpenAI CEO奥尔特曼(Sam Altman)曾断言:“我们会有越来越好的模型。”

影眸科技强调,我们很快就会迎来 3D 范围的“ChatGPT”时辰。

(本文首发于媒体App,作者|林志佳,编辑|胡润峰)

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门