
若是您但愿不错庸碌碰面云开体育全站app,接待标星保藏哦~
着手:执行来自半导体行业不雅察概括,谢谢。
据theinformation报说念,Nvidia 完成了对 GPU 云初创公司 Lepton 的收购。
贵府显露,Lepton AI建造于2023年,由 Meta Platforms Inc. 东说念主工智能实验室前连系员贾扬清和Junjie Bai 联手创立。
两东说念主匡助开采了多种行业圭臬的 AI 用具,包括 Facebook 母公司流行的模子开采框架 PyTorch。据报说念,Lepton AI 领有约 20 名职工,其客户包括多家风险投资撑执的初创公司。
该公司的同名云平台针对 AI 使命负载进行了优化。客户不错使用它来教师 AI 模子和扩充推理,即在教师完成后在坐褥中驱动神经相聚的任务。
Lepton AI 提供了一个可视化界面,用于在其云中诞生教师集群。该公司提供多种 Nvidia 显卡供您聘任。关于同期教师多个模子的团队,该平台提供了一种用具,可用于荟萃管制分拨给每个项指标硬件数目。
在教师流程中,AI 模子偶然会遭逢荒谬,从而镌汰其输出质地。Lepton AI 平台提供了检测此类荒谬的功能。它还能发现更微小的期间问题,举例神经相聚在教师期间可能使用的内存晋升应有的内存的情况。
模子开采完成后,Laptop AI 客户不错将其部署在公司云中经过推理优化的实例上。该平台快活提供每秒晋升 600 个令牌的处理速率,同期将延伸保执在 10 毫秒以下。当需求增多时,自动推广功能会自动向客户的推理环境添加更多硬件资源。
Lepton AI 使用 vLLM 等开源用具来加快推理。该期间将肖似的 LLM 教导合并为单个申请,从而减少了模子必须扩充的处理量。开采东说念主员还使用 vLLM 来减少其模子的内存占用。
现在尚不了了 Nvidia 是寻求收购 Lepton AI 以得回其机器学习东说念主才,也曾谈论接续提供这家初创公司的云平台。该平台与几家 Nvidia 主要客户的居品竞争。其中一家客户是东说念主工智能云运营商 CoreWeave Inc.,该公司谈论至今天晚些时代进行初次公开募股。
就在英伟达可能收购 Lepton AI 的报说念发布几天前,有音问称该公司收购了另一家风险投资撑执的东说念主工智能初创公司 Gretel Labs Inc.。据报说念,这笔交往的价值晋升 3.2 亿好意思元。Gretel 提供用于创建合成数据的用具,这些数据是自动生成的,可用于教师东说念主工智能模子。
关于英伟达来说,他们也提供云中云业绩,这单收购会让他们大有裨益。Nvidia 的 DGX Cloud 于 2023 年推出,是在其他公司的云平台上提供的业绩。云提供商租用 Nvidia 的业绩器并将其部署为云,Nvidia 不错向寻求大型 GPU 超等计较机的企业营销和销售这些云。
谷歌、微软、甲骨文和 AWS 均领受该居品,其中 AWS 将于2024 年 12 月领受该措置决策。
天然这看起来很复杂,但实在开采和提供我方的云计较平台将使 Nvidia 成为其一些最大客户的平直竞争敌手——在 2024 年 11 月的 2025 年第三季度财报电话会议上,该公司默示,“云业绩提供商约占咱们数据中心销售额的一半,收入同比增长晋升 2 倍。”
该公司还领有新兴的云和软件业务,该业务平直向企业出租业绩器并提供用于开采 AI 模子和运用才能的软件。在团结财报电话会议上,Nvidia 默示其软件、业绩和撑执收入创造了 15 亿好意思元的年收入。
该公司客岁增多了对云业绩的投资。Nvidia 在其 2024 年 5 月的收益论说中默示,它已快活在改日几年内至少在云计较业绩上进入 90 亿好意思元,高于 1 月份快活的 45 亿好意思元。这个数字包括 DGX Cloud。
半导体杰作公众号推选
专注半导体限制更多原创执行
柔顺群众半导体产业动向与趋势
*免责声明:本文由作家原创。著述执行系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或撑执,若是有任何异议,接待相干半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第4088期执行,接待柔顺。

『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
可爱咱们的执行就点“在看”共享给小伙伴哦