随着大规模AI部署需求激增,芯片创业公司Positron正将自己定位为市场领导者英伟达的直接挑战者,通过提供专用的节能内存优化推理芯片,旨在缓解行业日益严重的成本、功耗和可用性瓶颈。
Positron联合创始人兼首席技术官Thomas Sohmers在接受VentureBeat视频采访时表示:"我们的关键差异化优势是能够以更高效率运行前沿AI模型——与英伟达相比,每瓦特和每美元可实现2倍到5倍的性能提升。"
Positron首席执行官、前AI云推理提供商Lambda首席运营官Mitesh Agrawal指出:"我们制造的芯片可以部署在数百个现有数据中心,因为它们不需要液体冷却或极端功率密度。"
风险投资家和早期用户似乎对此表示认同。Positron昨日宣布完成超募的5160万美元A轮融资,由Valor Equity Partners、Atreides Management和DFJ Growth领投。
在早期客户群体中,包括知名企业和推理密集型行业的公司。已确认的部署包括主要安全和云内容网络提供商Cloudflare,该公司在其全球分布式、功耗受限的数据中心使用Positron的Atlas硬件。
进入充满挑战的市场
然而,Positron也正进入一个充满挑战的市场。据报道,竞争对手AI推理芯片创业公司Groq已将其2025年收入预测从20亿美元以上下调至5亿美元,凸显了AI硬件领域的波动性。
面对更高效、更小的大语言模型和专用小语言模型的兴起,Positron的领导层选择拥抱这一趋势。Agrawal表示:"一直存在这种双重性——本地设备上的轻量级应用和集中式基础设施中的重量级处理。我们相信两者都会持续增长。"
Atlas:推理优先的AI芯片
虽然英伟达GPU通过加速模型训练帮助催生了深度学习热潮,但Positron认为推理——模型在生产中生成输出的阶段——现在是真正的瓶颈。
Positron的解决方案是Atlas,这是专门为处理大型Transformer模型而构建的第一代推理加速器。与通用GPU不同,Atlas针对现代推理任务的独特内存和吞吐量需求进行了优化。
该公司声称,Atlas的每美元性能比英伟达H100高出3.5倍,功耗降低66%,同时实现93%的内存带宽利用率。
从Atlas到Titan
仅在成立15个月后,Atlas就已开始出货和投产。该系统支持在单个2kW服务器中运行多达5000亿参数的模型。
Positron正准备在2026年推出下一代平台Titan。基于定制设计的"Asimov"硅芯片,Titan将提供每个加速器高达2TB的高速内存,支持多达16万亿参数的模型。
关键是,Titan设计为在传统数据中心环境中使用标准风冷运行,避免了下一代GPU日益需要的高密度液冷配置。
工程效率与兼容性
从一开始,Positron就将其系统设计为即插即用替代方案,允许客户使用现有模型二进制文件而无需重写代码。Sohmers解释说,Positron专注于推理,设计能够直接处理英伟达训练模型的硬件。
内存是关键需求
Sohmers和Agrawal指出AI工作负载的根本转变:从计算密集型卷积神经网络转向内存密集型Transformer架构。虽然英伟达和其他公司继续专注于计算扩展,但Positron押注于内存优先设计。
美国制造的芯片
Positron的生产管道完全在美国本土。公司第一代芯片使用英特尔设施在美国制造,最终服务器组装和集成也在国内完成。对于Asimov芯片,制造将转向台积电,但团队致力于尽可能保持其余生产链在美国。
未来展望
Agrawal强调,基于经济性和性能销售物理基础设施——而不是将其与专有API或商业模式捆绑——是Positron在怀疑论市场中获得信誉的部分原因。他表示:"如果你无法基于硬件的经济性说服客户部署你的硬件,你就不会盈利。"
好文章,需要你的鼓励
自主AI系统正在医疗领域快速发展,从辅助工具转变为能够独立决策和执行任务的智能代理。这些系统承诺简化诊断流程、减轻医生负担、提供个性化治疗方案,但同时也带来数据完整性、公平性风险、过度依赖和隐私安全等挑战。成功部署需要在医学教育、医院管理和治理框架方面进行系统性变革,建立监督机制和问责制度,确保人类判断的主导地位得以保持。
浙江大学与阿里巴巴合作开发了MTDEval多轮对话评估系统,通过学习五个顶级AI评委的评判智慧,将多评委评估的准确性与单模型推理的效率完美结合。系统在七个基准测试中表现优异,评估速度比传统方法快数倍,同时构建了两个高质量数据集供研究使用。该开源系统为AI对话质量评估提供了实用可靠的解决方案。
Endava研究显示,商业领袖在私人生活中日益采用AI技术,这让他们对AI商业应用更有信心。三分之二的商业领袖愿意信任全自动AI为其做出生活决策,同样比例的人认为AI访问权与电力、水等基础设施同样重要。尽管AI应用是企业首要战略,但近一半受访者认为组织未投资正确的AI技术。研究发现高管层对AI转型更乐观,而中层管理者信心不足,主要因担心被AI取代。
北京大学团队开发的3D-R1系统实现了AI在三维空间理解领域的重大突破,通过结合高质量思维链数据集Scene-30K和强化学习技术,让AI首次具备了类似人类的空间推理能力。该系统不仅能准确识别物体位置关系,还能进行复杂的空间规划和推理,在多项测试中性能提升约10%,为智能家居、自动驾驶和虚拟现实等领域的实际应用奠定了重要基础。
饱和脂肪酸是什么 | 芫荽是什么 | 日字五行属什么 | 醋泡葡萄干有什么功效和作用 | 梦见牙掉了是什么意思 |
出汗多是什么病 | 乙肝看什么科 | 女人大姨妈来了吃什么最好 | 全血是什么意思 | 可乐鸡翅用什么可乐 |
梦见好多水果是什么预兆 | 法兰绒是什么面料 | 不近女色是什么意思 | 清明节与什么生肖有关 | 为什么会得灰指甲 |
舒张压是什么 | veromoda是什么牌子 | 鼻子经常出血是什么病征兆 | 土加亥念什么 | swag是什么意思 |
尿的颜色有点红褐色是什么原因hcv7jop9ns1r.cn | 脚趾抽筋是什么原因hcv9jop7ns1r.cn | 高血压用什么药hcv8jop6ns9r.cn | 头疼吃什么药0297y7.com | 血脂六项包括什么hcv7jop9ns0r.cn |
球蛋白是什么意思hcv7jop7ns4r.cn | 赞赏是什么意思chuanglingweilai.com | 前列腺在什么地方hcv9jop8ns1r.cn | 散光轴位是什么意思hcv9jop0ns5r.cn | knee是什么意思hcv8jop6ns3r.cn |
寒疾现代叫什么病hcv9jop8ns1r.cn | 宝宝头大是什么原因hcv9jop1ns8r.cn | 集少两撇是什么字hcv7jop9ns0r.cn | a型rh阳性是什么意思hcv9jop1ns3r.cn | 身上长很多痣是什么原因hcv7jop6ns1r.cn |
哺乳期上火了吃什么降火最快hcv8jop5ns3r.cn | 五戒十善是什么xinmaowt.com | 下午三点到四点是什么时辰hcv8jop8ns8r.cn | 维生素b有什么作用hcv9jop4ns4r.cn | 祖庭是什么意思bjcbxg.com |