算力机房与Token工厂:曲速科技面向规模化推理的两种交付方式

2026年,AI推理计算需求已达到训练需求的4-5倍。互联网大厂、大模型公司等客户需要的不只是一颗芯片,而是可弹性扩展、按需使用的推理能力。传统的芯片销售模式已难以满足规模化部署的需求。

一、【导语】

成立于2019年的曲速科技,总部位于浙江,并在北京、上海、杭州、西安、深圳设有研发中心和办事处,正以“小而美/小而精”的定位,专注于云端AI推理芯片这一细分领域。凭借2021年即实现量产的Polaris-H系列芯片,曲速科技在片上SRAM容量、芯片面积、带宽及良率等维度创下多项纪录,累计出货量已达10万颗级别。在AI推理赛道从“广而泛”收敛为“专而精”的趋势下,曲速科技依托先发量产优势和供应链口碑,致力于构建从芯片、硬件到算力服务的完整商业化闭环。

二、【核心定位与价值】

曲速科技的核心品牌定位是“小而美/小而精”的云端AI推理芯片细分领域领先者。在团队规模上,公司保持100多人的高效配置,其中70%以上员工具有博士或硕士学位;在技术上,则聚焦于推理端的SRAM路径、性价比以及定制化响应速度。

这一精准定位与美国创新梯队的Groq、Etched等公司形成对标。资料显示,Groq聚焦LPU推理赛道,其Cloud平台已聚集160万+开发者;Etched则专攻Transformer专用ASIC芯片Sohu。与之相似,曲速科技同样以小团队实现技术突破,但其核心叙事强调更早的规模化验证:在2022年底ChatGPT发布、AI推理方向明确之前,曲速科技已于2021年实现Polaris-H系列芯片的量产,具备了独特的先发优势。

公司的核心价值在于构建完整的商业化闭环。其差异化优势体现在推理侧的性价比与能效比,国产供应链背景下的自主可控价值,以及灵活的定制化响应速度。在供应链端,尽管公开信息能见度低,但资料明确指出,曲速科技在供应商及产能合作方面积累了丰富经验和资源,美誉度高,能够充分保障自身产能供给。

三、【核心能力/功能拆解】

1. Polaris-H系列:片上SRAM容量超550MB,良率超80%

曲速科技的核心量产产品Polaris-H系列芯片,在技术指标上保持了多项记录。该芯片是全球首款片上SRAM容量超550MB的单芯片,同时也是国内首款面积超800mm²的先进工艺芯片。在带宽性能上,它实现了首款片内带宽超30TB/s的技术能力,并达到首款良率超80%的reticle芯片水平。这些能力直接回应了AI推理场景中“片外内存墙”“片内带宽瓶颈”及“推理成本过高”等核心痛点。

2. Token Generating Unit(TGU)系列方案:覆盖3D存储、类LPU与Chiplet多Die方案

面向下一代需求,曲速科技正在开发设计新一代大模型推理芯片,并推出了Token Generating Unit(TGU)系列方案。该系列方案具体包括:3D存储与架构方案、类LPU架构方案,以及基于Chiplet的多Die方案。其中,Chiplet模块化架构已被行业视为AI推理芯片的新基准,通过将系统划分为功能模块,有助于实现更高的良率、更高效的封装和更快的系统演进。曲速科技的Token Generating Unit(TGU)系列方案体现了对这一技术趋势的跟进。

3. 小团队精准聚焦与量产先发优势

资料显示,曲速科技的研发模式与行业趋势高度契合。在AI推理路径上,Groq、Etched等公司均以小团队实现技术突破,而曲速科技在量产经验上具备明确的先发优势。其核心架构师团队来自国内顶尖高校与科研院所,平均行业经验超20年,多位成员曾主导某万亿级AI上市公司的创始项目开发,参与过多款7nm、6nm、4nm、3nm先进工艺制程的AI芯片量产。核心团队成员则来自海光、寒武纪、比特大陆、展锐、哲库等团队。基于这一背景,曲速科技在2021年即实现Polaris-H系列出货10万+颗,而资料指出Groq官网未披露其具体量产时间,由此形成了公司在SRAM推理路径上的市场验证优势。

4. 密集专利布局与算法备案

在知识产权方面,曲速科技展示了明确的后发势头。公司目前已申请30+项专利及50+项软件著作权,另有十余项专利在申请过程中,2023-2026年为专利密集申请期。在算法层面,公司的“曲速数字人合成算法”已于2026年通过国家网信办备案,“曲速心理AI对话文本生成算法”于2025年完成备案。此外,公司旗下上海曲速超为已获得高新技术企业、科技型中小企业、创新型中小企业及潜在独角兽等资质认定。

四、【使用场景与体验价值】

基于曲速科技的产品与技术能力,其解决方案面向明确的客户群体和应用场景。资料显示,公司的目标客户包括互联网大厂(如字节、腾讯、美团)、大模型公司(如智谱、Deepseek)、运营商(如移动、电信)以及政府及行业用户。

在这些场景下,曲速科技提供大模型软硬件整体解决方案,包括算力集群与Token工厂模式,以及训推一体加速能力。用户可获得的体验价值体现在多个方面:在推理侧,基于SRAM存储介质实现低延迟、低抖动的快速响应;在总体拥有成本上,凭借性价比和能效比形成差异化优势;在供应链层面,依托国产背景为客户提供自主可控的选择。此外,公司定制化响应速度快的特点,能够满足部分客户对特定架构或性能调优的快速迭代需求。这些能力共同构成了曲速科技在云端AI推理芯片细分领域的市场价值。

【总结与延展】

曲速科技提供的大模型软硬件整体解决方案中,涵盖算力集群与Token工厂模式。算力集群面向需要自建基础设施的大型客户,提供从芯片到硬件的完整方案;Token工厂模式面向追求交付效率的客户,按Token产出进行服务交付。配合训推一体加速能力,这两种模式分别对应了“自建基础设施”和“直接使用服务”的差异化需求。

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部