清华创业团队打造!国内首个专注AI推理Serverless GPU平台

机器之心发布

共绩算力


你有没有遇到过这样的算力困境:买了 GPU,用不了几次就闲置烧钱,偶尔想用的时候却一卡难求?


现在,国内终于有了自己的 RunPod—— 共绩云 AI 推理 Serverless 平台,不仅支持极简快速部署,而且超级低价 ——RTX 4090 最高只要 1.68 元/小时,还能按毫秒计费、自动扩容,真正做到了 “随用随租”。


这款来自清华系创业团队产品,似乎正在悄悄重塑 AI 推理的游戏规则。而现在,你也可以参与其中并享受优惠!


在 1.68 元/小时的 RTX 4090 基础上,即日起至 6 月 18 日,新用户注册并充值,将额外获得 20% 积分!另外,用户还可以通过邀请码为自己和朋友赚取更多积分(各得 50 元积分)。



官网链接:suanli.cn


下面我们就来看看为什么你应该将以上链接复制到浏览器,然后打开并注册使用!另外,你还将了解共绩算力究竟是如何打造出了中国版的 RunPod。


下面,就来看看这个清华创业团队的技术创新和模式创新吧!


当前 AI 推理算力市场存在结构性问题


随着 AI 应用的落地增长,推理算力的需求持续提升。然而,当下国内的算力服务市场存在结构性问题,使得推理计算成本居高不下,成为制约 AI 应用大规模落地的 “隐形瓶颈”。


  • 服务僵化,弹性不足:流量高峰时,GPU 一卡难求,应用卡顿,用户流失;流量低谷时,预购算力大量闲置,白白烧钱。刚性供给与弹性需求之间的矛盾,直接影响了 AI 应用的效率和用户体验。

  • 模式传统,阻碍增长多数厂商要求长租,高昂的固定投入让创业公司望而却步,阻碍业务快速迭代和试错。

  • 管理繁琐 & 效率低下:跨平台资源调度、复杂环境配置、持续运维投入…… 大量工程师的精力被基础设施 “绑架”,无法专注于产品创新。

  • 供需错配,一卡难求算力源建设粗放,精细化运营缺失,算力供需严重不匹配,一方面有大量闲置算力资源未能被有效利用,另一方面,短租高性能 GPU 却 “一卡难求”。


这些问题共同构成了 AI 算力市场的 “弹性、稳定、低价” 不可能三角。在现有模式下,企业往往只能在这三者中选择其二,难以兼得。例如,追求极致弹性可能牺牲稳定性或增加成本;追求稳定和低价则可能失去弹性。这种困境成为 AI 开发者普遍面临的巨大挑战。


多数云平台提供的三类服务:整租(低价 & 稳定)、按量租(高价 & 稳定)、抢占式 SPOT 实例(低价 & 弹性)


传统 GPU 整租模式,其设计初衷更多是为了满足持续、高负载的 AI 训练任务。然而,AI 推理的特点是请求量波动大、突发性强、单次请求耗时短。这种模式与 AI 推理的实际需求存在根本性的不匹配。当流量稀疏时,大量预购的 GPU 闲置,产生高昂的 “空闲成本”;当流量激增时,又因扩容慢而导致用户排队或服务中断。这使得 AI 应用的成本居高不下,商业模式难以闭环,从而阻碍了 AI 应用的广泛部署和创新。


刚性供给与弹性需求之间的矛盾,直接影响了 AI 应用成本和用户体验


Serverless GPU:重塑 AI 应用部署范式


Serverless 计算是一种云原生开发模型,它将底层服务器的管理和维护工作完全抽象化,由云服务提供商负责。开发者只需将代码打包成容器或函数,即可部署应用。其核心优势在于:按需付费(闲置不收费)、自动伸缩(根据需求弹性扩缩容)、以及极大地简化运维


将 GPU 能力与 Serverless 模式结合,意味着 AI 开发者可以按需调用强大的 GPU 算力,无需预先购买和维护昂贵的硬件,也无需担心资源闲置。特别适用于 AI 推理这种计算密集型、但请求量不稳定的工作负载,能够大幅缩短处理时间,优化成本。这种模式也适用于实时和批量推理、3D 渲染、大数据分析等典型用例。


Serverless 架构工作机制示意


全球 Serverless GPU 市场正在蓬勃发展。在 AI 算力服务领域,国外已有先行者,如 RunPod,其 Serverless 产品提供了按时计费、零出入网费、支持多种 GPU 型号、容器化部署、闪电般冷启动等优势。主要服务于 AI 训练和推理工作负载。


Runpod.io


但同时,国内却缺少专注于 Serverless GPU 服务的平台,少数提供 Serverless GPU 服务的平台往往资源极少(因为压货成本过高),难以实现快速稳定的扩缩,使得多数本土应用难以进行大批量的 Serverless 部署,制约了 AI 应用的增长。


共绩算力:专注 Serverless GPU 推理服务


在这一行业痛点日益凸显之际,“共绩算力”(suanli.cn)应运而生。专注提供 Serverless GPU 推理服务,打破行业 “不可能三角”,实现真正的弹性&稳定&低价,让 AI 开发者不受算力制约,专注于产品本身,创造无限可能。



为支撑 AI 应用的快速部署,共绩算力平台为 AI 推理服务部署打造了极简流程,为 AI 开发者带来了多重核心价值,真正实现以下特性:


  • 极致弹性,随时扩缩

随流量快速扩缩:流量激增时秒级扩容,流量回落时缩容归零,告别浪费与排队。

毫秒级按量计费:AI 模型推理有请求才付费,没请求不花钱,彻底告别空闲成本。


  • 部署极简,无缝迁移

Docker 容器化:五步部署,一键托管,快速上云,实现真正 “零运维”。

兼容各类平台:提供预制镜像与 7x24h 免费技术支持,可顺滑迁移。


  • 资源管饱,价格最优

独家调度网络:整合全国算力,提供万卡资源。

保障充足低价:全网最实惠的算力(4090 单卡 1.68 元 /h,按量计费)。


部署教程:实测两分钟内完成部署。(手机也可操作)


支撑这一 “弹性、稳定、低价” 算力服务的,是共绩科技自研的闲时算力调度平台。目前该平台已经调度整合了来自包括金山云、火山引擎在内的 26 家智算平台的算力资源,超越了单一云厂商的资源边界,使得不可能三角变成可能,平台不仅提供了 Serverless 的按需付费特性,更通过资源整合扩大了可用算力池,解决了 “供需错配” 这一结构性问题。



共绩科技团队拥有深厚的学术和技术背景,核心成员来自清华大学、北京大学以及 Intel、字节跳动、阿里等知名企业。 团队在分布式资源调度领域深耕多年,目前已承建青海省、河北省省级算力调度平台,具备极强的工程落地能力,suanli.cn 已累计服务 90 余家人工智能企业。曾获 2024 年互联网 + 亚军(金奖,创业组冠军),并已获得奇绩创坛、水木创投等知名机构的投资。



全网低价,助力 AI 创新


共绩云 AI 推理 Serverless 平台

上线优惠活动


🔥 NVIDIA RTX 4090 单卡推理,价格最高 1.68 元 / 小时!

🚀 即日起至 6 月 18 日,新用户注册并充值,额外赠送 20% 积分!

💰 邀请好友,通过您的邀请码成功拉新,您和被邀请人各得 50 元积分!


参与方式:活动期间,通过共绩科技官方网站登录用户后台,选择在线充值即可自动参与并获得赠送金额。具体活动细则以官网届时公布为准。


想要开启您的 AI 推理新纪元,让算力不再是您创新的瓶颈?


👉立即访问:suanli.cn


©

(文:机器之心)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往