

“AI的问题在于它变得太快了,但Token就像选贤举能,它的需求历久在。”
文|伍洋宇裁剪|文姝琪
头图来源|AI生成
OpenClaw刚火起来那几天,夏达(假名)发现我方的API中转站流量一天内就涨了好几倍。他说,这是一门不需要费太大功夫就能赢利的交易。
但这门交易“丰俭由东说念主”。如若念念要暴利,就需要穷尽多样所谓灰色地带手法;如若念念要以正规军样式永恒走下去基本不能能,“国内很难以那样的老本和价钱存活。”夏达说。
他瞻望,市面上最终会留住一些有自研本事实力的平台,反之则会被自在淘汰。他莫得念念把元气心灵耗在这个杂沓词语、内卷的廉价竞争阛阓里,转而启动研究作念国产Token出海。
Token(词元),大模子经管信息的最小信息单位,对擅于诓骗信息差的东说念主来说,亦然劫掠资产的来源。伴跟着大模子与AI应用的急剧锻练,群众鸿沟内的Token奢靡量在巨量增长。
来自国度数据局的最新数据线路,2025年,宇宙日均词元调用量从岁首的超万亿增长到年末的100万亿。豆包大模子客岁底日均Token奢靡在63万亿傍边,4月初就达到120万亿,中枢原因在于多模态AIGC创作以及龙虾类居品的爆发。
在此繁茂气象下,Claude、GPT等系列外洋模子因一定性能卓著也招徕了多数国内用户。受限于一些本事区隔以及腾贵订阅用度,国内用户念念要以方便和相对顺应的价钱使用这些模子,就必须经过API中转站。
于是,在这股Token增长波浪之中,有东说念主手执号池作念起了Token的二说念估客。不外,在国产模子的算力与电力基础重要上风自在杰出后,有东说念主猜度,贩卖的标的偶然会有所转换。

莫得底线就能赢利的潜伏交易
夏达正本我方有一门AI出海业务,对Claude等外洋厂商模子需求量宽绰。
起原,团队亦然订阅官方API,但逐日Token奢靡量达到数亿级别,每月仅里面开辟就要奢靡1万多好意思元,为了降老本不得不转向第三方。
这时候团队发现,市面上大多数API中转站平台没法信任。
他们至少试了30多家平台。要么“今天还好好的、未来就挂了”,要么好禁锢易找到一家踏实的,却发现我方的居品线全崩了。“为什么呢?因为他们给你卖‘伪物’了。”
经回想,中转站的交易举座分三档。第一档属于正规,以企业步履大鸿沟采购以取得扣头价,举例OpenRouter、Cursor这样的大客户,就不错从“批发”转“零卖”,但利润相对通俗。
第二档属于杂沓词语,用外洋账号诞生号池、借企业免费款式薅羊毛,再重迭分发吞并个账号最大限制套利,按官方价钱2折到5折售卖的大多如斯,“门路齐是林林总总的,就看你怎样输攻墨守了”。一个200好意思元月租的ClaudeCodeMax账号,不错拆分套到2000~3000好意思元(更高时候不错到4000~5000好意思元)。
最次的第三档,就属于前边所说的“卖伪物”。它指的是用户所买非所得,中转站宣称卖Claude,但骨子接入其他厂商模子。“这属于同业齐看不上的无底线步履。”另别称API中转站从业者暗示,一些卷款跑路的东说念主会这样干。
中转站的暴利后劲正在于它看不穿的中间层身份。被内行合计“更是莫得下限”的作念法有好多,除了卖货不合版的模子,Token价钱倍率不解晰、偷改倍率以增加用户用度等等也齐存在。“比如名义上卖你1好意思金、100万Token,骨子上扣费的时候扣了你5好意思金。”
为了尽可能挣钱,大多数中转站交易处在第二档。而即便风险偏高、踏实性较低,第二档交易也远比第一档好作念。“因为Claude实在太贵了,可能一轮对话就要花掉五六毛,大部分东说念主汲取不了。”夏达说。
有投资东说念主告诉界面新闻记者,他所周折到的一个中转站款式,月活水可达约500万元,毛利率险些是50%。其他影响最终利润的条目在于,中转站是否参增加数力气在合规上,比如各样禀赋认证、数据存储决策、数据安全风险等等。
合规受到垂青是因为有中转站打包出售我方所掌执的数据,给其他厂商用于模子锤真金不怕火——这是另一个灰产地带。
模子厂商四处购买数据用于模子锤真金不怕火,这是业内公开的巧妙。但这个生态相等复杂杂沓词语,别称知情东说念主士暗示,即即是厂商,也不一定知说念数据的细密和真实来源,因为触及太多中间东说念主。这很可能导致的情形是,一个厂商从三个不同渠说念买来三份数据,临了可能齐是吞并份。
“对中转站来说,滚球app官网下载底线是不掺假,再就是不卖数据。但说真话,两件事齐很难。”前述从业者暗示,“无谓付出任何老本就有东说念主送你一笔钱,很少有东说念主能抵牾住这个招引。”

不错合规,但耗不起
濒临这样的近况,夏达决定团队我方作念。
从起源启动组建号池到团队踏实使用,大约只用了一个月时期。如若算上后期替换开源框架和重写底层UI,经过会拉到两个月。
自建老本的确不错快速下落。“对比官方不错降大约七成,至极于打了三折。”与此同期,无理率也有显着裁汰。夏达说,即即是官方调用也有对应的无理率,而中转站据他们测算普遍调用无理率在15%~20%,经团队我方调校后,不错措施在5%傍边。
从私用变商用,仅仅因为给同为开辟者的一又友提供了一次方便,临了反而吸引到了一批相对踏实的中小企业客户。这些客户对合规性要求不会迥殊高,每月奢靡在几百到几千好意思元。如若是大客户,可能更倾向于特有化部署。
“这个行业是很乱的,不懂本事照样不错作念,照样不错赚到钱。”夏达说,表面上而言,一个东说念主只好懂得怎样绽开ClaudeCode或GPT的订阅,就能作念这个交易。“以至花笔钱找东说念主帮你搭起来也相通。”
要把中转站当成一门肃穆交易来作念,也不是莫得门槛。举例,无谓开源框架、重写底层代码,其必要性在于对一些bug能够更好跟踪和经管;再比如增加老本参加,把号池扩大两倍,以作念到更好的负载平衡;更有本事才气的,就对可能出现的无理分发进行更好的算法优化。
站在这个角度来说,不懂维稳和售后的中转站存活时期齐不长。有时候它们不一定是主不雅上“跑路”,而是真是莫得相接才气。
夏达当今有种预见,中转站赢利的风口要畴昔了。
一方面,Anthropic在加快收紧战略。4月5日,ClaudeCode细致东说念主BorisCherny官方晓示Claude订阅不再支撑OpenClaw品级三方Harness平台。而在中转站濒临的需求里,绝大多数东说念主齐是冲着Claude去的,别的模子不具备饱胀吸引力。
另一方面,他发现中转站Token奢靡量莫得不息暴涨,变得靠拢龙虾爆火前的水平。“你会发现C端用户因为OpenClaw热度来了,又因为OpenClaw回冷走了,是以没什么道理。”
2026年一季度,OpenRouter数据线路,中国大模子厂商多次占领Token奢靡量榜单前五。DeepSeek、月之暗面、MiniMax、智谱、千问、阶跃星辰、小米等中国厂商称号,踏实轮流出当今其按周回想的市占率前十名单中。
“大厂会吃掉大部分阛阓,剩下才是咱们小个体户的盘子。”夏达线路意志到。出海,是团队留在AI牌桌上的一个契机。
据别称AIInfra本事东说念主员拆解,Token老本的中枢组成是算力老本,再往下拆解还不错分为GPU老本、作事器老本、机房老本、电力老本等。
“静态来看,对险些悉数大模子,GPU芯片齐占老本绝大部分。动态来看,不同模子结构贪图对老本影响进度最大,差距可达10倍。”他说,而这是中国模子厂商最下功夫的场地之一。
于是在Token时间,国产模子因为有算力和电力的老本上风,引诱本身的算法革命,有契机往外洋作念更大鸿沟输出,在一个由IaaS(基础重要即作事)向MaaS(模子即作事)的集体转型趋势中,从头塑造一个群众云厂商款式。
但手脚这片阛阓的“小个体户”,夏达说起这门交易的利润率不会太高了。研究到大鸿沟配合经过的复杂性,中间商可能会自行找作事器部署,通过比官方少赚少量的样式去售卖。
这不是一个何等大的契机,但可能是悉数对行业红利有念念法的东说念主,一个速互市业模式的现成渠说念。“AI的问题在于它变得太快了,就像OpenClaw火了没两天又到了Hermes,谁知说念背面还有什么?”
“但Token就不相通了滚球app,”夏达说,“它选贤举能,它的需求历久在。”
亚搏体育中国官网在线入口