跳转至

2026-05-12.不摸鱼的独立开发者日报(第360期)

📰 资讯

所有人都在卷模型,真正缺的是推理算力

很多人以为,AI的战争还在模型榜单上。

但是,Baseten CEO Tuhin Srivastava抛出的信号更刺眼:过去一年增长30倍,主持人称其今年收入预期超过10亿美元;95%以上的 token,来自定制模型。

这说明一个更残酷的现实:AI真进业务后,最稀缺的不是有个好模型,而是能把智能稳定、便宜、持续地跑起来。

模型不是终点,调用才是生意

真正的AI生意,不发生在发布会上,而发生在每一次用户点击后。

推理,就是模型被调用、生成答案、完成动作的过程。过去大家盯训练,盯谁的参数更大、榜单更高;但Tuhin的判断更像一盆冷水:如果AGI真的到来,最后剩下的市场,仍然是推理。

因为智能一旦能用,就不会留在实验室。

它会进入客服工单、医生病历、代码编辑器、销售流程和教育产品。每一个“更好的答案”,背后都是一次又一次推理。

Baseten一年30倍增长,不只是一个公司故事。

它说明AI正在从“谁造出模型”,转向“谁能把模型跑进业务”。

真正的护城河,是别人拿不到的用户信号

这场访谈里最值得咀嚼的,不是算力,而是应用层为什么还能活。

Tuhin举了Abridge的例子:它做的是医生使用的环境式记录助手,深度嵌入医院和临床工作流。医生怎么修改笔记、修改后在电子病历系统里继续做了什么,这些信号不是模型实验室轻易拿得到的。

这就是应用公司的新护城河:不是“我也接了一个大模型API”,而是我掌握了一条只有我能看见的用户行为链。

客服也是一样。

一个工单通常不是一次回答结束,而是会经历1个、2个、10个甚至20个动作。谁能看见这些动作,谁就能用反馈去后训练模型,让它在特定任务里更快、更便宜、更准。

所以第一批危险的AI公司,不是模型不够强,而是没有用户信号、没有工作流深度、没有反馈闭环。

没有闭环,AI应用只是一个漂亮壳子。

Tuhin还有一句更狠的建议:没有产品市场匹配之前,不要急着后训练。先用最强模型证明价值,再谈优化。

否则你训练的不是护城河,是幻觉。

推理算力短缺,正在变成新门票

更硬的一层,是算力。

Tuhin说,市场对供给紧张的理解还不够。Baseten自己跑着大集群,利用率常在90%中段。他们在18个云里部署了90个集群,可以把一个新国家的新供应商半天接入自己的推理网络。

听起来很强,但他们仍然要每天开容量会议。

真正卡住的,不只是有没有GPU,还有谁能把数据中心稳定跑起来,谁懂推理服务的SLA。

这正在改变竞争规则。

单纯的GPU as a Service很容易变成商品。但带软件层的推理服务很黏。访谈里提到,Baseten前30大客户没有流失,年化净收入留存率约400%。

这背后卖的不是卡,而是模型部署、延迟、故障切换、定制优化、数据保留和企业要求组成的一整套系统。

更夸张的是采购。

想从好云厂商那里拿到1024块B200,可能要签3到5年合同,还要预付20%到30%的总合同价值。

这意味着,AI基础设施拼的不只是技术,还有资本结构、供应链、运维文化和胆量。

算力不是背景板。算力本身正在变成战略资产。

AI越便宜,人类越不会少用它

很多人有个误解:模型更便宜,AI成本就会下降。

Tuhin的观察恰好相反。推理成本越低,开发者越会往产品里塞更多智能。Agent会跑得更久,尝试更多路径,做更多中间判断,只为了给用户一个更好的结果。

这就是AI版的杰文斯悖论:智能越便宜,消耗越大。

用户不会说“这个答案够便宜”。用户只会说“我想要更好的答案”。

企业也不会因为AI便宜就少用,恰恰会把它嵌进更多流程。

更好的答案,带来更好的体验;更好的体验,带来更多收入;更多收入,又会反过来买更多推理。

这才是推理市场可怕的地方。

它不是一次性采购,而是一条会自我放大的需求曲线。

真正会被淘汰的,是还停在Demo阶段的人

这场访谈给AI从业者和创业者的提醒很刺耳:不要迷恋“我接入了哪个模型”。

模型会变,榜单会变,芯片会变,价格也会变。

真正稀缺的是三件事:你有没有独特用户信号;你有没有让信号回流到模型的闭环;你有没有把推理稳定跑进真实业务的能力。

AI不会只奖励会写prompt的人。

它会奖励那些能设计工作流、捕捉反馈、压低成本、提高可靠性的人。

未来的公司,不是把软件换成AI界面,而是把智能嵌进每一个动作。医生身边有agent,学生身边有agent,销售、客服、程序员身边都有agent。

访谈里,这被概括成:每个人都有一套礼宾服务。

但对旧软件公司来说,这也可能是灭绝时刻。

不是因为AI突然杀死你,而是因为你的竞争对手先把智能塞进了工作流,并用每天产生的用户信号训练下一版自己。

AI时代最值钱的,不是“我有一个模型”。

而是:我有别人拿不到的场景,别人看不见的反馈,和别人跑不起来的推理能力。

🖥️ 软件

Pasly

Pasly是一款支持多设备同步的macOS剪贴板管理工具,可快速保存并回溯复制内容。

DevGlish

DevGlish是一款macOS菜单栏工具,帮助非母语开发者查询英文技术表达、发音及中文干扰提示,提升英文团队沟通效率。

TranscriptAPI

TranscriptAPI是一款为获取YouTube视频字幕文本设计的可靠API,支持快速获取带时间戳的完整字幕内容,响应速度仅49ms。

SellerGuards

SellerGuards是一款为亚马逊卖家提供精准利润计算、竞品分析和库存管理的工具,基于Amazon Selling Partner API。

Textideo

Textideo是一款新推出的视频生成工具,注册即送积分免费试用,支持用户反馈与体验。

Fluent

Fluent是一款实时追踪说话中填充词的工具,通过红标提示并结合AI教练分析使用原因,帮助用户减少填充词使用频率。

QA Studio

QA Studio是一款开源的端到端测试工具,通过录制操作自动生成测试用例,支持可视化构建与跨浏览器测试。

homeassistion

homeassistion是一款用Rust开发的本地米家设备转HomeKit软件,通过MQTT连接米家中枢网关,支持云端接入,已稳定运行一个月。

🎮 游戏

Hollywood Link是一款融合复古风格与音轨驱动玩法的独立游戏,玩家通过音乐节奏推进剧情。

Neon Dealer: Risk & Profit

Neon Dealer: Risk & Profit是一款赛博朋克风格的卡牌构建游戏,核心机制为‘是否再做一笔交易’,通过风险与收益的平衡制造紧张感。

Monk’s Gambit

Monk’s Gambit是一款8小时内用AI开发的棋类变体游戏,支持教士转化敌方兵卒、兵卒变障碍物等创新规则。

🌐 网站

Killed by Google

Killed by Google是一个分析谷歌已停用299款产品的数据可视化网站,揭示产品退役的集中规律。

摩斯电码在线转换工具

摩斯电码在线转换工具,支持文本转摩斯电码并播放音频和灯光效果。

AuraMarket

AuraMarket是一个基于文化关注度的虚拟股票市场,用户可交易公众人物的影响力股份,实时反映其社会关注热度。

LaunchEU

LaunchEU是一个专注于欧洲软件的发现平台,支持欧洲开发者提交产品、社区投票,提供欧盟认证标识,推广隐私友好、GDPR合规的本地工具。

✍️ 说明

日报相关信息:
网站:https://www.nomoyu.com/
RSS:https://www.nomoyu.com/rss/rss.xml
微信公众号:明航的AI副业
欢迎一起沟通交流

链接详见网站