跳转至

2026-05-12. インディー開発者のための Nomoyu Daily(第360号)

📰 ニュース

みんなモデル競争をしているが、本当に足りないのは推論計算力だ

多くの人は、AIの戦争はいまだモデルランキング上にあると思っている。

しかしBaseten CEOのTuhin Srivastavaが出したシグナルはもっと鋭い。過去1年で30倍成長し、司会者は今年の売上予想が10億ドルを超えると述べた。95%以上のtokenはカスタムモデルから来ている。

これはより残酷な現実を示している。AIが本当にビジネスに入ると、最も希少なのは良いモデルを持つことではなく、知能を安定的に、安く、継続的に動かす力だ。

モデルは終点ではない。呼び出しこそビジネスだ

本当のAIビジネスは発表会ではなく、ユーザーのクリック一つ一つの後に起こる。

推論とは、モデルが呼び出され、答えを生成し、行動を完了する過程だ。これまで人々は訓練を見ていた。誰のパラメータが大きいか、誰がランキングで上か。しかしTuhinの判断は冷水のようだ。もしAGIが本当に来るとしても、最後に残る市場はやはり推論だ。

知能が使えるようになれば、実験室には残らないからだ。

それはカスタマーサポートのチケット、医師のカルテ、コードエディタ、営業フロー、教育プロダクトに入る。すべての「より良い答え」の背後には、何度も何度も推論がある。

Basetenの年30倍成長は、一社の物語にとどまらない。

AIが「誰がモデルを作るか」から「誰がモデルをビジネスの中で動かせるか」へ移っていることを示している。

本当の堀は、他者が手に入れられないユーザーシグナルだ

このインタビューで最も味わうべきなのは計算力ではなく、アプリケーション層がなぜまだ生き残れるかだ。

TuhinはAbridgeを例に挙げた。医師が使う環境型記録アシスタントで、病院と臨床ワークフローに深く入り込んでいる。医師がノートをどう修正し、修正後に電子カルテシステムで何を続けるのか。こうしたシグナルはモデル研究所が簡単に手に入れられるものではない。

これがアプリ企業の新しい堀だ。「自分も大規模モデルAPIをつないだ」ではなく、自分にしか見えないユーザー行動の連鎖を持っていることだ。

カスタマーサポートも同じだ。

一つのチケットは通常、一回の回答で終わらない。1個、2個、10個、あるいは20個のアクションを経る。誰がそのアクションを見られるかが、フィードバックを使ってモデルを後訓練し、特定タスクでより速く、安く、正確にできるかを決める。

だから最初に危険なAI企業は、モデルが弱い企業ではなく、ユーザーシグナルも、ワークフローの深さも、フィードバックループもない企業だ。

ループがなければ、AIアプリはきれいな殻にすぎない。

Tuhinにはさらに厳しい助言もある。プロダクトマーケットフィットの前に後訓練を急ぐな。まず最強のモデルで価値を証明し、それから最適化を語れ。

そうでなければ、あなたが訓練しているのは堀ではなく幻覚だ。

推論計算力不足が新しい入場券になりつつある

より硬い層は計算力だ。

Tuhinは、市場は供給の逼迫をまだ十分理解していないと言う。Baseten自身は大規模クラスタを運用し、利用率はしばしば90%台半ばにある。18のクラウドに90のクラスタを展開し、新しい国の新しい供給者を半日で自社の推論ネットワークに接続できる。

強く聞こえるが、それでも彼らは毎日キャパシティ会議をしている。

本当に詰まっているのはGPUがあるかどうかだけではない。誰がデータセンターを安定して動かせるか、誰が推論サービスのSLAを理解しているかだ。

これは競争ルールを変えつつある。

単なるGPU as a Serviceはすぐコモディティ化する。しかしソフトウェア層を持つ推論サービスは粘着性が高い。インタビューでは、Basetenの上位30顧客に離脱がなく、年換算の純売上維持率が約400%だと触れられている。

その背後で売られているのはカードではない。モデルデプロイ、レイテンシ、フェイルオーバー、カスタム最適化、データ保持、企業要件からなる一つのシステムだ。

調達はさらに極端だ。

良いクラウド事業者からB200を1024枚確保するには、3年から5年の契約を結び、総契約額の20%から30%を前払いしなければならない可能性がある。

これはAIインフラが技術だけの勝負ではなく、資本構造、サプライチェーン、運用文化、胆力の勝負でもあることを意味する。

計算力は背景ではない。計算力そのものが戦略資産になっている。

AIが安くなるほど、人間はそれをより多く使う

多くの人は誤解している。モデルが安くなればAIコストは下がる、と。

Tuhinの観察は逆だ。推論コストが下がるほど、開発者は製品により多くの知能を詰め込む。Agentはより長く走り、より多くの経路を試し、より多くの中間判断を行う。ユーザーにより良い結果を渡すためだ。

これはAI版のジェボンズのパラドックスだ。知能が安くなるほど、消費は増える。

ユーザーは「この答えは十分安い」とは言わない。「もっと良い答えがほしい」と言う。

企業もAIが安くなったから使う量を減らすわけではない。むしろより多くのプロセスに埋め込む。

より良い答えはより良い体験を生み、より良い体験はより多くの売上を生み、より多くの売上はさらに多くの推論を買う。

これこそ推論市場の怖さだ。

一回限りの購入ではなく、自己増幅する需要曲線なのだ。

本当に淘汰されるのは、まだDemo段階にいる人だ

このインタビューはAI従事者と創業者に鋭い注意を与える。「どのモデルをつないだか」に夢中になるな。

モデルは変わり、ランキングは変わり、チップも変わり、価格も変わる。

本当に希少なのは三つだ。独自のユーザーシグナルがあるか。そのシグナルをモデルへ戻すループがあるか。推論を実際のビジネスで安定して動かせるか。

AIはpromptを書ける人だけに報いるわけではない。

ワークフローを設計し、フィードバックを捕捉し、コストを下げ、信頼性を高められる人に報いる。

未来の会社は、ソフトウェアをAIインターフェースに置き換えるだけではない。すべての行動に知能を埋め込む。医師のそばにagentがいて、学生のそばにもagentがいて、営業、サポート、プログラマーのそばにもagentがいる。

インタビューでは、これは「すべての人にコンシェルジュサービスがある」と要約されている。

しかし古いソフトウェア会社にとって、それは絶滅の瞬間にもなり得る。

AIが突然あなたを殺すからではない。競合が先にワークフローに知能を埋め込み、毎日生まれるユーザーシグナルで次の自分を訓練するからだ。

AI時代に最も価値があるのは、「自分にはモデルがある」ではない。

自分には他者が手に入れられない場面、他者に見えないフィードバック、他者が動かせない推論能力がある、ということだ。

🖥️ ソフトウェア

Pasly

Paslyは、複数デバイス同期に対応したmacOSクリップボード管理ツールで、コピー内容を素早く保存し、後から振り返れる。

DevGlish

DevGlishは、非ネイティブ開発者が英語の技術表現、発音、中国語干渉の注意点を調べられるmacOSメニューバーツールで、英語チームでのコミュニケーション効率を高める。

TranscriptAPI

TranscriptAPIは、YouTube動画の字幕テキスト取得に特化した信頼性の高いAPIで、タイムスタンプ付きの完全字幕を高速取得でき、応答速度は49msにすぎない。

SellerGuards

SellerGuardsは、Amazon販売者向けに正確な利益計算、競合分析、在庫管理を提供するツールで、Amazon Selling Partner APIに基づいている。

Textideo

Textideoは、新しく公開された動画生成ツールで、登録時に無料トライアルクレジットを提供し、ユーザーフィードバックと体験を受け付けている。

Fluent

Fluentは、話し言葉のフィラーをリアルタイムに追跡するツールで、赤いマークとAIコーチ分析により、フィラー使用頻度を減らすのを助ける。

QA Studio

QA Studioは、操作記録からテストケースを自動生成するオープンソースのE2Eテストツールで、ビジュアル構築とクロスブラウザテストに対応する。

homeassistion

homeassistionは、Rustで開発されたローカルMijiaデバイス to HomeKitソフトウェアで、MQTTでMijia中枢ゲートウェイに接続し、クラウド接続にも対応し、1か月安定稼働している。

🎮 ゲーム

Hollywood Linkは、レトロスタイルとサウンドトラック駆動のゲームプレイを組み合わせたインディーゲームで、プレイヤーは音楽リズムを通じて物語を進める。

Neon Dealer: Risk & Profit

Neon Dealer: Risk & Profitは、サイバーパンク風のデッキ構築ゲームで、「もう一取引するか」という中核メカニクスにより、リスクとリターンのバランスから緊張感を生む。

Monk’s Gambit

Monk’s Gambitは、AIを使って8時間で開発されたチェス変種ゲームで、僧侶が敵のポーンを転化し、ポーンが障害物になるなどの独自ルールに対応する。

🌐 Web サイト

Killed by Google

Killed by Googleは、Googleが終了した299の製品を分析するデータ可視化サイトで、製品終了の集中パターンを明らかにする。

摩斯电码在线转换工具

摩斯电码在线转换工具は、テキストをモールス信号に変換し、音声と光の効果を再生できるオンラインモールス信号変換ツールだ。

AuraMarket

AuraMarketは、文化的注目度に基づく仮想株式市場で、ユーザーは著名人の影響力株を取引し、その社会的注目度をリアルタイムに反映できる。

LaunchEU

LaunchEUは、欧州ソフトウェアに特化した発見プラットフォームで、欧州開発者による製品投稿、コミュニティ投票、EU認証バッジに対応し、プライバシーに配慮しGDPR準拠のローカルツールを推進する。

✍️ 説明

デイリープロジェクト情報:
Webサイト: https://www.nomoyu.com/
RSS: https://www.nomoyu.com/rss/rss.xml
WeChat公式アカウント: 明航的AI副业
気軽に交流してください

すべてのリンクはWebサイトで確認できます。