Fly.io:コンテナをそのまま世界 18 か所に置ける計算基盤

2026-06-08

Fly.io 公式サイトのヒーローイラスト。雲の上の世界からコードが地上のラップトップへ流れ込む手描きアートワーク
出典: Fly.io 公式サイト

AI エージェントが自分でコードを書き、そのコードを実行する場面が増えている。 生成したスクリプトをブラウザで動かす。データを整形して外部 API に投げる。 ファイルを読んで別のファイルを作る。こうした作業をエージェントに任せるとき、「実行する場所」の設計が問われる。

コードを動かすサーバーは、隣のテナントとカーネルを共有しないほうが安全だ。 エージェントが未検証のコードを走らせるとき、コンテナの分離では心配が残る。 そこで microVM という仕組みが使われる。コンテナ並みの起動速度を保ちながら、仮想マシン並みの分離を確保する技術だ。

Fly.io はその microVM を世界 18 か所に展開している会社だ。2017 年に設立し、当初はエッジのプロキシ・CDN 的な出自を持つ。 2020 年代に Firecracker microVM を土台にした実行基盤へ軸を移し、開発者コミュニティに根づいた。 2024 年には GPU への投資を公に撤収し、2026 年 1 月には永続実行環境の Sprites を発表した。 累計調達は約 $110.5M、2024 年の自己申告売上は $11.2M だ。

以下、プロダクトの構造から順に見ていく。

1. Fly Machines とは何か:microVM を起動させる土台

Fly.io のすべての提供物は、Fly Machines という Firecracker microVM の上に乗る。 Firecracker は AWS がオープンソースで公開した軽量仮想化技術だ。 コンテナ並みの起動速度と、VM のハードウェア分離を両立させる。

一般的な PaaS は複数のアプリを共有 OS 上のコンテナで動かす。Fly Machines は違う。 アプリごとに専用カーネルを持つ microVM を立て、CPU・メモリ・ネットワークを分離する。

具体的な動作を整理すると次のようになる。

Fly Machines の作成プロセス:API から複数ホストへ NATS でブロードキャストし、予約確定後に Machine を起動するシーケンス図
出典: Fly.io 公式ブログ「Fly Machines: an API for fast-booting VMs」
  • HTTP リクエストを受けたタイミングで microVM を起動(数百ミリ秒級)
  • アイドル状態になれば自動停止して課金を止め、次のリクエストで再起動(使わない間は課金ゼロ)
  • マルチテナント環境でも隣のテナントと OS を共有しない
  • 同一アプリを複数リージョンに置き、Anycast で最寄りのリージョンへ振り分ける
  • ローカル NVMe(高速)と分散オブジェクトストレージ(耐久性)の二層でストレージを持つ

この分離特性が、AI エージェント文脈で効くポイントになる。 エージェントが生成した未検証コードを走らせるとき、microVM は隣テナントやホストへの影響を遮断する。 Fly.io が "Run any code fearlessly." を前面に出すのは、この設計の裏付けがある。

参考: Fly Docs: Machines / Firecracker OSS

2. Sprites:使い捨てではなく「育てる sandbox」

2026 年 1 月 14 日に発表した Sprites は、状態を保持する Firecracker microVM だ。 Fly Machines の上に作られ、AI エージェント向けのコード実行基盤として設計されている。

従来の sandbox は「使い捨て」が前提だった。E2B はセッションが最大 24 時間で終了し、Vercel Sandbox は 45 分制限だ。 エージェントはタスクのたびに環境を作り直す。Sprites はその逆を向く。 パッケージを一度入れたら消えない。数日後でも同じ環境で続きから作業できる。

Sprites の主要な仕様を整理する。

  • Docker イメージを使わず、1〜12 秒で microVM を作成
  • 100GB の永続 root ファイルシステム(NVMe + オブジェクトストレージで耐久)
  • 非アクティブ時に自動で待機状態になり、課金停止。状態は保持
  • 環境状態をまるごと保存・復元する checkpoint / restore(約 300ms〜1 秒)
  • CPU 専用(GPU は非対応)

設計の背景は、「毎回ゼロから環境を構築し直すのはコンピューティング資源の無駄だ」という認識だ。 CEO の Kurt Mackey は "The age of sandboxes is over." と書いた。 「使い捨てから育てる」への転換を差別化軸にした。

この設計は、常時稼働が必要なエージェントとの相性がよい。 Slack の受信を常時監視するボット、定期的にデータを取得して処理するワーカー、夜間にバッチを走らせる自動化スクリプト。 こうした処理はローカルマシンを開けたままにしておく必要がなく、Fly の Machine に置けばよい。 fly.toml で min_machines_running = 1 を設定すると、その Machine は常時起動したまま維持される。 Sprites の 100GB 永続ストレージと組み合わせると、インストールした依存関係や中間ファイルも残り続け、次回の起動オーバーヘッドが小さくなる。

Fly.io の Sprites:コンピュータタワーに乗ったキャラクターたちが走る公式イラスト。永続 microVM を擬人化したビジュアル
出典: Fly.io 公式ブログ「Code And Let Live」カバーイラスト(Annie Ruygt 作)

参考: SDxCentral: Fly.io debuts Sprites(2026/1) / Techzine: Fly.io puts AI agents in VMs, not containers / Fly Docs: Autostop/autostart Machines

3. GPU の賭けを撤収した理由

2022 年、Fly.io は GPU Machines(A10 / L40S / A100)を提供し始めた。 当時は「AI インフラ会社になる」という方針だった。 それが 2024 年の公式ブログ "We Were Wrong About GPUs" で大きく変わった。

Kurt Mackey の論旨は率直だった。開発者が AI を使うとき、欲しいのは GPU を自分で回すことではない。 Claude や GPT のような LLM への API 呼び出しだ、という認識だ。 推論に GPU が要るのはモデルプロバイダーであって、API を呼ぶユーザー企業ではない。

結果として Fly.io は GPU を成長ドライバーから外した。L40S は実需があるため維持するが、新規拡張には踏み込まない。 代わりの賭けが Sprites だ。AI エージェントが書いたコードを CPU microVM で安全に走らせる方向に転じた。

転換が示す区別は明確だ。「AI 向けの会社」という立場は変わらないが、その意味が「推論基盤」から「実行・分離基盤」へ移っている。 AI モデルはプロバイダーが動かす。Fly.io はエージェントが生成したコードを安全に走らせる場所を提供する。

Fly.io 公式ブログ「We Were Wrong About GPUs」のカバー:「GPUs」と書かれた壊れた車に乗った Fly.io マスコットのイラスト
出典: Fly.io 公式ブログ「We Were Wrong About GPUs」カバーイラスト(Annie Ruygt 作)

参考: Fly Blog: We Were Wrong About GPUs

4. PaaS としての競合と、Fly.io が勝る場面

Fly.io を語るとき、Heroku の後継として比較されることが多い。 実際に競合になるのは Railway と Render だ。どちらも「コードを上げればデプロイまで面倒を見る」という PaaS の使い勝手を重視している。

Railway はダッシュボードの完成度と手軽さが際立つ。Render はマネージド Postgres と予測可能なプラン課金が強い。 Fly.io は VM レベルの制御・世界分散の簡単さ・下り通信費の安さで異なる位置を取る。

下り通信費(クラウドから外に出ていく通信コスト、egress)の差は数字で見える。Fly.io の北米・欧州単価は $0.02/GB だ。 AWS の約 $0.09/GB と比べると 4 分の 1 以下になる。通信量の多いアプリでは、この差がコスト構造に直結する。

Vercel との比較もよくされるが、Fly.io とは対象が異なる。 Vercel は Next.js / フロントエンドに特化したエッジ実行の仕組みだ。 Fly.io はバックエンド・任意言語・任意バイナリを VM ごと動かせる。 Cloudflare Workers は超軽量だが、フル Linux 環境や任意バイナリは動かせない。

Fly.io が明確に向いているのは、世界分散と VM レベルの分離を組み合わせたい場面だ。

開発者体験も差別化要素の一つだ。 fly launch を実行すると、プロジェクトの種類を自動判定して設定ファイル(fly.toml)を生成し、そのままデプロイまで進む。 Dockerfile があれば追加の設定なしにそのイメージでビルドされる。 ビルドはローカルではなく Fly 側のサーバーで行われるため、手元のマシンスペックに依存しない。 デプロイ後は fly logs でリアルタイムのログを確認でき、fly ssh console で稼働中の Machine に直接入れる。 Railway や Render と比べると設定の自由度が高い分、最初の設定ファイル調整が必要な場面はある。 ただし、コードを書いてから本番環境に届くまでの手数は少ない。

Fly.io / Railway / Render / Vercel / Cloudflare Workers の機能・用途の比較図
出典: 筆者作成(各社公式サイト・jasonsy.dev 比較記事 2025 をもとに整理)

参考: Railway 公式 / Render 公式 / Comparing Deployment Platforms 2025 / Fly Docs: fly launch

5. 価格体系:使わない間は課金ゼロ、下り通信費は AWS の 4 分の 1

Fly.io の課金は従量制で、Machine・ストレージ・下り通信・IP を個別に積む。主要な単価を整理する。

項目単価(2026/6 時点)
shared-cpu-1x / 256MB$2.02 /月
performance-1x / 2GB$32.19 /月
performance-4x / 8GB$128.77 /月
追加 RAM約 $5 / GB / 30 日
永続ボリューム$0.15 / GB / 月
下り通信費(北米・欧州)$0.02 / GB
下り通信費(アジア太平洋)$0.04 / GB
専用 IPv4$2 / 月
Machine 予約割引最大 40% off

この構造のポイントは 3 つある。

第一に、使わない間は課金ゼロになる仕組みだ。アイドル中は Machine が停止するため、リクエストがないときの課金がほぼゼロになる。 小規模サービスやエージェント実行環境との相性がよい。

第二に、下り通信費の安さがある。北米・欧州は $0.02/GB と、AWS の $0.09/GB に比べ 4 分の 1 以下だ。 自前ハードウェアで原価を握っているため、上位 PaaS より価格優位が出せる。

第三に、アジア太平洋の下り通信費は北米・欧州の 2 倍($0.04/GB)になる点だ。 東京リージョン(nrt)では通信量が多いほどこのコスト差が響く。

参考: Fly Docs: About Pricing / Fly.io Pricing

6. エージェント sandbox 市場での競合と Sprites の位置

Sprites が参入する「AI エージェント向けのコード実行基盤」は、2025〜2026 年にプレイヤーが急増した市場だ。主要な競合を並べて比較する。

プレイヤー分離モデル永続性特徴
E2BFirecracker microVMセッション最大 24 時間エージェント向け SDK、LangChain・Anthropic 連携
ModalgVisorセッション制限ありPython・機械学習バッチに最適化、大規模自動拡張
Vercel SandboxFirecracker microVM最大 45 分Vercel エコシステム統合、使い捨て前提
DaytonaDocker コンテナ設定次第90ms 以下の起動、AI デモ向け
NorthflankKata / Cloud Hypervisor + gVisor自社クラウド持ち込み対応(BYOC)、GPU 対応、本番向け
Fly.io SpritesFirecracker microVM数日以上の永続チェックポイント / 復元、CPU 専用、育てる実行環境

Sprites の差別化は「永続性」にある。 E2B と Vercel Sandbox は使い捨てを前提とするが、Sprites はエージェントが同じ環境で作業を継続できる。 ただし GPU 非対応のため、モデル推論を自前で走らせるエージェント用途は対象外になる。 Northflank が本番マルチテナント企業向けを狙うのに対し、Sprites は個人開発者・単一エージェント向けの継続的作業環境に絞った設計だ。

この文脈で実用的な使い方が一つある。Claude Code をリモートの Fly Machine 上で動かす構成だ。 Claude Code はインタラクティブ TUI モードであれば、Claude Pro や Max のサブスクリプション認証のまま動作する。 Fly Machine に SSH で入り、そこで claude を起動すれば、API 従量課金ではなくサブスク内の利用枠でエージェントが回る。 Fly 側に発生するのは Machine の計算費用のみで、shared-cpu-1x / 256MB なら月あたり $2.02 の枠内に収まる。 ローカルマシンを閉じても Machine は動き続けるため、長時間のタスクをバックグラウンドで進められる。 なお、claude -p によるスクリプト実行(Agent SDK)は 2026 年 6 月 15 日以降、サブスクとは別枠のクレジットになった。 この方式の対象はインタラクティブセッションに限られる。

Fly.io Sprites / E2B / Modal / Vercel Sandbox / Daytona / Northflank の永続性・分離モデル・GPU 対応の比較図
出典: 筆者作成(Northflank ブログ「Top Fly.io Sprites alternatives」2026/6 をもとに整理)

参考: Northflank: Top Fly.io Sprites alternatives / E2B 公式 / Claude Code ヘッドレスモードと Agent SDK / Claude Code を Pro・Max プランで使う

7. リスクと課題

Fly.io に対してよく指摘される課題は 3 点ある。

信頼性の評判が、本番採用の最大の障壁だ。 Fly.io Status の履歴には多数のインシデントが記録されており、2024 年 4 月に大規模障害が発生した。 その後、コミュニティで運用の回避策が広く議論された。"Run any code fearlessly." を掲げる以上、基盤の安定性が問われる。

Postgres の手離れの悪さが、DB を預けたい層を Railway や Render へ流す。 Fly.io の Postgres はもともと unmanaged(自己管理)として提供されていた。 公式ドキュメントにも "This Is Not Managed Postgres" と長く明記されていた。 2025 年以降は managed 化が進んでいる。 ただし Supabase が 2025 年 4 月に Fly 上の Postgres を deprecate したことは、課題の象徴として残る。

ユニットエコノミクスの論点もある。評価額 $397M(2023 年 Series C 時点)に対し、2024 年の自己申告売上は $11.2M だ。 自前ハードウェアを抱える計算基盤会社として、SaaS 的な粗利率を取りにくい構造になっている。 Sprites でエージェント向けの継続的な計算消費を獲得する筋が、このギャップを埋める仮説として読める。

参考: Fly.io Status / Supabase: Deprecation of Fly.io Postgres(2025/4)

まとめ:Fly.io を 8 点で整理する

  1. 土台は Firecracker microVM:コンテナ並みの起動速度と VM 並みの分離を両立。アプリごとに専用カーネルを持ち、マルチテナントでも隣テナントと OS を共有しない
  2. 18 リージョンへの Anycast 分散:同一アプリを複数リージョンに置き、ユーザーを最寄りへ振り分ける。下り通信費は北米・欧州で $0.02/GB と AWS の 4 分の 1 以下
  3. Sprites で「育てる実行環境」を打ち出した:2026 年 1 月発表。E2B・Vercel Sandbox の使い捨て前提に対し、状態を保持して数日後も続きから作業できる永続 microVM を差別化軸にした
  4. 常時稼働のリモートエージェント基盤として機能するmin_machines_running = 1 で Machine を常時起動に設定すると、定期実行・常時監視・長時間バッチをローカルマシンなしで動かせる。Sprites の永続ストレージと組み合わせると依存関係が維持される
  5. flyctl の操作感が開発者体験の軸fly launch がプロジェクトを自動判定してそのままデプロイまで進む。Dockerfile があれば追加設定なしに動作し、fly logs / fly ssh console で稼働中の Machine に手が届く
  6. GPU の賭けを公に撤収した:2024 年の "We Were Wrong About GPUs" で方向転換を明示。推論基盤ではなく実行・分離基盤として AI 市場に向かうと決めた
  7. 下り通信費の安さが構造的優位:自前ハードウェアで原価を握る。通信量の多い世界分散アプリで価格優位が出やすい。アジア太平洋は $0.04/GB と北米・欧州の 2 倍になる点は留意が要る
  8. 信頼性と Postgres が本番採用の障壁:開発者コミュニティでの評価は高い一方、障害頻度と DB の手離れの悪さが、エンタープライズ採用を遅らせる要因として繰り返し指摘されてきた

参考リンク

この記事は、調査・記事制作に特化したAIエージェントと、人の編集で作っています

調査、構成、執筆、更新管理の一部にAIエージェントを取り入れています。 事業や組織へのAI導入を、実務に合わせて検討したい場合はご相談ください。

AI導入について相談する