ShopifyがWinter '26 EditionでSimGymをリリースしたとき、業界はAIペルソナテストの存在を初めて広く知った。だが現場の事業者がよく見ると、SimGymには3つの強い制約がある。
- Shopify Liquidテーマ限定 — Hydrogen / ヘッドレス / 自社構築は対象外
- A/Bテストモデルのみ — 単一サイトの絶対評価ができない
- Shopify Network Intelligence(SNI)有効店舗 — 加入していない店舗は機能しない
問題は、日本のEC事業者の 過半数がこの3条件のいずれにも当てはまらない ことだ。
残された市場
実際、日本のECランドスケープを並べてみるとよく分かる。
| プラットフォーム | 推定店舗数 | SimGym 対象 |
|---|---|---|
| 楽天市場 | 約56,000店 | × |
| Yahoo!ショッピング | 約120万店(個人含む) | × |
| BASE | 約230万店 | × |
| STORES | 約190万店 | × |
| Shopify(日本) | 約45,000店 | △(Liquid/SNI加入のみ) |
| 自社構築・ヘッドレス | 数万店 | × |
Shopify Liquidテーマ × SNI加入の店舗は、控えめに見ても日本EC全体の5%以下だ。残りの95%にAIペルソナ診断は届いていない。
なぜ "Shopify 以外" でもAIペルソナ診断が動くのか
Browserbase / Stagehand v3 の登場で、「任意のサイトを実ブラウザで操作するAIエージェント」が実用域に入った。具体的には:
- 1セッションあたり**$0.005〜0.05**のコストで実ブラウザ操作
- ログインフローやAJAXカートのような 動的サイト でも操作可能
- Claude / OpenAI などのLLMで 思考トレース を残せる
つまり「AI顧客にサイトを買い物させる」処理は、Shopifyに依存しなくても物理的に動く。あとは設計の問題だ。
単一サイトの絶対評価という別の地平
SimGymは「テーマAとテーマBで、AI顧客が買う比率はどう違うか」を見る。これはShopify管理者の眼差しに合う。だが事業者が本当に欲しいのは
「うちのサイトは100点満点で何点で、何が悪いか」
という絶対評価のほうだ。リニューアル前後の比較も、新サイトの初動も、「比較対象がまだない」状態から始まる。AIペルソナの強みはここで一気に出る。
実装するときの3つの落とし穴
- ペルソナの母集団を雑に作ると数値が嘘になる
- 年齢・性別・所得だけでは弱い。買い物動機・予算・急ぎ度・支払い習慣・デバイスなど多次元で生成する必要がある
- 思考トレースを残さないと改善の根拠にならない
- "なぜ離脱したか"を自然言語で残せないと、A/Bの比率しか出ない
- 日本固有の文脈を学習させないと外す
- 送料・帯・ポイント・後払い・LINE決済を理解しないペルソナは、日本のCRO診断にならない
CROMAXはこの3点を中核に置いて設計している。
次のアクション
/diagnose でURLを入れてみるか、/products/cromax でプロダクトの詳細を見てください。Shopify外のECや、まだトラフィックが少ない新サイトに特に効きます。