SimGym に頼らず "AI顧客" にECを診断させる方法 — Shopify外の事業者へ

ShopifyのSimGymが市場を教育してくれた。だが対象は Liquidテーマ × A/B比較 × Network Intelligence加入店舗のみ。残りの大多数──BASE/STORES/楽天/Yahoo/ヘッドレス/独自構築のECにとって、AIペルソナによるサイト診断は別の手段で実装する必要がある。

2026-04-274 分で読めますMAXsuite Editorial

ShopifyがWinter '26 EditionでSimGymをリリースしたとき、業界はAIペルソナテストの存在を初めて広く知った。だが現場の事業者がよく見ると、SimGymには3つの強い制約がある。

Shopify Liquidテーマ限定 — Hydrogen / ヘッドレス / 自社構築は対象外
A/Bテストモデルのみ — 単一サイトの絶対評価ができない
Shopify Network Intelligence(SNI)有効店舗 — 加入していない店舗は機能しない

問題は、日本のEC事業者の 過半数がこの3条件のいずれにも当てはまらない ことだ。

残された市場

実際、日本のECランドスケープを並べてみるとよく分かる。

プラットフォーム	推定店舗数	SimGym 対象
楽天市場	約56,000店	×
Yahoo!ショッピング	約120万店(個人含む)	×
BASE	約230万店	×
STORES	約190万店	×
Shopify(日本)	約45,000店	△(Liquid/SNI加入のみ)
自社構築・ヘッドレス	数万店	×

Shopify Liquidテーマ × SNI加入の店舗は、控えめに見ても日本EC全体の5%以下だ。残りの95%にAIペルソナ診断は届いていない。

なぜ "Shopify 以外" でもAIペルソナ診断が動くのか

Browserbase / Stagehand v3 の登場で、「任意のサイトを実ブラウザで操作するAIエージェント」が実用域に入った。具体的には:

1セッションあたり**$0.005〜0.05**のコストで実ブラウザ操作
ログインフローやAJAXカートのような 動的サイト でも操作可能
Claude / OpenAI などのLLMで 思考トレース を残せる

つまり「AI顧客にサイトを買い物させる」処理は、Shopifyに依存しなくても物理的に動く。あとは設計の問題だ。

単一サイトの絶対評価という別の地平

SimGymは「テーマAとテーマBで、AI顧客が買う比率はどう違うか」を見る。これはShopify管理者の眼差しに合う。だが事業者が本当に欲しいのは

「うちのサイトは100点満点で何点で、何が悪いか」

という絶対評価のほうだ。リニューアル前後の比較も、新サイトの初動も、「比較対象がまだない」状態から始まる。AIペルソナの強みはここで一気に出る。

実装するときの3つの落とし穴

ペルソナの母集団を雑に作ると数値が嘘になる
- 年齢・性別・所得だけでは弱い。買い物動機・予算・急ぎ度・支払い習慣・デバイスなど多次元で生成する必要がある
思考トレースを残さないと改善の根拠にならない
- "なぜ離脱したか"を自然言語で残せないと、A/Bの比率しか出ない
日本固有の文脈を学習させないと外す
- 送料・帯・ポイント・後払い・LINE決済を理解しないペルソナは、日本のCRO診断にならない

CROMAXはこの3点を中核に置いて設計している。

次のアクション

/diagnose でURLを入れてみるか、/products/cromax でプロダクトの詳細を見てください。Shopify外のECや、まだトラフィックが少ない新サイトに特に効きます。

CRO
楽天 / Yahoo / BASE / STORES を横断する CRO 比較
同じ商品・同じ顧客でも、プラットフォームごとにCROの効き方は違う。楽天モール / Yahoo!ショッピング / BASE / STORES / 自社Shopifyの5プラットフォームを、CROMAXのAIペルソナで横断診断した結果と効きやすい改善ポイントを整理する。
読む

Newsletter

週1の編集ニュースレター

AI × EC × 経営の交差点で、編集部が今週読んだ・書いた・気づいたものをひとまとめ。配信解除はワンクリック。