概要
With AI(AI検索機能)で質問すると、AIが生成するインサイトや要約に「10,000件のサンプルデータに基づいており」という注記が表示されることがあります。
これは、AIがデータの傾向分析やテキスト要約を生成する際に、全データではなく最大10,000行のサンプルデータを使用していることを示す注記です。
このメッセージの意味
With AIの回答には2種類が存在
With AIが返す回答は、大きく分けて以下の2種類があります。
| 回答の種類 | 処理方法 | データ範囲 |
|---|---|---|
| チャート・テーブル(数値集計) | 検索エンジンが全データに対してクエリを実行 | 全件 |
| AIインサイト・要約テキスト | AIモデル(LLM)がデータを読み取って自然言語で解説 | 最大10,000件のサンプル |
なぜサンプリングが行われるのか
AIモデル(大規模言語モデル)には、一度に処理できるデータ量に制限があります。数十万〜数百万行のデータをすべてAIに渡すことは技術的に困難なため、代表的なサンプルを抽出してAIに渡し、傾向の分析や要約を生成しています。
重要: チャートやテーブルに表示される数値自体は全データに基づいて正確に計算されています。サンプリングが影響するのは、AIが生成する「解説文」「インサイト」「傾向の説明」の部分のみです。
課題となる部分
1. サンプルに含まれないデータの傾向が反映されない可能性
10,000件のサンプルでは、データ全体の傾向を十分に捉えられない場合があります。
例:
- 全体100万件のうち、特定の店舗のデータが100件しかない場合、サンプルにその店舗のデータが含まれない可能性がある
- 直近に発生した異常値や急激な変化がサンプルに反映されない場合がある
2. AIの解説と実際の数値にズレが生じる場合がある
チャートの数値(全件集計)とAIの解説(サンプルベース)で、以下のようなズレが起きることがあります。
- AIが「売上は横ばい」と解説しているが、チャートでは微増傾向が見える
- AIが「カテゴリAが最も多い」と述べているが、全件集計ではカテゴリBが僅差で上回っている
3. 少数派のデータに関する分析精度が低い
データ全体に占める割合が小さいセグメント(例: 特定地域、特定チャネル、特定期間)に関するAIの解説は、サンプルに十分なデータが含まれない可能性があるため、精度が低くなる場合があります。
対処方法
1. AIの解説を参考として捉えチャート・テーブル(数値集計)と掛け合わせて判断する
AIが生成するインサイトや要約は「傾向の概要を素早く把握する」ためのものです。正確な数値判断が必要な場合は、チャートやテーブルに表示される集計値を確認してください。
ポイント: チャート・テーブルの数値 = 全件集計(正確)、AIの解説文 = サンプルベース(参考)
2. 質問を具体的に絞り込む
データ量が多い場合、フィルタ条件の追加や集計値をベースとした分析とすることで、サンプリングの影響を軽減できます。
| 対処前 | 対処後 |
|---|---|
| 「売上の傾向を教えて」(全期間・全店舗) | 「今月のEC売上の傾向を教えて」(期間・チャネル指定) |
| 「商品の売れ筋は?」(全商品) | 「カテゴリ名 = トップス の売れ筋は?」(カテゴリ指定) |
対象データが10,000件以下になれば、AIは全データを参照して解説を生成するため、サンプリングの問題は発生しません。
3. 数値の確認はチャート・テーブルで行う
意思決定に使う数値は、必ずチャートまたはテーブル表示で確認してください。これらは検索エンジンが全データに対してクエリを実行した結果であり、サンプリングの影響を受けません。
4. フォローアップ質問で深掘りする
AIの解説に疑問がある場合は、フォローアップ質問で具体的に確認できます。
- 「この数値の根拠を見せて」
- 「テーブル形式で表示して」
- 「〇〇に絞って再度分析して」
よくある質問
| 質問 | 回答 |
|---|---|
| チャートの数値もサンプルですか? | いいえ。チャート・テーブルの数値は全データに基づいて計算されています。サンプリングはAIの解説文生成時のみです。 |
| 10,000件の上限は変更できますか? | 変更は出来ません。 |
| サンプルはどのように選ばれますか? | 統計的に代表性のあるサンプルを自動的に抽出します。ユーザーが選択方法を指定することはできません。 |
| このメッセージが出ない場合もありますか? | はい。対象データが10,000件以下の場合、全データがAIに渡されるためこのメッセージは表示されません。 |