どうも、soda エンジニアの國田です。
皆さん、毎日プロテイン飲んでますか?
私は常に肌身離さずプロテインを持ち歩いています。
仕事用のバッグの中には常に3kgほどのプロテインが入っており、会議中でも、開発中でも、出張中でも、いつでもプロテインを摂取できる体制を整えています。仕事のパフォーマンスを最大まで高めるためには、まず血中プロテイン濃度を切らさないことが重要です。
そうそう!プロテインと言えば、前回、プロテインの商品データを対象に、ベクトル検索を使わないAgentic Searchで商品レコメンドができるのかを検証しましたね。
非ベクトル利用のAgentic Searchは、『検索対象のデータが綺麗に整理されている』という条件付きではあるものの、ベクトル化などの前処理を必要とせずに、エージェントが文脈把握と検索を高精度で実現してくれるということがわかっています。
ただ、ここでもう1つ気になることがあります。
上述のように『ドキュメントが整理された条件』であれば、小規模モデルでも精度の高い回答を生成できるのでしょうか?
Agentic SearchはあくまでもAIエージェントに自律的な検索を任せる仕組みです。つまり、「どの情報を見に行くか」「見つけた情報をどう整理するか」といった判断はベースとなるLLMに委ねている状態で、精度部分も実際には、LLMの性能に依存している筈ですよね?
「もっと小さいモデル...例えば、GPT-5.4-nanoや、GPT-OSSのようなローカルモデルでも十分な性能を発揮できるのか?」といった点は多くの人が関心のある点ではないでしょうか?
さぁ、やってみよう
方法
と言うことで、論より証拠。実験してみることにします。
前回同様、プロテインレコメンドAIに使う商品データを用意します。
実在する商品ではなく、架空のプロテインとして、以下のような商品詳細情報を作成しました。
# 朝霧ホエイ チョコレート
## 基本情報
- 製品ID: P001
- 製品名: 朝霧ホエイ チョコレート
- ブランド: 朝霧ニュートリション
- 味: チョコレート
- 種類: ホエイ
- 価格: 3980円
- 食数: 30食
## 栄養情報 1食あたり
- タンパク質: 24g
- タンパク質含有率: 78%
- 糖質: 2.8g
- 脂質: 1.9g
- カロリー: 121kcal
## 評価
- おいしさ評価: 5 / 5
- 溶けやすさ評価: 5 / 5
- ダイエット適性: 3 / 5
- 増量適性: 4 / 5
- 初心者適性: 5 / 5
- リカバリー適性: 4 / 5
## 属性
- 植物性: いいえ
- 乳糖不使用: いいえ
## メモ
甘めで牛乳との相性がよい。水でも粉っぽさが少ない。
こちらのデータは、"P001_朝霧ホエイ_チョコレート.md"という名前で保存します。
同様の形式で、25種類のプロテインのデータを作成しました。以下、用意したダミーデータの一覧です。
P001_朝霧ホエイ_チョコレート.md
P002_朝霧ホエイ_バニラ.md
P003_抹茶静寂アイソレート.md
P004_透明柑橘クリア.md
P005_黒ごま大豆プロテイン.md
P006_きなこ大豆ライト.md
P007_完熟バナナゲイナー.md
P008_焦がしキャラメルゲイナー.md
P009_夜凪カゼイン_ココア.md
P010_眠りのミルクカゼイン.md
P011_青豆ピープロテイン.md
P012_玄米ナチュラルプロテイン.md
P013_珈琲集中ホエイ.md
P014_抹茶集中ホエイ.md
P015_苺ヨーグルトホエイ.md
P016_白桃クリアホエイ.md
P017_塩バニラミネラル.md
P018_蜂蜜レモンリカバリー.md
P019_無糖プレーンアイソレート.md
P020_低価格チョコスタンダード.md
P021_大容量バニラスタンダード.md
P022_高タンパク質チョコアイソレート.md
P023_シナモンオートミールプロテイン.md
P024_南国マンゴークリア.md
P025_ミックスベリービーガン.md
また、Agentic Searchで利用できるよう、索引用のフォルダを構成します。
索引
├── 体質・食事制限
│ ├── アレルゲン
│ ├── 乳成分
│ ├── P001_朝霧ホエイ_チョコレート.md
│ ├── P002_朝霧ホエイ_バニラ.md
│ ├── ...
│ :
│ ├── 大豆
│ ├── P005_黒ごま大豆プロテイン.md
│ └── P006_きなこ大豆ライト.md
│ :
├── 味
│ ├── チョコレート系
│ ├── P001_朝霧ホエイ_チョコレート.md
│ ├── P020_低価格チョコスタンダード.md
│ ├── ...
│ :
│ ├── バニラ系
│ ├── P002_朝霧ホエイ_バニラ.md
│ ├── ...
│ :
同じ `.md` ファイルが、複数のフォルダに登場していますが、これは意図しているもので、配置そのものを検索インデックスとして機能させる工夫です。
たとえば「チョコレート系で、乳成分を含むプロテイン」を探したい場合は、味/チョコレート系 と 体質・食事制限/アレルゲン/乳成分 の両方に登場するファイルを確認すれば良いわけです。
(より詳しい説明が知りたい方は、前回の記事を参照ください。)
検索処理
検索方法は、以下の手順で実施します。
① ユーザーの希望条件と索引フォルダを照合する
まず、ユーザーがLLMに質問します。
その質問文をもとに、LLMが索引フォルダの一覧から、「どのフォルダを見るべきか」照合します。
たとえば「チョコレート味の安いプロテイン」という質問では、以下のようなフォルダが候補になります。
・味/チョコレート系
・価格/低価格帯
この段階では、まだマスターデータは読みません。あくまで、どの索引を見るべきかを選ぶだけです。
② 複数の索引フォルダに含まれる製品ファイル名を比較する
次に、選択された複数の索引フォルダに含まれるファイル名をリストアップし、比較します。
ここで、もし同一のファイル名が複数の索引フォルダに出現する場合、その製品は複数のユーザー条件に対応している可能性が高いとみなせます。
完全一致する製品が存在しない場合は、より多く出現する製品を優先します。
③ 候補製品の正規データを読み込む
最後に、手順②で得られた候補のうち、優先度の高い最大5件をLLMが選定した上で、マスターデータを読み込み、実際の回答を生成します。
以上の検証をモデル別に実施します。
今回は、以下のモデルで比較しました。
- GPT-5.4: 大規模サイズのOpenAI製言語モデル
- GPT-5.4-nano: 上記、GPT-5.4を小規模化した最小のモデル。
- GPT-OSS-20b: OpenAIが公開しているローカル向けの小規模言語モデル
結果
では早速ですが、結果に移りましょう。
まず、以下の質問を投げてみます。
Q. 低糖質でタンパク質が多いものを探している
想定している答えは、「P022_高タンパク質チョコアイソレート.md」と「P019_無糖プレーンアイソレート.md」です。
それぞれのモデルの答えを以下に示します。(なお、回答中で想定通りのプロテインには黄色いマーカーを引いてあります。)
GPT-5.4(クリックで展開)
低糖質でタンパク質が多いものなら、今回確認できた候補の中では次の2つが特に合っています。
1. 高タンパク質チョコアイソレート
- タンパク質: 29g
- 糖質: 0.9g
- タンパク質含有率: 91%
- 脂質: 0.5g
- カロリー: 114kcal
- 種類: ホエイアイソレート
- 推薦メモ: 高タンパク質かつ低糖質。チョコ味としては甘さ控えめ。
2. 無糖プレーンアイソレート
- タンパク質: 28g
- 糖質: 0.6g
- タンパク質含有率: 90%
- 脂質: 0.4g
- カロリー: 109kcal
- 種類: ホエイアイソレート
- 推薦メモ: 味付けなしで高タンパク。おいしさより成分重視の人向け。
参考までに、抹茶静寂アイソレートもかなり近いです。
- タンパク質: 27g
- 糖質: 1.1g
- タンパク質含有率: 86%
一方で、完熟バナナゲイナーはタンパク質25gですが、糖質28.0gなので、低糖質重視ならあまり合わなそうです。
迷ったら、
- 数値重視なら: 無糖プレーンアイソレート
- 飲みやすさも欲しいなら: 高タンパク質チョコアイソレート
味の好みがあれば、それに合わせて絞れます。
GPT-5.4-nano(クリックで展開)
低糖質でタンパク質が多いものとして、以下が条件に合う候補です(1食あたり表記)。
1) 高タンパク質チョコアイソレート(ピュアライン)
- タンパク質:29g(含有率91%)
- 糖質:0.9g
- 脂質:0.5g / カロリー:114kcal
- 特徴:チョコ味、甘さ控えめ、溶けやすさ評価5/5、乳糖不使用
2) 無糖プレーンアイソレート(ピュアライン)
- タンパク質:28g(含有率90%)
- 糖質:0.6g
- 脂質:0.4g / カロリー:109kcal
- 特徴:味付けなしで高タンパク(成分重視向け)、乳糖不使用、ダイエット適性5/5
3) 抹茶静寂アイソレート(静寂ラボ)
- タンパク質:27g(含有率86%)
- 糖質:1.1g
- 脂質:0.6g / カロリー:113kcal
- 特徴:甘さ控えめ、抹茶の苦味あり、乳糖不使用
※「完熟バナナゲイナー(P007)」は糖質が28.0gで高く、今回は低糖質条件に合いませんでした。
GPT-OSS-20b(クリックで展開)
低糖質で高タンパクなプロテインをご希望ですね。以下の2商品は、1食あたり糖質が1 g未満(0.6-0.9 g)かつタンパク質量が28〜29 g と、お探しの条件にぴったり合致します。
| 製品 | タンパク質(1食) | 糖質(1食) | 価格 | 味・タイプ |
| P022 高タンパク質チョコアイソレート | 29 g (91 %タンパク質含有率) |
0.9 g | 5,680円(30食) | チョコレート味、ホエイアイソレート |
| P019 無糖プレーンアイソレート | 28 g (90 %タンパク質含有率) |
0.6 g | 5,280円(30食) | プレーン味、ホエイアイソレート |
### おすすめポイント
- P022 高タンパク質チョコアイソレート
- 糖質はわずか0.9 gで、ダイエットや糖質制限中でも安心。
- タンパク質が29 gと非常に高く、1食で十分な量を摂取できます。
- 溶けやすさ評価5/5、ダイエット適性も最高評価なので、筋力トレーニング後のリカバリーにも最適です。
- チョコ味が好きな方におすすめ。
- P019 無糖プレーンアイソレート
- 糖質は0.6 gとさらに低く、完全無糖。
- タンパク質量は28 gで十分です。
- プレーン味なので、好きなフルーツやオイルに混ぜてアレンジしやすいです。
- お味がシンプルなので、成分重視の方にはぴったり。
### まとめ
- 糖質を極力抑えつつ高タンパク**: P022 と P019 の両方とも1食あたり糖質は1 g未満。
- 価格・食数共に手ごろ**: 両製品とも30食入りで、価格は5,280〜5,680円とバランスの良い設定です。
- 用途別選択:
- チョコ好きなら P022
- シンプルなプレーンが好みなら P019
どちらも乳糖不使用・カフェインなしで、アレルギーに関しては特段の注意点はありません。ご自身の味の好みや利用シーンに合わせて選んでいただければと思います。
いずれのモデルにおいても、想定していた回答を提示することができていますね。
他の質問もしてみましょう。
Q. おいしくて水に溶けやすいチョコ系が欲しい
ここで、想定している答えは、「P001_朝霧ホエイチョコレート.md」もしくは「P022_高タンパク質チョコアイソレート.md」です。『水に溶けやすいプロテイン』とはホエイプロテイン系統に代表されており、今回の実験では、「種類」ディレクトリから「ホエイ」「ホエイアイソレート」の索引を辿れば導出できます。
GPT-5.4(クリックで展開)
1. 朝霧ホエイ チョコレート
- おいしさ評価: 5/5
- 溶けやすさ評価: 5/5
- 推薦メモ: 「水でも粉っぽさが少ない」
- 味はチョコレート、種類はホエイ、価格は3980円
ユーザーの「おいしくて水に溶けやすいチョコ系」という条件には、今回読めた候補の中でこれがいちばん合っています。
比較候補としては以下です。
2. 高タンパク質チョコアイソレート
- おいしさ評価: 4/5
- 溶けやすさ評価: 5/5
- 推薦メモ: 甘さ控えめ
- 価格は5680円
3. 低価格チョコスタンダード
- おいしさ評価: 3/5
- 溶けやすさ評価: 3/5
- 価格は2980円
- 推薦メモ: 成分や溶けやすさは標準的
結論
- 味重視+水での飲みやすさ重視なら「朝霧ホエイ チョコレート」
- 甘さ控えめで溶けやすさ重視なら「高タンパク質チョコアイソレート」
- 価格重視なら「低価格チョコスタンダード」
GPT-5.4-nano(クリックで展開)
水に溶けやすい"チョコ系"で、条件に合いそうな候補はこちらです。
1) 朝霧ホエイ チョコレート(P001)(ホエイ/チョコレート)
- おいしさ評価 5/5、溶けやすさ評価 5/5
- 栄養:タンパク質24g、糖質2.8g、脂質1.9g、121kcal
- 推薦メモ:甘めで牛乳との相性がよい。水でも粉っぽさが少ない。
2) 高タンパク質チョコアイソレート(P022)(ホエイアイソレート/チョコレート)
- おいしさ評価 4/5、溶けやすさ評価 5/5
- 栄養:タンパク質29g、糖質0.9g、脂質0.5g、114kcal
- 推薦メモ:高タンパク質かつ低糖質。チョコ味としては甘さ控えめ。
3) 低価格チョコスタンダード(P020)(ホエイ/チョコレート)
- おいしさ評価 3/5、溶けやすさ評価 3/5
- 栄養:タンパク質21g、糖質3.5g、脂質2.1g、125kcal
- 推薦メモ:価格を抑えたチョコ味。成分や溶けやすさは標準的。
もし「一番おいしさ重視」なら P001、 「糖質も抑えつつ溶けやすさ重視」なら P022 が良さそうです。
甘さは"甘め/控えめ"どちらが好みですか?
GPT-OSS-20b(クリックで展開)
ご希望にぴったりのおすすめは、ピュアライン「高タンパク質チョコアイソレート」です。
| 項目 | 内容 |
| 味 | チョコレート |
| 評価(おいしさ) | 4 / 5 |
| 溶けやすさ | 5 / 5 |
| タンパク質量 | 29 g/1食あたり |
| 糖質 | 0.9 g |
| 価格 | 5,680円(30食入) |
- おいしさ評価4/5:甘さ控えめながらもチョコレートの風味がしっかりと感じられます。
- 溶けやすさ評価5/5:水に入れてすぐに滑らかになり、飲み心地がよいです。
このプロテインは乳糖不使用でカフェインも含まれていないため、体への負担も少なく、ダイエットやリカバリーにも適しています。
もし他の価格帯や成分に関して追加でご相談があれば、お気軽にどうぞ。
GPT-5.4およびnanoはきちんとホエイプロテイン2種類を提示できていましたが、GPT-OSS-20bのみ、「朝霧ホエイ チョコレート」に関する記述は見られませんでした。
実際にGPT-OSSが検索・閲覧したファイルを確認してみましょう。
P024_南国マンゴークリア.md
P022_高タンパク質チョコアイソレート.md
P020_低価格チョコスタンダード.md
P016_白桃クリアホエイ.md
P004_透明柑橘クリア.md
おや?「朝霧ホエイ チョコレート」が含まれていませんね?
逆に多くヒットしているのは「南国マンゴークリア」「白桃クリアホエイ」「透明柑橘クリア」など、「クリア」という文字が商品名に含まれているプロテインです。OSSのみ、他の2つのモデルとは違う検索の挙動をしていたことになります。
それでは、次の質問にいってみましょう。
Q. お腹がゴロゴロしにくいプロテインが欲しい。でも、価格は抑えたいです。
一部の乳由来プロテインは、乳糖が含まれます。乳糖は人によってはうまく消化しにくく、腹痛などが起きることがあります。そのようなケースでは、ホエイアイソレートやソイプロテインなど乳糖不使用の製品が候補になります。
つまり、この質問では、AIが以下のような意味的な変換をしつつ、さらに「価格は抑えたい」という要求を汲み取り、低価格なプロテインを提案する必要があります。
お腹がゴロゴロしにくい = 乳糖不使用、または乳由来ではないもの
果たして、うまくいくでしょうか。想定している回答は「きなこ大豆ライト」および「黒ごま大豆プロテイン」です。
GPT-5.4(クリックで展開)
お腹がゴロゴロしにくさを重視するなら、今回確認できた候補では**乳糖不使用の植物性プロテインが中心でした。
ただし、価格を抑えたい**条件まで含めると、読めた候補の中では3000円未満の商品は確認できませんでした。
そのうえで、比較的価格を抑えやすい順に挙げると、次の2つが候補です。
### 1. きなこ大豆ライト
- 価格: 3280円
- 種類: ソイ
- 乳糖不使用: はい
- 植物性: はい
- タンパク質: 20g
- 推薦メモ: 甘さ控えめで和風の味。夜や間食の置き換えに使いやすい。
おすすめ理由
今回読めた中では最安クラスで、乳糖不使用・植物性なので、まず条件に合いやすい候補です。
さらにおいしさ評価 4 / 5、初心者適性 4 / 5で、試しやすそうです。
---
### 2. 黒ごま大豆プロテイン
- 価格: 3480円
- 種類: ソイ
- 乳糖不使用: はい
- 植物性: はい
- タンパク質: 21g
- 推薦メモ: 香ばしさが強く、腹持ちがよい。水では少しざらつきが出やすい。
おすすめ理由
こちらも比較的安めで、乳糖不使用・植物性です。
おいしさ評価 4 / 5なので、風味重視なら候補になります。
---
### 価格は上がるが条件重視なら
- 玄米ナチュラルプロテイン 4480円
- 乳糖不使用・植物性
- 自然な穀物感がある。人工的な甘さを避けたい人に向く。
- 青豆ピープロテイン 4680円
- 乳糖不使用・植物性
- 豆由来の風味が強いため、味より条件重視の人向け。
- ミックスベリービーガン 4880円
- 乳糖不使用・植物性
- ベリー系の酸味で豆っぽさを抑えている。
### 結論
コスパ重視なら「きなこ大豆ライト」、
風味の好みで選ぶなら「黒ごま大豆プロテイン」も有力です。
必要なら次に、
「なるべく安い順で3つに絞る」か、「味が飲みやすそうな順で並べる」こともできます。
GPT-5.4-nano(クリックで展開)
お腹がゴロゴロしにくいことを優先するなら、まず **「乳糖不使用」** の製品を選ぶのが良いです(今回読めた中では乳糖不使用のものがありました)。加えて、価格もできるだけ抑えめの範囲でおすすめします。
## おすすめ(価格も抑えめ・乳糖不使用)
1) きなこ大豆ライト(大地ソイ)
- 価格:3280円(30食)
- 乳糖不使用:はい
- 栄養(1食):タンパク質20g、糖質2.0g
- 推薦メモ:甘さ控えめで和風。夜や間食の置き換えに使いやすい
2) 黒ごま大豆プロテイン(大地ソイ)
- 価格:3480円(30食)
- 乳糖不使用:はい
- 栄養(1食):タンパク質21g、糖質2.4g
- 推薦メモ:香ばしさが強く、腹持ちがよい(※水では少しざらつきが出やすい)
3) (参考)ミックスベリービーガン(プラントフォース)
- 価格:4880円(30食)※今回の中では少し高め
- 乳糖不使用:はい
- 栄養(1食):タンパク質23g、糖質2.2g
- 推薦メモ:植物性で乳糖不使用。ベリー系で豆っぽさを抑えている
## 価格は抑えめだけど、条件は弱め
4) シナモンオートミールプロテイン(モーニングボウル)
- 価格:3980円(25食)
- 乳糖不使用:いいえ
- 推薦メモ:食事代替寄りで腹持ちがよい(※粉感は強め)
- ただし「お腹がゴロゴロしにくい」を最優先する場合、今回の中では上の乳糖不使用の方が条件に合いやすいです。
よければ確認したいです:味は甘め/甘さ控えめ どちらが好みですか?それで「きなこ」か「黒ごま」か、もう少し絞って提案します。
GPT-OSS-20b(クリックで展開)
お腹がゴロゴロしにくい(糖質や炭水化物を少なくした)プロテインと、価格を抑えたいというご希望について、読み取った情報から以下の2つの選択肢をご提案します。
| 製品 | 価格 | 糖質(g/食) | コメント |
| 無糖プレーンアイソレート (P019) | 5,280円 | 0.6 g | 糖質が1 g未満で、胃腸への負担を抑える期待があります。価格はご希望の「3000円以下」よりやや高めですが、タンパク質含有率90%と品質は良好です。 |
| 低価格チョコスタンダード (P020) | 2,980円 | 3.5 g | 価格がご希望に沿っています。ただし糖質が3.5 gあるため、炭水化物への敏感さが強い方では胃腸の不快感を感じる可能性があります。 |
### 選択のポイント
1. お腹のゴロゴロ感を最小限にしたい場合
- 糖質・炭水化物を極力少なくするなら「無糖プレーンアイソレート」がおすすめです。価格はやや高くなりますが、胃腸への負担を減らすための選択肢として最も適しています。
2. 予算重視(3000円以下)
- 「低価格チョコスタンダード」は価格が抑えられており、コストパフォーマンスは良好です。糖質がやや高めですが、甘味を控えめにしたい方や炭水化物への感受性が低い場合には十分使えると思われます。
### まとめ
- 完全条件一致(価格抑制+極端に低糖質): 該当する商品は見つかりませんでした。
- 妥協案: 上記2点を選択肢として提示しました。どちらも読み取った情報のみからの推奨です。
もし他にも「3000円未満で糖質が1 g未満」の商品が必要な場合は、追加で検索してみるか、ご自身で価格や成分表を確認いただくとよいでしょう。
GPT-5.4やnanoではキチンと正解を提示しているのに対し、GPT-OSS-20bでは、大豆プロテイン系を一切提示できていません。代わりに提案されたのは「乳糖不使用だが高価格」もしくは「低価格だが乳糖使用している」製品(補足: 低価格チョコスタンダードは乳糖使用している製品)であり、ユーザーの提示した条件に対して、いずれの提案も片手落ちです。
また、回答の特徴として、お腹のゴロゴロを「糖質が原因」として捉えている点も気になりますね。確かに「糖質が原因でお腹に不調が出る」という主張は一定数存在します。ただ、今回はプロテインの文脈ですので、一般には「乳糖」で解釈するのが妥当と言えるでしょう。
考察
今回の結果を見る限り、モデルによって明らかにAgentic Searchの性能に変化がありました。回答自体の質もあるのですが、これは予め予想していた点ではあります。それよりも遥かに【検索行動】と【検索内容】の変化が大きいです。
特に、質問が抽象的であればあるほど、ローカルモデルの検索行動は本来あるべき検索水準から外れていくのが目に見えました。
質問を順番に振り返ってみましょう。
まず最初の、「低糖質でタンパク質が多いものを探している」という質問では、3つのモデルすべてが想定通りの候補を提示できていました。
この質問は、比較的分かりやすい条件です。「低糖質」と「高タンパク」は索引用のディレクトリにも「栄養成分」という項目ありますし、商品データ内の数値項目にも直接対応しています。モデル側でユーザーの意図を解釈したり、意味を違う言葉に変換する必要性が殆ど無い質問であるとも言えます。そのため、GPT-OSS-20bでも正しく候補を取得し、回答を生成できたと考えられます。
次の「おいしくて水に溶けやすいチョコ系が欲しい」では、GPT-5.4とGPT-5.4-nanoは、想定していた「朝霧ホエイ チョコレート」と「高タンパク質チョコアイソレート」を候補として提示できていました。
一方で、GPT-OSS-20bは「高タンパク質チョコアイソレート」は提示できたものの、「朝霧ホエイ チョコレート」には辿り着けませんでした。この条件では、まず「水に溶けやすい」ということでホエイプロテイン、そして「チョコ系」のプロテインを抽出する必要がありました。しかし、GPT-OSS-20bが実際に検索したファイルを確認すると、チョコ系だけでなく、「クリア」という文字列が商品名に含まれるプロテインも候補に含めていました。
つまり、GPT-OSSには、「水に溶けやすい=ホエイ」という認識がそもそも無かった可能性があります。その代わりに「クリア」といういかにも水に溶けやすそうな名前のものを中心に取り扱ってしまったのではないでしょうか?
最後、大きく差が出たのは、「お腹がゴロゴロしにくいプロテインが欲しい。でも、価格は抑えたいです。」という質問でした。こちらも前問と同様、ユーザーの表現をそのまま検索条件にするだけでは不十分で、「お腹がゴロゴロしにくい」という表現を、商品データ上の属性に変換する必要があります。
GPT-5.4とGPT-5.4-nanoは、この変換を行ったうえで、比較的価格の安い「きなこ大豆ライト」や「黒ごま大豆プロテイン」を提示できていました。
一方で、GPT-OSS-20bは「お腹がゴロゴロしにくい」という条件を、乳糖ではなく「糖質や炭水化物が少ないこと」と解釈していました。その結果、低糖質な「無糖プレーンアイソレート」や、価格が安い「低価格チョコスタンダード」を候補に挙げ、結果的にユーザーの意図とは異なる回答を生成していました。
つまり、こちらもモデル特有のコンテキスト理解力、ユーザーの意図に対する解釈性の問題と言えるでしょう。
Agentic Searchでは、検索対象となるデータを整備することで、LLMが正しい情報に辿り着きやすくなります。
しかし、検索対象をどれだけ整理しても、ユーザーの自然言語を正しい検索条件に変換できなければ、見るべき索引を間違えることが考えられます。
今回の例で言えば、
- 水に溶けやすい = クリア
- お腹がゴロゴロしにくい = 低糖質
など、解釈の方向性から間違っているために、結果として、見るべき索引フォルダやファイルが変わり、最終的な候補も変わってしまいます。GPT-5.4-nanoは、小型モデルでありながら3つの質問すべてでおおむね期待通りの候補を提示できていた点から考えると、Agentic Searchにおいてモデル差が出やすいのは、索引の作り方よりも、曖昧な自然言語を検索条件に変換する場面だと言えそうです。
nanoで性能が発揮できていた以上、検索対象が整理され、索引フォルダの意味が明確であれば、小型モデルでもAgentic Searchを実用的に動かせる可能性はそれなりにあります。ただ、ローカルモデルやOSSモデルを使う場合は、モデル特有のコンテキスト変換の癖を把握していた上で対応する索引インデックスの整備を進める方向性が良さそうですね。
今回の場合ですと、「水の溶けやすさ」などのインデックスを与えておくと検索性能が向上するように思います。(そのような逐次的なチューンナップができるのも、Agentic Searchの利点ですね。)
まとめ
いかがでしたか?今回は、プロテインの商品データと索引フォルダを使い、gpt-5.4、gpt-5.4-nano、gpt-oss-20bでAgentic Searchの結果を比較しました。
Agentic Searchにおけるモデル性能は、最終回答そのものよりも、むしろ探索行動そのものに表れます。
小型モデルでも、質問文とフォルダ構造の整理がきちんと噛み合っていれば、十分に機能する場面があります。
一方で、曖昧な質問や、モデルによる解釈が必要な表現が質問文に含まれている場合には、より高性能なモデルの方がファイル探索は安定して働くことがわかりました。単に「一番大きいモデルを使うこと」も勿論、戦略としては否定しませんが、「その検索タスクに対して、適切に効くモデルや設計を選ぶこと」が構築において重要な意味を持ちそうです。
そういった意味では、RAGの世界も筋トレと同じかも知れませんね。
大胸筋をデカくしたいからといって、必ずしもベンチプレスだけが正解とは限りません。ダンベルプレスの方が効く人もいれば、マシンの方が安定して追い込める人もいます。
Agentic Searchは、ユーザーの言葉を正しい検索条件に変換し、見るべき索引にきちんと辿り着けるかが重要だと言えるでしょう。
ではまた!






