ツール呼び出し精度

agent-toolcall-v1 · v1 · 言語: ja · サブカテゴリ: tool_use · 難易度: d3

← 一覧に戻る

📋 評価基準

観点: ツール選択 / 引数の正確性 / 順序

制約: valid JSON, 2 calls

📝 プロンプト

以下のツール定義に対して、リクエストに応じて適切なツール呼び出しをJSON形式で出力してください。

# 利用可能ツール
1. get_weather(city: string, date: string)
2. send_email(to: string, subject: string, body: string)
3. search_docs(query: string, limit: int = 5)

# リクエスト
「明日の東京の天気を調べて、結果を john@example.com にメールで送ってください。件名は "Weather Report" で。」

# 出力
呼び出すツールのリストをJSON配列で:
[{"tool": "...", "arguments": {...}}]

✅ 期待出力

[
  {"tool": "get_weather", "arguments": {"city": "東京", "date": "<明日>"}},
  {"tool": "send_email", "arguments": {"to": "john@example.com", "subject": "Weather Report", "body": "<天気の結果>"}}
]

🏆 モデル別スコア

まだランがありません。

📜 ラン履歴 (最新30件)

まだランがありません。