ツール呼び出し精度
agent-toolcall-v1 · v1 · 言語: ja · サブカテゴリ: tool_use
· 難易度: d3
📋 評価基準
観点: ツール選択 / 引数の正確性 / 順序
制約: valid JSON, 2 calls
📝 プロンプト
以下のツール定義に対して、リクエストに応じて適切なツール呼び出しをJSON形式で出力してください。
# 利用可能ツール
1. get_weather(city: string, date: string)
2. send_email(to: string, subject: string, body: string)
3. search_docs(query: string, limit: int = 5)
# リクエスト
「明日の東京の天気を調べて、結果を john@example.com にメールで送ってください。件名は "Weather Report" で。」
# 出力
呼び出すツールのリストをJSON配列で:
[{"tool": "...", "arguments": {...}}] ✅ 期待出力
[
{"tool": "get_weather", "arguments": {"city": "東京", "date": "<明日>"}},
{"tool": "send_email", "arguments": {"to": "john@example.com", "subject": "Weather Report", "body": "<天気の結果>"}}
] 🏆 モデル別スコア
まだランがありません。
📜 ラン履歴 (最新30件)
まだランがありません。