多段階指示追従

chat-jp-instruction-v1 · v1 · 言語: ja · サブカテゴリ: instruction_following · 難易度: d4

← 一覧に戻る

📋 評価基準

観点: 指示遵守 / 順序 / 形式

制約: START, END, 3つ, 文字数, 詩

📝 プロンプト

以下の指示に正確に従ってください。

# 指示
1. まず「START」とだけ出力
2. 次に、果物を3つ、改行区切りでリスト
3. 次に、3つの果物の合計文字数
4. 次に、1文でその3つを表現する詩
5. 最後に「END」とだけ出力

# 注意
- 各ステップは見出し付きで区切る
- 余計な説明は付けない

✅ 期待出力

START\nリンゴ\nバナナ\nイチゴ\n(文字数)\n(詩)\nEND

🏆 モデル別スコア

# モデル 平均 最良 最低 サンプル
1 Owl Alpha 32.5 65 0 2

📜 ラン履歴 (最新30件)

実行日時 モデル スコア コスト 時間 判定
2026-06-23 14:29 Owl Alpha 65.0 $0.0000 3.0s START/ENDや項目数(3つ)などの形式指示はおおむね守っているが、果物の指定が期待出力の「リンゴ・バナナ・イチゴ」でなく「りんご・みかん・ぶどう」に置き換わっており、指示の本質から逸脱している。そのため、指示遵守の観点で大きく減点した。
2026-06-23 14:19 Owl Alpha 0.0 $0.0000 1.2s 指示された果物(リンゴ、バナナ、イチゴ)が出力されておらず、代わりに「りんご、みかん、ぶどう」が使われているためタスク未達成。また、文字数も誤っており、詩の内容も指示と無関係である。