掘り出し物LLMを、
数値で見つける。

OpenRouter上のマイナー寄りモデルを、日本語タスクで継続ベンチマーク。スコア・コスト・速度を可視化して、本命と掘り出し物をデータで比較できます。

検証済みモデル

1

ベンチタスク

15

実行ラン

14

累計コスト

$0.00

🏆 チャット性能ランキング TOP 5

#	モデル	プロバイダ	スコア	サンプル	累計コスト	入力単価
1	Owl Alpha	openrouter	72.9	14	$0.0000	$0.00/M

全モデルを見る →

💰 コストパフォ散布図

横軸: 累計コスト($) / 縦軸: スコア。右上のモデルが「安くて高性能」

📝 最新の検証記事

note / X での発信は /publications にまとめてあります。