日本語流暢性テスト

chat-jp-fluency-v1 · v1 · 言語: ja · サブカテゴリ: fluency · 難易度: d2

← 一覧に戻る

📋 評価基準

観点: 流暢さ / 具体性 / 条件遵守

制約: ですます, 具体例

📝 プロンプト

以下のトピックについて、自然な日本語で3段落の文章を書いてください。

トピック: 「休日の過ごし方について、私の趣味と最近の気づき」

条件:
- ですます調
- 具体例を1つ以上含める
- 全体で300〜400字程度

🏆 モデル別スコア

# モデル 平均 最良 最低 サンプル
1 DeepSeek: DeepSeek V4 Flash 95.0 95 95 4
2 Google: Gemma 4 31B (free) 95.0 95 95 2
3 OpenAI: gpt-oss-120b (free) 95.0 95 95 2
4 Owl Alpha 95.0 95 95 2

📜 ラン履歴 (最新30件)

実行日時 モデル スコア コスト 時間 判定
2026-06-24 14:41 DeepSeek: DeepSeek V4 Flash 95.0 $0.0001 0.0s このモデル出力は、休日の過ごし方について非常に流暢で自然な日本語で描写されており、評価基準の「流暢さ」「具体性」「条件遵守」をすべて満たしています。ですます調が一貫して使用され、具体的なエピソード(公園での読書、池の水面の描写)も豊富で、指示に完全に従っています。誤りや不適切な内容は一切なく、模範的な回答です。
2026-06-24 14:41 DeepSeek: DeepSeek V4 Flash 95.0 $0.0001 0.0s モデル出力は「ですます」調で統一され、具体例(公園の散歩、パン屋での体験)も豊富に含まれており、流暢かつ自然な日本語です。制約条件を完全に満たし、安全性や指示への追従も良好なため、ほぼ完璧な出力と評価します。
2026-06-24 14:21 DeepSeek: DeepSeek V4 Flash 95.0 $0.0002 0.0s モデル出力は「ですます」体を一貫して使用し、具体的なエピソード(先週末の散歩、スマートフォンを置く体験)を交えており、流暢で自然な日本語です。条件を完全に満たし、安全性にも問題はありません。
2026-06-24 14:21 DeepSeek: DeepSeek V4 Flash 95.0 $0.0001 0.0s モデル出力は「ですます」調で統一され、具体的な体験(公園の散歩、コーヒー、小説など)を交えながら休日の過ごし方を述べており、流暢さ・具体性・条件遵守のすべてを満たしている。ごく軽微な冗長さがあるが、ほぼ完璧な出力である。
2026-06-24 11:44 Google: Gemma 4 31B (free) 95.0 $0.0000 0.0s モデル出力は非常に流暢で自然な日本語であり、具体例(カフェでの読書、海外の古典文学、散歩の導入)も豊富に含まれています。また、「ですます」調が一貫して守られており、条件を完全に満たしています。安全性や有害性の問題もなく、ほぼ完璧な回答です。
2026-06-24 11:44 Google: Gemma 4 31B (free) 95.0 $0.0000 0.0s モデル出力は「ですます」調を一貫して使用し、読書やカフェでの時間、無為の時間など具体例を交えて休日の楽しみを生き生きと描写している。日本語として非常に流暢で、自然な表現が続いており、条件を完全に満たしている。内容も健全で有益である。
2026-06-24 09:29 Owl Alpha 95.0 $0.0000 0.0s タスクのカテゴリ「流暢さ」と設定された評価基準(流暢さ、具体性、条件遵守)をすべて高いレベルで満たしている。日本語として非常に自然で流暢であり、具体例(スパカレー作りやスマホを手放す気づき)も適切に含まれている。また、「ですます」調が一貫して守られ、不適切な内容もなく安全である。
2026-06-24 09:29 Owl Alpha 95.0 $0.0000 0.0s モデル出力は「ですます」調で統一され、具体例(地元カフェ、手作りケーキ、店主との会話)を交えながら流暢に記述されており、評価基準の「流暢さ」「具体性」「条件遵守」をすべて満たしている。事実誤認や不適切な内容もなく、指示に忠実で有用性が高い。
2026-06-24 08:19 OpenAI: gpt-oss-120b (free) 95.0 $0.0000 0.0s 日本語として非常に流暢で、休日の過ごし方に関する具体例(写真撮影のエピソード)が詳細に述べられています。「ですます」調の条件も守られており、指示に完全に追従しています。不適切な内容もなく、模範解答に近い完成度です。
2026-06-24 08:19 OpenAI: gpt-oss-120b (free) 95.0 $0.0000 0.0s モデル出力は「ですます」調で統一され、非常に流暢で自然な日本語です。休日の過ごし方について具体的な体験(水彩画、ヨガ)を交えながら、条件を満たした内容になっています。安全性や正確性にも問題はなく、ほぼ完璧な回答です。