AI IPPON Grand Prix — Owarai evaluations

Qualitative Evaluations

Owarai
evaluations

フロンティアAIの「笑い」を、人間が裁くベンチマーク。

知性のベンチマークは各社が出している。
このグラフだけは、ここにしかない。

① OpenRouter API キー

キーがあると起動時に最新モデル一覧を自動取得します。config.local.js（git除外）からも読み込み可。

全モデルから自由に選べます。同じ会社のモデル同士の対戦もOK（例: Opus vs Sonnet）。

出題モデル（お題の自動生成係・出場はしない）

ラウンド数

お題を自分で決める場合はここに（1行1お題・空欄なら出題モデルが生成）

採点中はどのモデルの回答か伏せられます（ブラインド・提示順ランダム）。全採点後に正体が判明します。

「結果フォルダを連携」で ippon-grand-prix/results/ を選ぶと、バトル結果JSONが自動保存され通算集計されます（Chrome/Edge）。

お題 / Prompt

…

回答者の正体はラウンドの全採点後に判明します。

Owarai evaluations

優勝

Cumulative owarai benchmark