フロンティアAIの「笑い」を、人間が裁くベンチマーク。
知性のベンチマークは各社が出している。
このグラフだけは、ここにしかない。
キーがあると起動時に最新モデル一覧を自動取得します。config.local.js(git除外)からも読み込み可。
全モデルから自由に選べます。同じ会社のモデル同士の対戦もOK(例: Opus vs Sonnet)。
採点中はどのモデルの回答か伏せられます(ブラインド・提示順ランダム)。全採点後に正体が判明します。
「結果フォルダを連携」で ippon-grand-prix/results/ を選ぶと、バトル結果JSONが自動保存され通算集計されます(Chrome/Edge)。
回答者の正体はラウンドの全採点後に判明します。