最終更新:2025-03-07 (金) 14:36:35 (13d)  

LLM/モデル/ベンチマーク/日本語

Japanese MT-Bench

ELYZA-tasks-100

JGLUE

JCommonsenseQA?

JSQuAD?

JHumanEval

関連

参考