最終更新:2025-05-27 (火) 18:05:01 (53d)  

GPT-4.1
Top / GPT-4.1

2025/04/14

https://openai.com/index/gpt-4-1/

概要

  • コーディングと命令追跡において大幅な改善が見られ、GPT-4oおよびGPT-4o miniを全般的に上回る性能
  • 最大100万トークンのコンテキストをサポート

コーディング

  • GPT-4.1はSWE-bench Verifiedで 54.6% のスコアを獲得し、GPT-4oと比較して 21.4% の絶対値向上、GPT-4.5と比較して 26.6% の絶対値向上を実現しており、コーディングの主要モデルとなっています。

指示に従う

  • 指示に従う能力を測るベンチマークであるScaleのMultiChallenge?GPT-4.1のスコアは38.3%で、GPT-4oより10.5%の増加となりました。

2025/05/09