最終更新:2025-03-07 (金) 13:42:00 (12d)  

Stockmark-2-100B-Instruct-beta
Top / Stockmark-2-100B-Instruct-beta

https://stockmark-tech.hatenablog.com/entry/2025/03/06/114203

データセット

  • 全体で2兆トークン程度
  • 60%が英語、30%が日本語、10%がコード

事後学習

合成データ作成

関連