分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

SmolLM3-3Bトレーニングから100+の中間チェックポイントとトレーニングログをリリースしました。メカ解釈、トレーニングダイナミクス、RLなどのトピックに取り組んでいる研究者の皆様のお役に立てば幸いです:) トレーニングログ: -> 通常のトレーニング損失(損失のギャップは混合液の変化によるもの)などgrad_norm。 -> レイヤー/ブロックごとのメトリック (l1/l2 ノルム、平均、最小、最大、尖度) チェックポイント： -40kステップごとに>事前トレーニング(94.4Bトークン) -4kステップごとに>長いコンテキスト拡張(9.4Bトークン) -トレーニング後>:SFT、トレーニング中、APOスープ、LCエキスパート

30.61K

トップ

ランキング

お気に入り

Trending onchain

Trending on X

Recent top fundings

Most notable