PolarGrad (Polar Gradient methods; Lau et al., 2025) is a class of matrix-gradient optimizers based on the concept of gradient-anisotropy preconditioning in optimization. It has close relation to Muon ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する