We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
v3 13B exp4の学習率は2e-4だが、この設定ではspikyな挙動が誘発されている。 この挙動を引き起こさない最適な学習率の探索を行う。 各実験で30k-40k程度のstep学習を行い、各種統計量の比較を行う。 また異なる学習率スケジューリングについても実験を行う。
基本設定は #1 と同様とする。 学習率のみ下記に変更して実験する。 (実験設定は順次増やす)
sakura:/data/llm-jp-corpus/v3.{0,1}.0
sakura:/data/experiments/8
The text was updated successfully, but these errors were encountered:
#9 との兼ね合いで使用ノード数を調整。
Sorry, something went wrong.
No branches or pull requests
Overview
v3 13B exp4の学習率は2e-4だが、この設定ではspikyな挙動が誘発されている。
この挙動を引き起こさない最適な学習率の探索を行う。
各実験で30k-40k程度のstep学習を行い、各種統計量の比較を行う。
また異なる学習率スケジューリングについても実験を行う。
Details
基本設定は #1 と同様とする。
学習率のみ下記に変更して実験する。
(実験設定は順次増やす)
Resources
sakura:/data/llm-jp-corpus/v3.{0,1}.0
sakura:/data/experiments/8
The text was updated successfully, but these errors were encountered: