Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[v3-172B-exp2] - 172Bの継続事前学習 (Sakura) #14

Closed
k141303 opened this issue Aug 7, 2024 · 0 comments
Closed

[v3-172B-exp2] - 172Bの継続事前学習 (Sakura) #14

k141303 opened this issue Aug 7, 2024 · 0 comments

Comments

@k141303
Copy link

k141303 commented Aug 7, 2024

Overview

172B-exp2の事前学習をgcpからsakuraへ引っ越し。
Fused Attentionを使用して学習を行います。
動かない場合は、こちらは中止し #9 の実験に切り替えます。
→学習が低速になる問題が発生したため、#9 の実験に切り替えました。

Details

モデルカードPR: https://github.com/llm-jp/model-cards/pull/13
#1 と同等の環境で動作確認を行います。

Resources

  • 計算機
    • クラスタ: Sakura (Ishikari)
    • ノード種別: gpu (H100x8)
    • ノード台数: 64
  • 環境構築
  • コード
  • 入力データ:
    • LLM-jp v3.1 コーパス: sakura:/data/llm-jp-corpus/v3.{0,1}.0
  • 出力データ:
    • なし
  • W&B ログ:
  • 開始日: 2024-08-08 13時
  • 終了予定日: 2024-12? FIXME
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant