Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[EVAL REQUEST] BAAI/bge-m3 #83

Open
1 of 16 tasks
cross32768 opened this issue Oct 8, 2024 · 0 comments
Open
1 of 16 tasks

[EVAL REQUEST] BAAI/bge-m3 #83

cross32768 opened this issue Oct 8, 2024 · 0 comments

Comments

@cross32768
Copy link

https://huggingface.co/BAAI/bge-m3 は、論文 によればmultilingual-e5-largeよりも性能が良く、日本語にも対応しているmultilingualモデルですが、今の所JMTEBのような包括的な日本語ベンチマークでの評価はなされていないように見えます。お時間がありましたら、ぜひ評価を回してleaderboardに追加してみていただけないでしょうか。

モデルの基本情報

name: BAAI/bge-m3
type:
size:
lang: multilingual

モデル詳細

https://huggingface.co/BAAI/bge-m3

seen/unseen申告

JMTEBの評価データセットの中,training splitをモデル学習に使用した,またはvalidation setとして,ハイパラチューニングやearly stoppingに使用したデータセット名をチェックしてください。

(一応論文を参考につけています。日本語wikipediaは入っているようですが、JAQKETなどを直接使ってはいなさそうです。Mr.Tydiはmultilingualを使っていそうなので、日本語も入っていそうです)

  • Classification
    • Amazon Review Classification
    • Amazon Counterfactual Classification
    • Massive Intent Classification
    • Massive Scenario Classification
  • Clustering
    • Livedoor News
    • MewsC-16-ja
  • STS
    • JSTS
    • JSICK
  • Pair Classification
    • PAWS-X-ja
  • Retrieval
    • JAQKET
    • Mr.TyDi-ja
    • JaGovFaqs-22k
    • NLP Journal title-abs
    • NLP Journal title-intro
    • NLP Journal abs-intro
  • Reranking
    • Esci
  • [] 申告しません

評価スクリプト

その他の情報

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant