我在微调 Qwen2-VL-7B-instruct 时遇到了问题,显示len(videos)
is less than the number of tokens.
#6421
Labels
pending
This problem is yet to be addressed
我在自定义微调数据集上遇到问题
这是我的 dataset_info.json 的配置信息
其他数据集如 alpaca-gpt4-data-zh 数据集加载正常,但加载此数据集存在问题
这是我所遇到的错误信息
但我的数据中只有 IMAGE,没有视频信息
我尝试设置环境变量为
但我在尝试任何东西时都没有成功
我猜是因为数据集格式是 parquet 格式,但我不确定,这是我第一次在没有经验的情况下微调大型多模态模型
我不知道如何正确处理这类数据,我看到的所有教程都是 json 格式,但这个是 parquet 格式
The text was updated successfully, but these errors were encountered: