Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SFT数据问题 #22

Open
SlamDunk-ycw opened this issue Jan 10, 2025 · 7 comments
Open

SFT数据问题 #22

SlamDunk-ycw opened this issue Jan 10, 2025 · 7 comments
Assignees

Comments

@SlamDunk-ycw
Copy link

非常nice的一个工作,但是我还有几个问题想咨询一下:

  1. SFT 中人工标记的数据集的数据格式
  2. Conversion of Agent Datasets 这一步的作用或者目的是什么?
@zRzRzRzRzRzRzR zRzRzRzRzRzRzR self-assigned this Jan 11, 2025
@zRzRzRzRzRzRzR
Copy link
Member

我们在finetune 文件夹下带有多轮微调的格式说明,你是否能对readme中的说明进行提问呢,我们希望知道你对具体文档的疑问~。
感谢理解

@SlamDunk-ycw
Copy link
Author

非常抱歉占用你的宝贵时间,非常抱歉我没能精确的表述我的问题。在你们的论文中,用的Fine-Tuning Data数据中提到了用到人工标注的数据,如buttons、Three clickable areas、Two questions extracting information from the image等等,我想请问一下这部分的数据格式有更详细的说明吗?另外,我发现在其他issue里面你们提到最近有些follow的工作有开源相应的pre-training和Fine-Tuning的数据集,请问有相关的具体推荐吗?

@SlamDunk-ycw
Copy link
Author

你好,非常抱歉再次打扰到你,请问有最新的消息了吗 ?

@zRzRzRzRzRzRzR
Copy link
Member

zRzRzRzRzRzRzR commented Jan 24, 2025

我们的文档在这个位置
https://zhipu-ai.feishu.cn/wiki/SEyzwhgl3ihx7ykh7JScYTLmnXb
这里是关于如何做数据集的地方。
关于开源数据集,@jasonnoy能查看一下吗

@leeaction
Copy link

@jasonnoy

我看了制作微调数据的文档,我有一个疑问 就是如果想微调单步的操作, 是不是就可以直接制作包含一个messages对象json文件就可以?

还有就是如果微调的是一个手机应用,比如想点击一个用户头像,但是点击完用户头像以后,会跳转到用户的个人资料页,那这个历史步骤改怎么写? 因为已经是一个新页面,前序操作的UI元素都在新页面不存在了? 请问有相关的微调数据的实例吗 非常感谢

@zRzRzRzRzRzRzR
Copy link
Member

  1. 这种可以做成多条数据。
    {数据一: 第一个UI,第一个需求,第一个模型操作}
    {数据二: 第二个UI,第一个需求,第一个模型操作,第二个需求(或者还是第一个需求,因为这只是执行到了第二部),第二个模型操作}
    ...

请注意,上述的表述方式的具体实现要参考我发的文档中的格式

@leeaction
Copy link

是否可以提供一个最小可跑通的微调数据示例 包括训练集和验证集.... 在尝试微调过程中,好多时候无法确定数据整体格式是否正确,导致训练时解析验证集出现错误。。。

期待可以提供一个实例,可以按照示例数据来调整数据集的格式。。。

谢谢

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants