evaluate_benchmark.py中的第111line~第113line,按照数据格式,if c["name"] not in criteria总是为false,修改为if c["name"] not in data["scores"]: 是不是更符合逻辑一点