Skip to content

Latest commit

 

History

History
79 lines (66 loc) · 1.82 KB

dssm.md

File metadata and controls

79 lines (66 loc) · 1.82 KB

DSSM

简介

双塔召回模型,分为user塔和item塔。 注:使用时需指定user id和item id。 dssm

参考论文

DSSM.pdf

配置说明

model_config:{
  model_class: "DSSM"
  feature_groups: {
    group_name: 'user'
    feature_names: 'user_id'
    wide_deep:DEEP
    sequence_features: {
      group_name: "seq_fea"
      tf_summary: false
      allow_key_search: true
      seq_att_map: {
        key: "book_id"
        hist_seq: "book_id_seq"
      }
    }
  }
  feature_groups: {
    group_name: "item"
    feature_names: 'book_id'
    wide_deep:DEEP
  }
  dssm {
    user_tower {
      id: "user_id"
      dnn {
        hidden_units: [256, 128, 64, 32]
      }
    }
    item_tower {
      id: "book_id"
      dnn {
        hidden_units: [256, 128, 64, 32]
      }
    }
    l2_regularization: 1e-6
  }
  embedding_regularization: 5e-5
}
  • model_class: 'DSSM', 不需要修改
  • feature_groups: 需要两个feature_group: user和item, group name不能变
  • sequence_features: 配置序列特征
  • dssm: dssm相关的参数,必须配置user_tower和item_tower
  • user_tower/item_tower:
    • dnn: deep part的参数配置
      • hidden_units: dnn每一层的channel数目,即神经元的数目
    • id: 指定user_id/item_id列
  • simi_func: 向量相似度函数,包括[COSINE, INNER_PRODUCT, EUCLID],默认COSINE,建议使用INNER_PRODUCT
  • embedding_regularization: 对embedding部分加regularization,防止overfit

支持的metric_set包括:

  • auc
  • mean_absolute_error
  • accuracy

示例Config

dssm_on_books.config

效果评估

效果评估