fix starcoder quantization bug (#159)

zhenwei-intel · VincyZhang · commit 4824186841da · 2023-12-20T14:00:58.000+08:00
Signed-off-by: zhenwei-intel &lt;zhenwei.liu@intel.com&gt;
diff --git a/graph/models/starcoder/starcoder_utils.cpp b/graph/models/starcoder/starcoder_utils.cpp
@@ -199,8 +199,7 @@ class starcoder_quant_layer : public quant_layer_base {
   virtual quant_params_internal get_layer_config(std::string layername, std::vector<int64_t> ne,
                                                  ne_type type) override {
     bool quantize = layername.rfind("w") == layername.size() - 1;  // ends with 'weight'?
-    if (layername == "model/wte") quantize = true;
-    if (layername == "model/lm_head") {
+    if (layername == "model/wte") {
       // special layer process, can be loaded by config file
       return quant_params_internal();  // return q4_0 to cover the usage of getrow
     }