last tokens fixes

2023-06-01 13:18:12 +03:00 · 2023-06-01 13:18:12 +03:00 · 8c6a5fc92b
commit 8c6a5fc92b
parent f7882e2d69
1 changed files with 6 additions and 5 deletions
--- a/examples/server/server.cpp
+++ b/examples/server/server.cpp
@ -88,7 +88,6 @@ struct llama_server_context
    n_remain = 0;
    n_past = 0;
    n_consumed = 0;
-    last_n_tokens.clear();
  }

  bool loadModel(const gpt_params &params_)
@ -120,7 +119,12 @@ struct llama_server_context
      const int n_left = (params.n_ctx - params.n_keep)/2;
      std::vector<llama_token> new_tokens(prompt_tokens.begin(), prompt_tokens.begin() + params.n_keep);
      new_tokens.insert(new_tokens.end(), prompt_tokens.end() - n_left, prompt_tokens.end());
+      std::copy(prompt_tokens.end() - params.n_ctx, prompt_tokens.end(), last_n_tokens.begin());
      prompt_tokens = new_tokens;
+    } else {
+      size_t ps = prompt_tokens.size();
+      std::fill(last_n_tokens.begin(), last_n_tokens.end() - ps, 0);
+      std::copy(prompt_tokens.begin(), prompt_tokens.end(), last_n_tokens.end() - ps);
    }

    // compare the evaluated prompt with the new prompt
@ -251,10 +255,7 @@ struct llama_server_context
          id = llama_sample_token(ctx, &candidates_p);
        }
      }
-      if (!last_n_tokens.empty())
-      {
-          last_n_tokens.erase(last_n_tokens.begin());
-      }
+      last_n_tokens.erase(last_n_tokens.begin());
      last_n_tokens.push_back(id);
      num_tokens_predicted++;
    }