trim partial stopping strings when not streaming

2023-06-02 08:14:28 -03:00 · 2023-06-02 08:14:28 -03:00 · 8f9e546b51
commit 8f9e546b51
parent bebea657cb
1 changed files with 12 additions and 6 deletions
--- a/examples/server/server.cpp
+++ b/examples/server/server.cpp
@ -761,16 +761,22 @@ int main(int argc, char **argv)
      llama.beginCompletion();

      if (!llama.stream) {
+          size_t stop_pos = std::string::npos;
+
          while (llama.has_next_token) {
              const std::string token_text = llama.doCompletion();
-              const size_t stop_pos = llama.findStoppingStrings(
-                  llama.generated_text, token_text.size(), STOP_FULL);

+              stop_pos = llama.findStoppingStrings(llama.generated_text,
+                                                   token_text.size(), STOP_FULL);
+          }
+
+          if (stop_pos == std::string::npos) {
+              stop_pos = llama.findStoppingStrings(llama.generated_text, 0, STOP_PARTIAL);
+          }
          if (stop_pos != std::string::npos) {
              llama.generated_text.erase(llama.generated_text.begin() + stop_pos,
                                         llama.generated_text.end());
          }
-          }

          json data = {{"content", llama.generated_text},
                       {"stop", true},