Record sampling time in llama_sample_classifier_free_guidance

2023-07-08 00:07:49 +08:00 · 2023-07-08 00:07:49 +08:00 · 8e66e59cdd
commit 8e66e59cdd
parent 66eb048470
1 changed files with 6 additions and 0 deletions
--- a/llama.cpp
+++ b/llama.cpp
@ -2163,6 +2163,8 @@ void llama_sample_classifier_free_guidance(
          struct llama_context * guidance_ctx,
                         float   scale,
                         float   smooth_factor) {
+    int64_t t_start_sample_us = t_start_sample_us = ggml_time_us();
+
    assert(ctx);
    auto n_vocab = llama_n_vocab(ctx);
    assert(n_vocab == (int)candidates->size);
@ -2195,6 +2197,10 @@ void llama_sample_classifier_free_guidance(

        candidates->data[i].logit = smooth_factor * guidance_logit + (1.f - smooth_factor) * base_logit;
    }
+
+    if (ctx) {
+        ctx->t_sample_us += ggml_time_us() - t_start_sample_us;
+    }
 }

 llama_token llama_sample_token_mirostat(struct llama_context * ctx, llama_token_data_array * candidates, float tau, float eta, int m, float * mu) {