perplexity : only tokenize selected tasks for Winogrande

2024-01-19 10:38:50 +02:00 · 2024-01-19 10:38:50 +02:00 · 9e4ad80cfc
commit 9e4ad80cfc
parent bb58b0e76f
1 changed files with 23 additions and 21 deletions
--- a/examples/perplexity/perplexity.cpp
+++ b/examples/perplexity/perplexity.cpp
@ -838,6 +838,29 @@ static void winogrande_score(llama_context * ctx, const gpt_params & params) {
        return;
    }
    fprintf(stderr, "%s : loaded %zu tasks from prompt.\n", __func__, data.size());
    if (params.winogrande_tasks > 0 && params.winogrande_tasks < data.size()) {
        fprintf(stderr, "%s : selecting %zu random tasks\n", __func__, params.winogrande_tasks);
        std::mt19937 rng(1);
        std::vector<int> aux(data.size());
        for (int i = 0; i < int(data.size()); ++i) {
            aux[i] = i;
        }
        float scale = 1/(1.f + (float)rng.max());
        std::vector<winogrande_entry> selected;
        selected.resize(params.winogrande_tasks);
        for (int i = 0; i < int(params.winogrande_tasks); ++i) {
            int j = int(scale*rng()*aux.size());
            selected[i] = std::move(data[aux[j]]);
            aux[j] = aux.back();
            aux.pop_back();
        }
        data = std::move(selected);
    }
    fprintf(stderr, "%s : tokenizing selected tasks\n", __func__);
    // This is needed as usual for LLaMA models
    const bool add_bos = llama_should_add_bos_token(llama_get_model(ctx));
@ -861,27 +884,6 @@ static void winogrande_score(llama_context * ctx, const gpt_params & params) {
        task.n_base2 = ::llama_tokenize(ctx, task.first + task.choices[1], add_bos).size();
    }
    fprintf(stderr, "%s : loaded %zu tasks from prompt.\n", __func__, data.size());
    if (params.winogrande_tasks > 0 && params.winogrande_tasks < data.size()) {
        fprintf(stderr, "%s : selecting %zu random tasks\n", __func__, params.winogrande_tasks);
        std::mt19937 rng(1);
        std::vector<int> aux(data.size());
        for (int i = 0; i < int(data.size()); ++i) {
            aux[i] = i;
        }
        float scale = 1/(1.f + (float)rng.max());
        std::vector<winogrande_entry> selected;
        selected.resize(params.winogrande_tasks);
        for (int i = 0; i < int(params.winogrande_tasks); ++i) {
            int j = int(scale*rng()*aux.size());
            selected[i] = std::move(data[aux[j]]);
            aux[j] = aux.back();
            aux.pop_back();
        }
        data = std::move(selected);
    }
    fprintf(stderr, "%s : calculating winogrande score over selected tasks.\n", __func__);
    const int n_vocab = llama_n_vocab(llama_get_model(ctx));