diff --git a/examples/speculative/speculative.cpp b/examples/speculative/speculative.cpp
index 209fbe1d0..e6623ff00 100644
--- a/examples/speculative/speculative.cpp
+++ b/examples/speculative/speculative.cpp
@@ -208,12 +208,11 @@ int main(int argc, char ** argv) {
                 bool accept = false;
                 if (params.sparams.temp > 0) {
                     // stochastic verification
-                
-                    llama_token_data_array dist_tgt = llama_sampling_probability_distribution(ctx_sampling, ctx_tgt, NULL, drafts[s_keep].i_batch_tgt[i_dft]);
-                    
-                    float p_tgt, p_dft;
-                    // GGML_ASSERT(dist_tgt.size() == dist_dft.size());
 
+                    llama_token_data_array dist_tgt = llama_sampling_probability_distribution(ctx_sampling, ctx_tgt, NULL, drafts[s_keep].i_batch_tgt[i_dft]);
+                    float p_tgt, p_dft;
+
+                    // GGML_ASSERT(dist_tgt.size() == dist_dft.size());
                     for (int s = 0; s < n_seq_dft; ++s) {
                         if (!drafts[s].active) {
                             continue;
@@ -234,7 +233,6 @@ int main(int argc, char ** argv) {
                         llama_token_data_array dist_dft = drafts[s].dist[i_dft];
                         // acquire the probability of the token from the draft model
                         for (int i = 0; i < dist_tgt.size; i++) {
-    
                             if (dist_tgt.data[i].id == drafts[s].tokens[i_dft]) {
                                 p_tgt = dist_tgt.data[i].p;
                             }
@@ -258,7 +256,7 @@ int main(int argc, char ** argv) {
                         } else {
                             LOG("draft token %d of sequence %d (%d, '%s') rejected\n", i_dft, s, drafts[s].tokens[i_dft], llama_token_to_piece(ctx_tgt, drafts[s].tokens[i_dft]).c_str());
                             drafts[s].active = false;
-                            
+
                             // calculate residual probability
                             GGML_ASSERT(dist_tgt.sorted);
                             GGML_ASSERT(dist_dft.sorted);