convert : use a string for the SentencePiece tokenizer path

2024-05-01 13:07:10 -04:00 · 2024-05-01 13:07:10 -04:00 · dcd8dfa1b5
commit dcd8dfa1b5
parent 3870164f47
1 changed files with 1 additions and 1 deletions
--- a/convert.py
+++ b/convert.py
@ -463,7 +463,7 @@ class SentencePieceVocab(Vocab):
            raise FileNotFoundError('Cannot find tokenizer.model')
        self.sentencepiece_tokenizer = SentencePieceProcessor()
-        self.sentencepiece_tokenizer.LoadFromFile(fname_tokenizer)
+        self.sentencepiece_tokenizer.LoadFromFile(str(fname_tokenizer))
        vocab_size = self.sentencepiece_tokenizer.vocab_size()
        new_tokens       = {id: piece for piece, id in added_tokens.items() if id >= vocab_size}