fix bug at inference

Former-commit-id: df9b41af4401006b8040eb53c44dd290b604e0eb
2023-05-31 18:11:53 +08:00
parent a79df3500b
commit 1512711ca2
2 changed files with 8 additions and 8 deletions
--- a/src/cli_demo.py
+++ b/src/cli_demo.py
@@ -29,8 +29,8 @@ def main():
        return prompt

    def predict(query, history: list):
-        inputs = tokenizer([format_example(query)], return_tensors="pt")
-        inputs = inputs.to(model.device)
+        input_ids = tokenizer([format_example(query)], return_tensors="pt")["input_ids"]
+        input_ids = input_ids.to(model.device)
        gen_kwargs = {
            "do_sample": True,
            "top_p": 0.9,
@@ -41,8 +41,8 @@ def main():
            "repetition_penalty": 1.5
        }
        with torch.no_grad():
-            generation_output = model.generate(**inputs, **gen_kwargs)
-        outputs = generation_output.tolist()[0][len(inputs["input_ids"][0]):]
+            generation_output = model.generate(input_ids=input_ids, **gen_kwargs)
+        outputs = generation_output.tolist()[0][len(input_ids[0]):]
        response = tokenizer.decode(outputs, skip_special_tokens=True)
        history = history + [(query, response)]
        return response, history