(add) customized bart model to modify patch_ids

graykode
Commit 2a254f026d95352bc575bc6f1e7026982db30a06 2a254f02 1 parent fff53766
Showing 5 changed files with 4 additions and 2 deletions
finetune.py
generation_utils.py
lightning_base.py
modeling_bart.py
modeling_utils.py
--- a/finetune.py
View file @2a254f0
+++ b/finetune.py
View file @2a254f0
@@ -188,8 +188,8 @@ class SummarizationModule(BaseTransformer):
         t0 = time.time()
         generated_ids = self.model.generate(
             batch[0].long(),
+            patch_ids=batch[2].long(),
             attention_mask=batch[1].long(),
-            # patch_ids=batch[2].long(),
             use_cache=True,
             decoder_start_token_id=self.decoder_start_token_id,
         )
--- a/generation_utils.py 0 → 100644
View file @2a254f0
+++ b/generation_utils.py 0 → 100644
View file @2a254f0
--- a/lightning_base.py
View file @2a254f0
+++ b/lightning_base.py
View file @2a254f0
@@ -21,6 +21,8 @@ from transformers import (
     PretrainedConfig,
     PreTrainedTokenizer,
 )
+from modeling_bart import BartForConditionalGeneration
+
 from transformers.optimization import (
     Adafactor,
     get_cosine_schedule_with_warmup,
@@ -40,7 +42,7 @@ MODEL_MODES = {
     "pretraining": AutoModelForPreTraining,
     "token-classification": AutoModelForTokenClassification,
     "language-modeling": AutoModelWithLMHead,
-    "summarization": AutoModelForSeq2SeqLM,
+    "summarization": BartForConditionalGeneration,
     "translation": AutoModelForSeq2SeqLM,
 }
--- a/modeling_bart.py 0 → 100644
View file @2a254f0
+++ b/modeling_bart.py 0 → 100644
View file @2a254f0
--- a/modeling_utils.py 0 → 100644
View file @2a254f0
+++ b/modeling_utils.py 0 → 100644
View file @2a254f0