hustvl
/

mmMamba-linear

Image-Text-to-Text

feature-extraction

Model card Files Files and versions

HongyuanTao commited on Feb 26

Commit

1198b4c

·

verified ·

1 Parent(s): 975bc02

Update modeling_mmMamba.py

Files changed (1) hide show

modeling_mmMamba.py +4 -2

modeling_mmMamba.py CHANGED Viewed

@@ -421,7 +421,7 @@ class MHA_LM(nn.Module):
         ):
             if self.rotary_emb_dim > 0:
                 q, kv = self.rotary_emb(
-                    q, kv, seqlen_offset=seqlen_offset, max_seqlen=rotary_max_seqlen
                 )
             if inference_params is None:
                 k, v = kv.unbind(dim=-3)
@@ -550,7 +550,9 @@ class Mamba2_LM(nn.Module):
         conv_state, ssm_state = None, None
         if inference_params is not None:
             conv_state, ssm_state = self._get_states_from_cache(inference_params, batch)
         if use_cache and inference_params.seqlen_offset==0:
             vkq, new_conv_states = causal_conv1d_fn(
                 vkq.transpose(1, 2),

         ):
             if self.rotary_emb_dim > 0:
                 q, kv = self.rotary_emb(
+                    q, kv, seqlen_offset=seqlen_offset[:bsz,...], max_seqlen=rotary_max_seqlen
                 )
             if inference_params is None:
                 k, v = kv.unbind(dim=-3)
         conv_state, ssm_state = None, None
         if inference_params is not None:
             conv_state, ssm_state = self._get_states_from_cache(inference_params, batch)
+        conv_state = conv_state[:batch, ...]
+        ssm_state = ssm_state[:batch, ...]
         if use_cache and inference_params.seqlen_offset==0:
             vkq, new_conv_states = causal_conv1d_fn(
                 vkq.transpose(1, 2),