--- tags: - deprecated --- # ⚠️ DEPRECATED — v1 (text LM loss, 잘못된 SFT 방식) 이 모델은 **사용하지 마세요**. labels=input_ids로 텍스트 전체에 LM loss를 적용하여 액션 토큰을 학습하지 못했습니다. ## 올바른 v2 모델 사용: - **pick&place**: [madokalif/so101-openvla-sft-v2-pickplace](https://huggingface.co/madokalif/so101-openvla-sft-v2-pickplace) - **stacking**: madokalif/so101-openvla-sft-v2-stacking (예정) - **transfer-cube**: madokalif/so101-openvla-sft-v2-transfer-cube (예정) ## v1 vs v2 차이 | | v1 (이 모델) | v2 (사용해야 함) | |---|---|---| | Loss 방식 | text LM loss | **action token CE loss** | | LoRA rank | 16 | **32** | | LoRA alpha | 32 | **16** | | 학습 대상 | 텍스트 프롬프트 | **로봇 액션 토큰 (256 bins)** |