---
tags:
  - deprecated
---

# ⚠️ DEPRECATED — v1 (text LM loss, 잘못된 SFT 방식)

이 모델은 **사용하지 마세요**. labels=input_ids로 텍스트 전체에 LM loss를 적용하여 액션 토큰을 학습하지 못했습니다.

## 올바른 v2 모델 사용:
- **pick&place**: [madokalif/so101-openvla-sft-v2-pickplace](https://huggingface.co/madokalif/so101-openvla-sft-v2-pickplace)
- **stacking**: madokalif/so101-openvla-sft-v2-stacking (예정)
- **transfer-cube**: madokalif/so101-openvla-sft-v2-transfer-cube (예정)

## v1 vs v2 차이
| | v1 (이 모델) | v2 (사용해야 함) |
|---|---|---|
| Loss 방식 | text LM loss | **action token CE loss** |
| LoRA rank | 16 | **32** |
| LoRA alpha | 32 | **16** |
| 학습 대상 | 텍스트 프롬프트 | **로봇 액션 토큰 (256 bins)** |