metadata
tags:
- deprecated
โ ๏ธ DEPRECATED โ v1 (text LM loss, ์๋ชป๋ SFT ๋ฐฉ์)
์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ง ๋ง์ธ์. labels=input_ids๋ก ํ ์คํธ ์ ์ฒด์ LM loss๋ฅผ ์ ์ฉํ์ฌ ์ก์ ํ ํฐ์ ํ์ตํ์ง ๋ชปํ์ต๋๋ค.
์ฌ๋ฐ๋ฅธ v2 ๋ชจ๋ธ ์ฌ์ฉ:
- pick&place: madokalif/so101-openvla-sft-v2-pickplace
- stacking: madokalif/so101-openvla-sft-v2-stacking (์์ )
- transfer-cube: madokalif/so101-openvla-sft-v2-transfer-cube (์์ )
v1 vs v2 ์ฐจ์ด
| v1 (์ด ๋ชจ๋ธ) | v2 (์ฌ์ฉํด์ผ ํจ) | |
|---|---|---|
| Loss ๋ฐฉ์ | text LM loss | action token CE loss |
| LoRA rank | 16 | 32 |
| LoRA alpha | 32 | 16 |
| ํ์ต ๋์ | ํ ์คํธ ํ๋กฌํํธ | ๋ก๋ด ์ก์ ํ ํฐ (256 bins) |