论文作者您好,非常感谢您将代码开源!在经过一段时间复现后,我对您提出的Openfly-agent-7b模型在训练的动作编码上有一些疑问:您是将离散的8个动作编码成8维向量来进行训练,这在Openfly-rlds数据集中能印证
但是,openfly-agent-7b也是在openvla-7b基础上微调成的,而openvla本身对action向量的每个维度都做256的分bin处理,所以我有点不太能理解您工作中数据集编码的原因。
然后就是想问作者有试过使用Lora将openvla微调成openfly?如果有的话是否方便开源呢
论文作者您好,非常感谢您将代码开源!在经过一段时间复现后,我对您提出的Openfly-agent-7b模型在训练的动作编码上有一些疑问:您是将离散的8个动作编码成8维向量来进行训练,这在Openfly-rlds数据集中能印证
但是,openfly-agent-7b也是在openvla-7b基础上微调成的,而openvla本身对action向量的每个维度都做256的分bin处理,所以我有点不太能理解您工作中数据集编码的原因。
然后就是想问作者有试过使用Lora将openvla微调成openfly?如果有的话是否方便开源呢