Skip to content

关于Openfly-Agent-7b模型动作编码和训练的问题 #90

@Noblezhong

Description

@Noblezhong

论文作者您好,非常感谢您将代码开源!在经过一段时间复现后,我对您提出的Openfly-agent-7b模型在训练的动作编码上有一些疑问:您是将离散的8个动作编码成8维向量来进行训练,这在Openfly-rlds数据集中能印证

Image

但是,openfly-agent-7b也是在openvla-7b基础上微调成的,而openvla本身对action向量的每个维度都做256的分bin处理,所以我有点不太能理解您工作中数据集编码的原因。

然后就是想问作者有试过使用Lora将openvla微调成openfly?如果有的话是否方便开源呢

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions