关于Openfly-Agent-7b模型动作编码和训练的问题

论文作者您好，非常感谢您将代码开源！在经过一段时间复现后，我对您提出的Openfly-agent-7b模型在训练的动作编码上有一些疑问：您是将离散的8个动作编码成8维向量来进行训练，这在[Openfly-rlds数据集](https://huggingface.co/datasets/IPEC-COMMUNITY/OpenFly-rlds)中能印证

<img width="321" height="527" alt="Image" src="https://github.com/user-attachments/assets/a04b10b5-74b8-4c2d-8e47-6c68b0e41fab" />

但是，openfly-agent-7b也是在openvla-7b基础上微调成的，而openvla本身对action向量的每个维度都做256的分bin处理，所以我有点不太能理解您工作中数据集编码的原因。

然后就是想问作者有试过使用Lora将openvla微调成openfly？如果有的话是否方便开源呢

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于Openfly-Agent-7b模型动作编码和训练的问题 #90

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

关于Openfly-Agent-7b模型动作编码和训练的问题 #90

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions