[feature] add refcoco/+/g base64 support

zhongzhouTan-coder · zhongzhouTan-coder · commit b2f1baccb13c · 2026-03-19T19:20:11.000+08:00
diff --git a/ais_bench/benchmark/configs/datasets/refcoco/refcoco_gen.py b/ais_bench/benchmark/configs/datasets/refcoco/refcoco_gen.py
@@ -33,21 +33,21 @@
 )
 
 _splits = [
-    ('RefCOCO_val', 'val'),
-    ('RefCOCO_test', 'test'),
-    ('RefCOCO_testA', 'testA'),
-    ('RefCOCO_testB', 'testB'),
+    'val',
+    'test',
+    'testA',
+    'testB',
 ]
 
 refcoco_datasets = [
     dict(
-        abbr=abbr,
+        abbr='RefCOCO_' + split,
         type=RefCOCODataset,
         path='ais_bench/datasets/RefCOCO/data',
         split=split,
         reader_cfg=refcoco_reader_cfg,
         infer_cfg=refcoco_infer_cfg,
         eval_cfg=refcoco_eval_cfg,
     )
-    for abbr, split in _splits
+    for split in _splits
 ]
diff --git a/ais_bench/benchmark/configs/datasets/refcoco/refcoco_gen_base64.py b/ais_bench/benchmark/configs/datasets/refcoco/refcoco_gen_base64.py
@@ -0,0 +1,54 @@
+from ais_bench.benchmark.openicl.icl_retriever import ZeroRetriever
+from ais_bench.benchmark.openicl.icl_inferencer import GenInferencer
+from ais_bench.benchmark.openicl.icl_prompt_template import MMPromptTemplate
+from ais_bench.benchmark.datasets import RefCOCODataset
+from ais_bench.benchmark.datasets.refcoco import IMAGE_BASE64_TYPE, refcoco_bbox_postprocess
+from ais_bench.benchmark.openicl.icl_evaluator import BBoxIoUEvaluator
+
+
+refcoco_reader_cfg = dict(
+    input_columns=['question', 'image'],
+    output_column='answer'
+)
+
+refcoco_infer_cfg = dict(
+    prompt_template=dict(
+        type=MMPromptTemplate,
+        template=dict(
+            round=[
+                dict(role='HUMAN', prompt_mm={
+                    'text': {'type': 'text', 'text': '{question}'},
+                    'image': {'type': 'image_url', 'image_url': {'url': 'data:image/jpeg;base64,{image}'}},
+                })
+            ]
+        )
+    ),
+    retriever=dict(type=ZeroRetriever),
+    inferencer=dict(type=GenInferencer),
+)
+
+refcoco_eval_cfg = dict(
+    evaluator=dict(type=BBoxIoUEvaluator, iou_threshold=0.5, coord_scale=1000.0),
+    pred_postprocessor=dict(type=refcoco_bbox_postprocess),
+)
+
+_splits = [
+    'val',
+    'test',
+    'testA',
+    'testB',
+]
+
+refcoco_datasets = [
+    dict(
+        abbr='RefCOCO_base64_' + split,
+        type=RefCOCODataset,
+        path='ais_bench/datasets/RefCOCO/data',
+        split=split,
+        image_type=IMAGE_BASE64_TYPE,
+        reader_cfg=refcoco_reader_cfg,
+        infer_cfg=refcoco_infer_cfg,
+        eval_cfg=refcoco_eval_cfg,
+    )
+    for split in _splits
+]
diff --git a/ais_bench/benchmark/configs/datasets/refcoco_plus/refcoco_plus_gen.py b/ais_bench/benchmark/configs/datasets/refcoco_plus/refcoco_plus_gen.py
@@ -7,7 +7,7 @@
 
 
 refcoco_plus_reader_cfg = dict(
-    input_columns=['content'],
+    input_columns=['question', 'image'],
     output_column='answer'
 )
 
@@ -33,20 +33,20 @@
 )
 
 _splits = [
-    ('RefCOCOPlus_val', 'val'),
-    ('RefCOCOPlus_testA', 'testA'),
-    ('RefCOCOPlus_testB', 'testB'),
+    'val',
+    'testA',
+    'testB',
 ]
 
 refcoco_plus_datasets = [
     dict(
-        abbr=abbr,
+        abbr='RefCOCOPlus_' + split,
         type=RefCOCOPlusDataset,
         path='ais_bench/datasets/RefCOCOplus/data',
         split=split,
         reader_cfg=refcoco_plus_reader_cfg,
         infer_cfg=refcoco_plus_infer_cfg,
         eval_cfg=refcoco_plus_eval_cfg,
     )
-    for abbr, split in _splits
+    for split in _splits
 ]
diff --git a/ais_bench/benchmark/configs/datasets/refcoco_plus/refcoco_plus_gen_base64.py b/ais_bench/benchmark/configs/datasets/refcoco_plus/refcoco_plus_gen_base64.py
@@ -0,0 +1,53 @@
+from ais_bench.benchmark.openicl.icl_retriever import ZeroRetriever
+from ais_bench.benchmark.openicl.icl_inferencer import GenInferencer
+from ais_bench.benchmark.openicl.icl_prompt_template import MMPromptTemplate
+from ais_bench.benchmark.datasets import RefCOCOPlusDataset
+from ais_bench.benchmark.datasets.refcoco import IMAGE_BASE64_TYPE, refcoco_bbox_postprocess
+from ais_bench.benchmark.openicl.icl_evaluator import BBoxIoUEvaluator
+
+
+refcoco_plus_reader_cfg = dict(
+    input_columns=['question', 'image'],
+    output_column='answer'
+)
+
+refcoco_plus_infer_cfg = dict(
+    prompt_template=dict(
+        type=MMPromptTemplate,
+        template=dict(
+            round=[
+                dict(role='HUMAN', prompt_mm={
+                    'text': {'type': 'text', 'text': '{question}'},
+                    'image': {'type': 'image_url', 'image_url': {'url': 'data:image/jpeg;base64,{image}'}},
+                })
+            ]
+        )
+    ),
+    retriever=dict(type=ZeroRetriever),
+    inferencer=dict(type=GenInferencer),
+)
+
+refcoco_plus_eval_cfg = dict(
+    evaluator=dict(type=BBoxIoUEvaluator, iou_threshold=0.5, coord_scale=1000.0),
+    pred_postprocessor=dict(type=refcoco_bbox_postprocess),
+)
+
+_splits = [
+    'val',
+    'testA',
+    'testB',
+]
+
+refcoco_plus_datasets = [
+    dict(
+        abbr='RefCOCOPlus_base64_' + split,
+        type=RefCOCOPlusDataset,
+        path='ais_bench/datasets/RefCOCOplus/data',
+        split=split,
+        image_type=IMAGE_BASE64_TYPE,
+        reader_cfg=refcoco_plus_reader_cfg,
+        infer_cfg=refcoco_plus_infer_cfg,
+        eval_cfg=refcoco_plus_eval_cfg,
+    )
+    for split in _splits
+]
diff --git a/ais_bench/benchmark/configs/datasets/refcocog/refcocog_gen.py b/ais_bench/benchmark/configs/datasets/refcocog/refcocog_gen.py
@@ -7,7 +7,7 @@
 
 
 refcocog_reader_cfg = dict(
-    input_columns=['content'],
+    input_columns=['question', 'image'],
     output_column='answer'
 )
 
@@ -33,19 +33,19 @@
 )
 
 _splits = [
-    ('RefCOCOg_val', 'val'),
-    ('RefCOCOg_test', 'test'),
+    'val',
+    'test',
 ]
 
 refcocog_datasets = [
     dict(
-        abbr=abbr,
+        abbr='RefCOCOg_' + split,
         type=RefCOCOgDataset,
         path='ais_bench/datasets/RefCOCOg/data',
         split=split,
         reader_cfg=refcocog_reader_cfg,
         infer_cfg=refcocog_infer_cfg,
         eval_cfg=refcocog_eval_cfg,
     )
-    for abbr, split in _splits
+    for split in _splits
 ]
diff --git a/ais_bench/benchmark/configs/datasets/refcocog/refcocog_gen_base64.py b/ais_bench/benchmark/configs/datasets/refcocog/refcocog_gen_base64.py
@@ -0,0 +1,52 @@
+from ais_bench.benchmark.openicl.icl_retriever import ZeroRetriever
+from ais_bench.benchmark.openicl.icl_inferencer import GenInferencer
+from ais_bench.benchmark.openicl.icl_prompt_template import MMPromptTemplate
+from ais_bench.benchmark.datasets import RefCOCOgDataset
+from ais_bench.benchmark.datasets.refcoco import IMAGE_BASE64_TYPE, refcoco_bbox_postprocess
+from ais_bench.benchmark.openicl.icl_evaluator import BBoxIoUEvaluator
+
+
+refcocog_reader_cfg = dict(
+    input_columns=['question', 'image'],
+    output_column='answer'
+)
+
+refcocog_infer_cfg = dict(
+    prompt_template=dict(
+        type=MMPromptTemplate,
+        template=dict(
+            round=[
+                dict(role='HUMAN', prompt_mm={
+                    'text': {'type': 'text', 'text': '{question}'},
+                    'image': {'type': 'image_url', 'image_url': {'url': 'data:image/jpeg;base64,{image}'}},
+                })
+            ]
+        )
+    ),
+    retriever=dict(type=ZeroRetriever),
+    inferencer=dict(type=GenInferencer),
+)
+
+refcocog_eval_cfg = dict(
+    evaluator=dict(type=BBoxIoUEvaluator, iou_threshold=0.5, coord_scale=1000.0),
+    pred_postprocessor=dict(type=refcoco_bbox_postprocess),
+)
+
+_splits = [
+    'val',
+    'test',
+]
+
+refcocog_datasets = [
+    dict(
+        abbr='RefCOCOg_base64_' + split,
+        type=RefCOCOgDataset,
+        path='ais_bench/datasets/RefCOCOg/data',
+        split=split,
+        image_type=IMAGE_BASE64_TYPE,
+        reader_cfg=refcocog_reader_cfg,
+        infer_cfg=refcocog_infer_cfg,
+        eval_cfg=refcocog_eval_cfg,
+    )
+    for split in _splits
+]
diff --git a/ais_bench/benchmark/datasets/refcoco/__init__.py b/ais_bench/benchmark/datasets/refcoco/__init__.py
@@ -1,3 +1,9 @@
-from ais_bench.benchmark.datasets.refcoco.refcoco import RefCOCODataset, refcoco_bbox_postprocess  # noqa: F401
+from ais_bench.benchmark.datasets.refcoco.refcoco import (  # noqa: F401
+    IMAGE_BASE64_TYPE,
+    IMAGE_PATH_TYPE,
+    TEMP_IMAGE_STORE_DIR,
+    RefCOCODataset,
+    refcoco_bbox_postprocess,
+)
 from ais_bench.benchmark.datasets.refcoco.refcoco_g import RefCOCOgDataset  # noqa: F401
 from ais_bench.benchmark.datasets.refcoco.refcoco_plus import RefCOCOPlusDataset  # noqa: F401
diff --git a/ais_bench/benchmark/datasets/refcoco/refcoco.py b/ais_bench/benchmark/datasets/refcoco/refcoco.py

Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,7 @@`
`7`	`7`
`8`	`8`
`9`	`9`	`refcoco_plus_reader_cfg = dict(`
`10`		`- input_columns=['content'],`
	`10`	`+ input_columns=['question', 'image'],`
`11`	`11`	`output_column='answer'`
`12`	`12`	`)`
`13`	`13`
`@@ -33,20 +33,20 @@`
`33`	`33`	`)`
`34`	`34`
`35`	`35`	`_splits = [`
`36`		`- ('RefCOCOPlus_val', 'val'),`
`37`		`- ('RefCOCOPlus_testA', 'testA'),`
`38`		`- ('RefCOCOPlus_testB', 'testB'),`
	`36`	`+ 'val',`
	`37`	`+ 'testA',`
	`38`	`+ 'testB',`
`39`	`39`	`]`
`40`	`40`
`41`	`41`	`refcoco_plus_datasets = [`
`42`	`42`	`dict(`
`43`		`- abbr=abbr,`
	`43`	`+ abbr='RefCOCOPlus_' + split,`
`44`	`44`	`type=RefCOCOPlusDataset,`
`45`	`45`	`path='ais_bench/datasets/RefCOCOplus/data',`
`46`	`46`	`split=split,`
`47`	`47`	`reader_cfg=refcoco_plus_reader_cfg,`
`48`	`48`	`infer_cfg=refcoco_plus_infer_cfg,`
`49`	`49`	`eval_cfg=refcoco_plus_eval_cfg,`
`50`	`50`	`)`
`51`		`- for abbr, split in _splits`
	`51`	`+ for split in _splits`
`52`	`52`	`]`
Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,7 @@`
`7`	`7`
`8`	`8`
`9`	`9`	`refcocog_reader_cfg = dict(`
`10`		`- input_columns=['content'],`
	`10`	`+ input_columns=['question', 'image'],`
`11`	`11`	`output_column='answer'`
`12`	`12`	`)`
`13`	`13`
`@@ -33,19 +33,19 @@`
`33`	`33`	`)`
`34`	`34`
`35`	`35`	`_splits = [`
`36`		`- ('RefCOCOg_val', 'val'),`
`37`		`- ('RefCOCOg_test', 'test'),`
	`36`	`+ 'val',`
	`37`	`+ 'test',`
`38`	`38`	`]`
`39`	`39`
`40`	`40`	`refcocog_datasets = [`
`41`	`41`	`dict(`
`42`		`- abbr=abbr,`
	`42`	`+ abbr='RefCOCOg_' + split,`
`43`	`43`	`type=RefCOCOgDataset,`
`44`	`44`	`path='ais_bench/datasets/RefCOCOg/data',`
`45`	`45`	`split=split,`
`46`	`46`	`reader_cfg=refcocog_reader_cfg,`
`47`	`47`	`infer_cfg=refcocog_infer_cfg,`
`48`	`48`	`eval_cfg=refcocog_eval_cfg,`
`49`	`49`	`)`
`50`		`- for abbr, split in _splits`
	`50`	`+ for split in _splits`
`51`	`51`	`]`