theislab · giovp · Mar 12, 2021 · davidsebfischer · Mar 12, 2021 · davidsebfischer
diff --git a/...a/dataloaders/loaders/d10_1038_s41586_018_0654_5/Mouse_Brain_2018_Smart-seq2_Tasic_001.py b/...a/dataloaders/loaders/d10_1038_s41586_018_0654_5/Mouse_Brain_2018_Smart-seq2_Tasic_001.py
@@ -0,0 +1,25 @@
+import anndata
+import os
+import scipy.sparse
+import numpy as np
+
+
+def load(data_dir, sample_fn, **kwargs):
+    fn = os.path.join(data_dir, sample_fn)
+
+    counts = pd.read_csv(data_dir + "GSE115746_cells_exon_counts.csv.gz", index_col=0)
+    counts_t = counts.T.copy()
+
+    metadata = pd.read_csv(data_dir + "GSE115746_complete_metadata_28706-cells.csv.gz")
+
+    metadata = metadata[metadata.sample_name.isin(counts_t.index.values)].copy()
+    metadata.index = metadata.sample_name
+    metadata = metadata.reindex(counts_t.index)
+
+
+    np.testing.assert_array_equal(metadata.sample_name.values, counts_t.index.values)
+
+    adata = AnnData(scipy.sparse.csc_matrix(counts_t.to_numpy()),obs=metadata,)
+    adata.var.index = counts_t.columns
+
+    return adata
diff --git a/...dataloaders/loaders/d10_1038_s41586_018_0654_5/Mouse_Brain_2018_Smart-seq2_Tasic_001.yaml b/...dataloaders/loaders/d10_1038_s41586_018_0654_5/Mouse_Brain_2018_Smart-seq2_Tasic_001.yaml
@@ -0,0 +1,44 @@
+dataset_structure:
+    dataset_index: 1
+    sample_fns:
+        - "GSE115746_cells_exon_counts.csv.gz"
+dataset_wise:
+    author: "Tasic"
+    doi: "10.1038/s41586-018-0654-5"
+    download_url_data: "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE115746&format=file&file=GSE115746%5Fcells%5Fexon%5Fcounts%2Ecsv%2Egz"
+    download_url_meta: "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE115746&format=file&file=GSE115746%5Fcomplete%5Fmetadata%5F28706%2Dcells%2Ecsv%2Egz"
+    normalization: "raw"
+    year: "2018"
+dataset_or_observation_wise:
+    age:
+    age_obs_key:
+    assay: "smart-seq2"
+    assay_obs_key:
+    bio_sample:
+    bio_sample_obs_key:
+    development_stage:
+    development_stage_obs_key:
+    ethnicity:
+    ethnicity_obs_key:
+    healthy:
+    healthy_obs_key:
+    individual:
+    individual_obs_key: "donor_id"
+    organ: "brain"
+    organ_obs_key:
+    organism: "mouse"
+    organism_obs_key: "organism"
+    sex:
+    sex_obs_key: "donor_sex"
+    state_exact: "healthy"
+    state_exact_obs_key:
+    tech_sample:
+    tech_sample_obs_key:
+observation_wise:
+    cellontology_original_obs_key: "cell_cluster"
+feature_wise:
+    var_ensembl_col:
+    var_symbol_col:
+misc:
+meta:
+    version: "1.0"
diff --git a/sfaira/data/dataloaders/loaders/d10_1038_s41586_018_0654_5/__init__.py b/sfaira/data/dataloaders/loaders/d10_1038_s41586_018_0654_5/__init__.py