Wsparcie w zarządzaniu danymi badawczymi

IBB PAN zapewnia pracownikom i doktorantom wsparcie w zarządzaniu danymi badawczymi.

Oferowana jest pomoc w następujących kwestiach:

– wybór zbiorów danych przeznaczonych do publicznego udostępnienia z projektu naukowego,

– wybór odpowiedniej bazy / repozytorium dla danych,

– ustalenie stanu prawnego danych,

– wybór odpowiedniej licencji dla danych,

– przygotowanie planu zarządzania danymi badawczymi do wniosku grantowego, a także jego modyfikacja w trakcie trwania projektu i sprawozdanie z jego realizacji.

Zapraszam do kontaktu:

dr Marta Hoffman              rdm@ibb.waw.pl        tel. 3501 (pok. 401, blok C)

 

Materiały

1. Instrukcja wspomagająca przygotowanie Planu Zarządzania Danymi dla projektu badawczego (dokument w języku angielskim):

IBB-DMP-HelpSheet-2025-v2

Dokument jest skonstruowany w zgodzie ze schematem stosowanym przez Narodowe Centrum Nauki. Ponieważ NCN wymaga Planu tylko po angielsku, przygotowana została wyłącznie wersja anglojęzyczna. W dokumencie omówione zostały przykłady pasujące do typowych projektów składanych w IBB PAN – jeżeli mają Państwo szczególną sytuację w projekcie (dane nietypowe, dane dotyczące pacjentów, skomplikowana sytuacja prawna danych, itp.), zapraszam do kontaktu bezpośredniego.

2. Lista sugerowanych repozytoriów i baz danych:

Lista dostępna również jako pdf: Suggested-databases-2025-v4. Poniższa lista bazuje częściowo na zestawieniu ELIXIR Deposition Databases for Biomolecular Data.

Specialized repositories for selected types of life sciences data – please use these as your first choice:

ArrayExpress High-throughput functional genomics data (RNA-seq, ChIP-seq, and other types of gene expression and epigenomics datasets). (Also a good alternative: GEO at NCBI).
ENA Nucleotide sequencing information: raw sequencing data, sequence assembly information and functional annotation. (Alternatively: GenBank, SRA – Sequence Read Archive, TSA – Transcriptome Shotgun Assembly, all at NCBI).
EVA Genetic variation data from all species.
IntAct Molecular interaction data.
LIPID MAPS Information on Lipids and their structures, properties and functions in biological processes.
MetaboLights Metabolite structures and their reference spectra as well as their biological roles, locations and concentrations, and experimental data from metabolic experiments.
BioModels Computational models of biological processes.
ModelArchive Theoretical models of macromolecular structures.
PDBe Experimentally obtained structures of biological macromolecules.
PRIDE Mass spectrometry-based proteomics data.
UniProt Protein sequence and function data.
BioImage Archive All biological image data, including light microscopy, 2D-electron microscopy.
EMPIAR Raw cryo-EM data and other 3D-electron microscopy images.
EMDB Processed cryo-EM data and other 3D- electron microscopy images.
ecbd European Chemical Biology Database, run by EU-OPENSCREEN, collects experimental results from biological screening programs. Deposit option possible for EU-OPENSCREEN partner sites.

Domain repositories (accepting all types of research data from a broad but defined field of research) – recommended option for data that does not fit into any specialized repository:

BioStudies All data from Life Sciences research that do not fit in specialized archives. Part of the ecosystem of data resources hosted and managed by EMBL-EBI, it is integrated with many of the specialized resources listed above as well as with the literature repository Europe PMC (PubMedCentral).
Pangaea All data from Earth and Environmental Sciences research. PANGAEA is hosted by the Helmholtz Center for Polar and Marine Research and the University of Bremen.

Generalist repositories for research data (any type of data, any file formats) – for situations where the data is not suitable for domain-specific repositories:

Zenodo All research-related data. EC-funded repository run at CERN in Geneva for researchers from all countries.
RepOD All research-related data. This is a general repository managed and hosted by ICM University of Warsaw, for all researchers in Poland.

3. Prezentacja – najważniejsze aspekty zarządzania danymi badawczymi i Planu Zarządzania Danymi (IBB, 20 czerwca 2024):

RDM-at-IBB-2024-06-20

 

Bio

Marta Hoffman jest biologiem, pracę doktorską wykonywała w IBB PAN w dziedzinie genetyki drożdży. Odbyła staż podoktorski w zespole Biofizyki Teoretycznej na Uniwersytecie Humboldtów w Berlinie, a obecnie jest członkiem zespołu Pracowni Biochemii Lipidów IBB.

Doświadczenie związane z zarządzaniem danymi badawczymi i z kwestiami otwartego udostępniania danych nabyła podczas pracy w Platformie Otwartej Nauki ICM UW (https://pon.edu.pl/), gdzie w latach 2012-2017 prowadziła ogólnokrajowy National Open Access Desk w ramach projektu OpenAIRE (Open Access Infrastructures for Research in Europe, https://openaire.eu/), a także koordynowała Repozytorium Otwartych Danych RepOD (https://repod.icm.edu.pl/) oraz prowadziła warsztaty z Zarządzania Danymi Badawczymi. Swoją wiedzę z zakresu Otwartych Danych Badawczych wykorzystała i poszerzyła w latach 2019-2020 jako członkini grupy doradczej FAIR Working Group of the EOSC (European Open Science Cloud, https://eosc.eu/), która przygotowywała rekomendacje dotyczące wdrażania zasad FAIR Data w ramach powstającego europejskiego serwisu EOSC, oraz w latach 2020-2022 jako członkini grupy doradczej projektu OCRE (Open Clouds for Research Environments, https://www.ocre-project.eu/).