Wsparcie w zarządzaniu danymi badawczymi
IBB PAN zapewnia pracownikom i doktorantom wsparcie w zarządzaniu danymi badawczymi.
Oferowana jest pomoc w następujących kwestiach:
– wybór zbiorów danych przeznaczonych do publicznego udostępnienia z projektu naukowego,
– wybór odpowiedniej bazy / repozytorium dla danych,
– ustalenie stanu prawnego danych,
– wybór odpowiedniej licencji dla danych,
– przygotowanie planu zarządzania danymi badawczymi do wniosku grantowego, a także jego modyfikacja w trakcie trwania projektu i sprawozdanie z jego realizacji.
Zapraszam do kontaktu:
dr Marta Hoffman rdm@ibb.waw.pl tel. 3501 (pok. 401, blok C)
Materiały
1. Instrukcja wspomagająca przygotowanie Planu Zarządzania Danymi dla projektu badawczego (dokument w języku angielskim):
Dokument jest skonstruowany w zgodzie ze schematem stosowanym przez Narodowe Centrum Nauki. Ponieważ NCN wymaga Planu tylko po angielsku, przygotowana została wyłącznie wersja anglojęzyczna. W dokumencie omówione zostały przykłady pasujące do typowych projektów składanych w IBB PAN – jeżeli mają Państwo szczególną sytuację w projekcie (dane nietypowe, dane dotyczące pacjentów, skomplikowana sytuacja prawna danych, itp.), zapraszam do kontaktu bezpośredniego.
2. Lista sugerowanych repozytoriów i baz danych:
Lista dostępna również jako pdf: Suggested-databases-2025-v4. Poniższa lista bazuje częściowo na zestawieniu ELIXIR Deposition Databases for Biomolecular Data.
Specialized repositories for selected types of life sciences data – please use these as your first choice:
ArrayExpress | High-throughput functional genomics data (RNA-seq, ChIP-seq, and other types of gene expression and epigenomics datasets). (Also a good alternative: GEO at NCBI). |
ENA | Nucleotide sequencing information: raw sequencing data, sequence assembly information and functional annotation. (Alternatively: GenBank, SRA – Sequence Read Archive, TSA – Transcriptome Shotgun Assembly, all at NCBI). |
EVA | Genetic variation data from all species. |
IntAct | Molecular interaction data. |
LIPID MAPS | Information on Lipids and their structures, properties and functions in biological processes. |
MetaboLights | Metabolite structures and their reference spectra as well as their biological roles, locations and concentrations, and experimental data from metabolic experiments. |
BioModels | Computational models of biological processes. |
ModelArchive | Theoretical models of macromolecular structures. |
PDBe | Experimentally obtained structures of biological macromolecules. |
PRIDE | Mass spectrometry-based proteomics data. |
UniProt | Protein sequence and function data. |
BioImage Archive | All biological image data, including light microscopy, 2D-electron microscopy. |
EMPIAR | Raw cryo-EM data and other 3D-electron microscopy images. |
EMDB | Processed cryo-EM data and other 3D- electron microscopy images. |
ecbd | European Chemical Biology Database, run by EU-OPENSCREEN, collects experimental results from biological screening programs. Deposit option possible for EU-OPENSCREEN partner sites. |
Domain repositories (accepting all types of research data from a broad but defined field of research) – recommended option for data that does not fit into any specialized repository:
BioStudies | All data from Life Sciences research that do not fit in specialized archives. Part of the ecosystem of data resources hosted and managed by EMBL-EBI, it is integrated with many of the specialized resources listed above as well as with the literature repository Europe PMC (PubMedCentral). |
Pangaea | All data from Earth and Environmental Sciences research. PANGAEA is hosted by the Helmholtz Center for Polar and Marine Research and the University of Bremen. |
Generalist repositories for research data (any type of data, any file formats) – for situations where the data is not suitable for domain-specific repositories:
Zenodo | All research-related data. EC-funded repository run at CERN in Geneva for researchers from all countries. |
RepOD | All research-related data. This is a general repository managed and hosted by ICM University of Warsaw, for all researchers in Poland. |
3. Prezentacja – najważniejsze aspekty zarządzania danymi badawczymi i Planu Zarządzania Danymi (IBB, 20 czerwca 2024):
Bio
Marta Hoffman jest biologiem, pracę doktorską wykonywała w IBB PAN w dziedzinie genetyki drożdży. Odbyła staż podoktorski w zespole Biofizyki Teoretycznej na Uniwersytecie Humboldtów w Berlinie, a obecnie jest członkiem zespołu Pracowni Biochemii Lipidów IBB.
Doświadczenie związane z zarządzaniem danymi badawczymi i z kwestiami otwartego udostępniania danych nabyła podczas pracy w Platformie Otwartej Nauki ICM UW (https://pon.edu.pl/), gdzie w latach 2012-2017 prowadziła ogólnokrajowy National Open Access Desk w ramach projektu OpenAIRE (Open Access Infrastructures for Research in Europe, https://openaire.eu/), a także koordynowała Repozytorium Otwartych Danych RepOD (https://repod.icm.edu.pl/) oraz prowadziła warsztaty z Zarządzania Danymi Badawczymi. Swoją wiedzę z zakresu Otwartych Danych Badawczych wykorzystała i poszerzyła w latach 2019-2020 jako członkini grupy doradczej FAIR Working Group of the EOSC (European Open Science Cloud, https://eosc.eu/), która przygotowywała rekomendacje dotyczące wdrażania zasad FAIR Data w ramach powstającego europejskiego serwisu EOSC, oraz w latach 2020-2022 jako członkini grupy doradczej projektu OCRE (Open Clouds for Research Environments, https://www.ocre-project.eu/).