Jak wskazano w komunikacie Centrum Badań Kosmicznych PAN, elementem tego etapu prac “jest odpowiednia selekcja ogromnej ilości danych”, jak również inne działania przygotowawcze. Wskazano wśród nich m.in. oznaczanie i specjalistyczne czyszczenie danych, podniesienie ich jakości, opis z użyciem standaryzowanych metadanych oraz przygotowanie ich do udostępnienia w Internecie w odpowiednich formatach gotowych do przetwarzania. Wszystko to, jak stwierdzono, wymaga sporych nakładów pracy i czasu na realizację zakładanego planu.
Cyfryzacja tych specjalistycznych i unikatowych danych CBK PAN ma odbywać się z zachowaniem najwyższej rangi ostrożności i dokładności. Jednym z ważnych kroków realizacji projektu openSPACE jest ustalenie i opisanie kryteriów typowania danych, tj. na przykład przydatność w prowadzonych pracach naukowych oraz procesie dydaktycznym, stan zachowania obiektów oryginalnych, znaczenie dla propagowania wiedzy i inne.
W przypadku każdej pozycji wytypowanej do digitalizacji musi być sprawdzony jej status. Każdy zbiór czy zestaw danych przed digitalizacją musi być sprawdzany pod kątem kompletności oraz stanu jego zachowania. Jeśli są jakieś braki, będą one uzupełniane “każdym możliwym dostępnym sposobem”. Jeśli natomiast osoba odpowiedzialna za przygotowany zbiór danych do skanowania uzna, że digitalizacja mogłaby pogorszyć jego stan – zbiór będzie kierowany w pierwszej kolejności do konserwacji.
W kolejnych etapach istotną częścią procesu digitalizacji będzie skanowanie. Zestawy wyselekcjonowanych i przygotowanych danych będą powielane według wartości wystarczających dla zachowania odpowiedniej jakości obrazu, a potem do ich przetwarzania oraz archiwizacji. Powstaną oczywiście zbiory specjalne, digitalizowane w indywidualnie dobieranych wartościach, w oparciu o jakość zbioru danych, ich specyfiki oraz detaliczność najmniejszych fragmentów.
Następnie dane będą przetwarzane, poddane procesowi konwersji i w końcu publikowane. To nadal nie wszystko – na końcu procesu digitalizacji niezbędnym i ważnym punktem podsumowującym prace będzie ich archiwizacja, polegająca na bezpiecznym przechowywaniu zarówno skanów, jak i plików już zdigitalizowanych. Droga do cyfryzacji repozytorium danych jest zatem długa.
Projekt „openSPACE – repozytorium otwartych danych wysokiej wartości z obserwacji Ziemi i kosmosu” jest realizowany w ramach Programu Operacyjnego Polska Cyfrowa na lata 2014-2020.
Zgłoś naruszenie/Błąd
Oryginalne źródło ZOBACZ
Dodaj kanał RSS
Musisz być zalogowanym aby zaproponować nowy kanal RSS