Zapewnienie dostępu do informacji jest jednym z tradycyjnych działań bibliotek. Jednym z nowych wymiarów dostępu do informacji jest eksploracja sieci semantycznej.

Semantic Web – sieć semantyczna opiera się na tworzeniu i rozpowszechnieniu standardów opisywania treści w Internecie w sposób, który umożliwi maszynom i programom (np. tzw. agentom) przetwarzanie informacji w sposób odpowiedni do ich znaczenia. Standardy Semantic Web to m.in. OWL, RDF, RDF Schema (inaczej RDFS). Znaczenia zasobów informacyjnych określa się za pomocą tzw. ontologii.

Wg Tima Berners-Lee, twórcy sieci WWW, jednej z głównych osób rozwijających Semantic Web – sieć semantyczna  opiera się na integracji informacji, treści, danych. Łączy metadane, język struktury danych oraz ontologię,  która wyjaśnia związki między terminami. Elementy te pozwalają programom komputerowym na wnioskowanie i inteligentniejsze pobieranie danych z ogromnej ilości rozproszonych informacji w Internecie.

 

Rysunek „wieży sieci semantycznej” obrazujący z jakich warstw, elementów Semantic Web się składa. https://www.w3.org/RDF/Metalog/images/sw-tower.png

Projektowanie sieci semantycznej wymaga  połączenia wielu umiejętności. Bibliotekarze są w stanie wnieść swój wkład w te prace, np. w obszarze tworzenia metadanych, gdzie wiedza bibliotekarza w zakresie technik opisowych ma istotne znaczenie. Sfera ontologii, definiująca relacje między jednostkami takimi jak klasy i podklasy lub właściwości i podwarstwy, jest bardziej złożona, ale  bibliotekarze mają pewne doświadczenie w tym zakresie, np. w tworzeniu tezaurusów.

Poprawa dostępności bibliotecznych zasobów cyfrowych, wyższa  jakość metadanych oraz rozszerzenie realizacji skomplikowanych kwerend wymaga interoperacyjności danych, ich wymiany z zewnętrznymi źródłami i dzielenia się zasobami w sieci w formie czytelnej dla komputerów. Wiąże się to z potrzebą ulepszenia metod zarządzania bibliotekami cyfrowymi, z semantycznym opisem treści oraz z rozszerzonymi formami współpracy, m.in. przy pomocy sieci społecznościowych, społeczności specjalistów, czy odpowiednich aplikacji pozwalających na wykorzystywania danych z wielu źródeł.

Mechanizm, którym posługuje się Semantic Web to Linked Data, system, który pozwala połączyć w sposób zrozumiały dla komputerów istniejące w sieci informacje. Najważniejsze zasady Linked Data to zastosowanie odnośników zamiast tekstu, unikalnego identyfikatora (URI) oraz użycie składni prostego zdania twierdzącego: podmiot – orzeczenie – dopełnienie w postaci standardu RDF (Resource Description Framework).

Przykład rekordu z opisem zwierzęcia.

<RDF:Seq about=”http://www.some-fictitious-zoo.com/all-animals”&gt;
<RDF:li>
<RDF:Description about=”http://www.some-fictitious-zoo.com/mammals/lion”&gt;
<ANIMALS:name>Lion</ANIMALS:name>
<ANIMALS:species>Panthera leo</ANIMALS:species>
<ANIMALS:class>Mammal</ANIMALS:class>
</RDF:Description>
</RDF:li>

Założenia Linked Data wykorzystywane są przez coraz większą liczbę bibliotek na świecie. Tworzone przez bibliotekarzy  dane wzorcowe, udostępniane w tym formacie,  czytelnym komputerowo,  możliwym do przetwarzania i organizacji przy pomocy narzędzi Sieci Semantycznej, zapewniają rozliczne korzyści użytkownikom  bibliotek cyfrowych czy repozytoriów, selekcję i wybór poszukiwanych informacji. Wykorzystanie usług Linked Data w bibliotekach wiąże się jednak z wieloma problemami  technicznymi i prawnymi.

File:Lod 2017-02-20.png
Diagram pokazujący chmurę danych Linking Open Data datasets – połączenie w lutym 2017. Z https://upload.wikimedia.org/wikipedia/commons/thumb/7/77/Lod_2017-02-20.png/220px-Lod_2017-02-20.png

Model LinkedData wdrażany jest w wielu bibliotekach na świecie, które   „uwalniają” zawarte w katalogach OPAC metadane, co wiąże się m.in. z  potrzebą  uzupełnienia rekordów wzorcowych w formacie MARC informacjami w strukturze LOD (Linked Open Data), np. identyfikatorami URI. Działania związane z zastosowaniem Linked Data prowadzone są w największych światowych bibliotekach, głównie bibliotekach narodowych.

W Bibliotece Kongresu  rozwijany jest serwis  Linked Data Service, zapewniający zarówno interaktywny, jak i automatyczny dostęp do powszechnie używanych ontologii, kontrolowanych słowników i innych wykazów, do opisów bibliograficznych, udostępnianych w domenie publicznej. Dane udostępniane są i łączone za pomocą identyfikatorów URI.

W Bibliotece Brytyjskiej  działa  BNB Linked Data Platform – projekt brytyjskiej bibliografii narodowej w strukturze LOD. Linked Open BNB jest podzbiorem pełnej Brytyjskiej Bibliografii Narodowej (publikacji Zjednoczonego Królestwa i Republiki Irlandii), obejmującym książki, publikacje seryjne, czasopisma, gazety – aktualnie około 3,9 miliona rekordów.
Zbiór danych jest dostępny na licencji Creative Commons CC0 1.0.

W Bibliotece Narodowej Francji – projekt data.bnf.fr, oparty na standardach i narzędziach semantycznych,  gromadzi i udostępnia w trybie otwartym informacje o zasobach BNF rozproszone w różnych katalogach i bibliotece cyfrowej Galica.  W 2013 r. Data.bnf.fr i Gallica zdobyły nagrodę Stanforda za innowację w bibliotekach naukowych (SPIRL).
Biblioteka Narodowa Niemiec rozwija usługę Linked Data Service, która w dłuższej perspektywie umożliwi, dzięki sieci semantycznej, korzystanie z całego zasobu krajowych danych bibliograficznych, w tym danych dotyczących uprawnień. Celem serwisu jest zapewnienie stabilności i niezawodności „połączonej chmury danych” poprzez dostarczanie wysokiej jakości danych.  Metadane udostępniane są w standardzie RDF za pośrednictwem Linked Data Service od 2010 roku. Serwis  podlega ciągłemu rozwojowi i optymalizacji na poziomie technicznym, treściowym i organizacyjnym. Zintegrowana kartoteka GND oraz rekordy bibliograficzne w strukturze Linked Data udostępniane są na Licencji Creative Commons Zero (CCO 1.0.) 

Hiszpański projekt  datos.bne.es – portal danych bibliograficznych Biblioteki Narodowej Hiszpanii, bazujący na sieciowych technologiach internetowych, oferuje użytkownikom nowy sposób korzystania z kolekcji i zasobów – publikowanie danych w strukturze Linked Open Data. Również Biblioteka Narodowa  Szwecji udostępnia centralny katalog LIBRIS jako Linked Data.

Narzędzia semantyczne wykorzystuje też  Europeana, wspólna europejska biblioteka cyfrowa, udostępniająca cyfrowe wersje obiektów z europejskich instytucji dziedzictwa kulturowego, bibliotek, archiwów i muzeów. Nowa struktura informacyjna bazuje na modelu Linked Data, wykorzystywana jest funkcja wyszukiwania semantycznego. Model danych – EDM (Europeana Data Model) obejmuje różne reprezentowane w Europeanie struktury metadanych i domeny wiedzy, co pozwala zachować oryginalne reprezentacje danych, a jednocześnie ich interoperacyjność. EDM umożliwia modelowanie kontrolowanych słowników, opisywanie obiektów, a także strukturyzację poszczególnych elementów informacji. Opis obiektu składa się z kilku elementów: metadanych opisowych, miniaturek czy linków do obiektu cyfrowego.

Wdrażanie technologii Linked Data nie przebiega oczywiście bez problemów, wymieniane są m.in. takie, jak: trudności z katalogowaniem zasobów, wiele słowników dla tych samych metadanych, brak uzgodnień dotyczących dostarczania metadanych, trudności z migracją danych do nowych modeli, brak ekspertów z różnych dziedzin, definicje praw własności i kontroli, brak wskaźników wykorzystania Linked Data.

Na koniec coś z naszej uczelni –  Baza Wiedzy Politechniki Warszawskiej – baza dorobku naukowego połączona z repozytorium, działająca na oprogramowaniu Omega-Psir, rozwijanym w Instytucie Informatyki Wydziału Elektroniki PW, również wykorzystuje elementy sieci semantycznej. Baza Wiedzy przechowuje wszelkie adekwatne dane dotyczące dorobku naukowego badaczy: publikacji, raportów, projektów, wdrożeń itp. Wszelkie zasoby powiązane są ze sobą semantycznie, co daje możliwość wieloaspektowej oceny działań naukowych i rozbudowane raportowanie. Ontologia może być rozwijana w miarę zmieniających się potrzeb. Baza rozwijana jest przy udziale zespołu z Biblioteki Głównej PW, zajmującego się m.in. koordynowaniem i organizacją aktualizacji danych, raportowaniem i przekazywaniem danych do innych systemów, a także szkoleniem  i koordynacją działań bibliotekarzy wydziałowych, pełniących funkcje redaktorów.

Chmura PW
Chmura tagów z Bazy Wiedzy obrazująca uprawiane na PW dziedziny wiedzy

 

MM

Źródła:

Europeana Data Model

Library role in a Digital Age. CLIR org.

https://en.wikipedia.org/wiki/Linked_data

Roszkowski Marcin, Kartoteki nazw osobowych w środowisku sieciowym, Biuletyn EBIB, nr 7 (160)/2015. http://open.ebib.pl/ojs/index.php/ebib/article/view/380

Roszkowski Marcin, Linked Data – model danych powiązanych w Semantic Web. W: Medioteka Wydziału Dziennikarstwa, Informacji i Bibliologii Uniwersytetu Warszawskiego.

The Semantic Web Made Easy. W: W3C Metalog. Dostęp 13.02.2019

Szymczak Joanna, Linked Data i funkcje wyszukiwania w Europeanie. W: Babin.org.pl

Waleszko Małgorzata, Linked Data w bibliotekach cyfrowych: stan obecny i przyszłe trendy. W: Babin.org.pl

Waleszko Małgorzata, Linked Open Data, URI i kontrola autorytatywna w wybranych bibliotekach narodowych. W Babin.org.pl

Zalewski Piotr, Tim Berners-Lee o potędze Sieci semantycznej.

Zieliński Marek, Wstęp do Linked Data, https://www.pilsudski.org/pl/nowosc/blog/463-wstp-do-linked-data

 

Poprzednie części artykułu:

Reklamy