Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

2nd Open Linked Data Conference

Autor: Marcin Roszkowski,

Kategorie: Wydarzenia

Tagi:

Zostaw komentarz

  • Facebook
  • Wykop
  • StumbleUpon
  • Email

21 września 2012 roku odbyła się druga edycja konferencji Linked Open Data Conference organizowanej przez  szkocką grupę ds. katalogowania działającą w ramach CILIP. Spotkanie zorganizowano w Edynburgu w Edinburgh Centre for Carbon Innovation, gdzie zgromadziło się ok. 60 uczestników, w tym wielu spoza Szkocji (m.in. Dania, Finlandia, Holandia, Hiszpania, Polska).   Motywem przewodnim konferencji było rejestrowanie przez biblioteki wytworów dziedzictwa kulturowego w modelu Linked Data oraz dążenie do wypracowania wspólnych rozwiązań metodycznych w tym zakresie.

Jako pierwszy z prelegentów głos zabrał Richard Wallis. Jego wystąpienie było z pewnością wyczekiwane przez wielu obecnych, ze względu na fakt, że jest on uznawany za pioniera w transformacji danych bibliograficznych i wzorcowych do modelu Linked Data, a firma której przewodził (Tallis), jest jedną z niewielu na rynku, która podejmuje się tego typu projektów. Po przejściu R. Wallisa w kwietniu 2012 roku do OCLC można spodziewać się intensyfikacji prac nad włączeniem się bibliotek do realizacji koncepcji Sieci Semantycznej. R. Wallis w swoim wystąpieniu poruszył wiele bieżących problemów, które nie pozwalają na zrobienie kroku na przód w kierunku zmiany myślenia bibliotekarzy o modelowaniu danych w środowisku sieciowym. Hasłem przewodnim jego wystąpienia było : Stop copying, start linking, become part of the Web. Zamiast kopiować dane z zewnętrznych źródeł do naszych zasobów, powinniśmy mieć odpowiednią infrastrukturę, która pozwoli nam na ustalanie formalnych relacji ze zbiorami danych, słownikami, listami wartości, do których się odwołujemy. Osadzenie tego rodzaju zapisów w standardach zalecanych przez W3C pozwoli na zwiększenie wyszukiwalności naszych danych, również w globalnych wyszukiwarkach jak Google. Na przykładzie projektu World Cat pokazał nowe podejście do publikowania danych bibliograficznych w modelu danych powiązanych. Dotychczasowe próby przedstawienia danych bibliograficznych za pomocą standardów opartych na RDF polegały (w dużym skrócie) na konwersji zasobów z np. MARC21 do MARC XML, ustaleniu standardów metadanych i kartotek wzorcowych, słowników i innych zewnętrznych źródeł w formatach zgodnych z RDF i wykorzystaniu ich do mapowania struktury danych, generowaniu trójek RDF, opracowania na ich podstawie relacyjnej struktury danych i udostępnieniu rezultatów prac w postaci pliku RDF do pobrania i/lub tzw. SPARQL Endpoint, czyli formalnej specyfikacji protokołu wykorzystywanego do komunikowania się z bazą danych. Propozycja R. Wallisa to wykorzystanie koncepcji mikroformatów i osadzanie metadanych w kodzie HTML lub innego standardu prezentacji informacji w sieci.  Jedną z zalet takiego podejścia jest możliwość indeksowania kolekcji przez mechanizmy wyszukiwarek internetowych. Propozycja World Cat w kontekście Linked Data, to wykorzystanie schema.org jako źródła schematów metadanych dla opisywanych zasobów. Schema.org zawiera proste struktury metadanych do opisu m.in. książki, filmu, miejsca, osoby, organizacji, itd. Są to zestawy znaczników, które można zagnieździć w strukturze dokumentu, które zwiększają jego wartość wyszukiwawczą. Dodatkowym argumentem, przemawiającym za wykorzystaniem schema.org w publikowaniu zasobów World Cat, jest fakt, że Google, Bing, Yahoo oraz rosyjski Yandex wykorzystują te specyfikacje do interpretacji indeksowanych danych.

Przykład reprezentacji metadanych z World Cat za pomocą specyfikacji z schema.org, które zagnieżdżono w kodzie warstwy prezentacji. Aby wyświetlić zagnieżdżone metadane, należy rozwinąć sekcję Linked Data, na dole strony.

Kolejne, równie ciekawe wystąpienie dotyczyło projektu Will’s World, realizowanego przez szkockie akademickie centrum danych EDINA. Istotą projektu jest zastosowanie agregacji jako „taktyki” zarządzania metadanymi. Celem projektu jest zgromadzenie informacji o dostępnych źródłach informacji na temat życia i twórczości Williama Szekspira oraz jego dzieł. Projekt jest realizowany we współpracy m.in. z British Museum. Samo wystąpienie miało charakter raczej techniczny i dotyczyło trudności w konstrukcji zapytań do bazy za pomocą SPARQL, lecz poruszono w nim istotny problem funkcjonowania zbyt wielu standardów identyfikatorów dla dzieł, osób, miejsc itd.

Po wystąpieniu Daniela Lewisa z Open Knowledge Foundation Network na temat działalności i prowadzonych przez OKFN projektów, miały miejsce trzy wystąpienia reprezentantów europejskich bibliotek narodowych (Szkocja, Hiszpania) lub  krajowych agencji bibliograficznych (Dania). Były to niezwykle ciekawe sprawozdania z projektów, których celem jest udostępnienie danych bibliograficznych, wzorcowych, zawartości bibliografii narodowych w modelu Liked Data. Pojawiły się problemy z opracowaniem schematu mapowania MARC21 do atrybutów ze schematów opartych na RDF, kwestie identyfikowania zasobów informacyjnych, problemy licencjonowania danych. Była to dawka potrzebnej wiedzy typu know-how i krytycznych spostrzeżeń na temat podjętych decyzji. Na koniec głos zabrał Gordon Dunshire, który zrobił przegląd rekomendowanego oprogramowania, pomocnego w konwersji i publikowaniu danych w modelu Linked Data oraz przedstawił bieżące problemy oraz nierozwiązane kwestie, które stoją przed środowiskiem bibliotekarzy zainteresowanych tymi zagadnieniami.

 

Szczegółowe sprawozdanie z konferencji ukaże się w następnym zeszycie Zagadnień Informacji Naukowej.

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>