Biblioteka Narodowa używa na swojej stronie plików cookies. Brak zmiany ustawień przeglądarki oznacza zgodę na ich użycie. [zamknij]

Konferencja Dublin Core 2013

Autor: Marcin Roszkowski,

Kategorie: Wydarzenia

Tagi: , , , ,

Zostaw komentarz

Tegoroczna konferencja Dublin Core miała miejsce w Lizbonie w dniach 2-6.09.2013 r. i została zorganizowana wspólnie z sympozjum iPRES. Hasłem przewodnim konferencji było Linking to the Future. W pierwszym i ostatnim dniu odbył się szereg warsztatów natomiast zasadnicze obrady miały miejsce od wtorku do czwartku (03-05.09). Program Dublin Core 2013 był bardzo napięty i każdego dnia odbywały się dwie równoległe sesje. Jednocześnie, codziennie rano miały miejsce wystąpienia/wykłady zaproszonych prelegentów.

Pierwszego dnia odbyły się cztery warsztaty :
1. Wprowadzenie do Linked Open Data.
2. Wprowadzenie do tworzenia ontologii sieciowych.
3. Metadane i informacje o źródle ich pochodzenia.
4. Ontologia PROV—the W3C Provenance Ontology.

W ostatnim dniu odbyła się całodniowa sesja pt. Vocabulary Day, poświęcona pracom nad rozwojem słownictwa kontrolowanego Dublin Core oraz m.in. kwestiom wielojęzyczności a także CAMP-4-DATA, dedykowane szeroko rozumianemu wykorzystaniu metadanych w nauce.

W dalszej części zostaną krótko scharakteryzowane wyłącznie wybrane i  subiektywnie uznane za najbardziej interesujące wystąpienia podczas konferencji. Wszystkie teksty i prezentacje z tegorocznej konferencji Dublin Core są już dostępne na stronie organizatorów.

Gildas Illien – Kochanie, musimy porozmawiać

 

Jeden ze slajdów z prezentacji G. Illiena

 

Gildas Illien, dyrektor departamentu BnF odpowiedzialnego za bibliografię i digitalizację, był jednym z trzech zaproszonych gości, którym podczas konferencji Dublin Core zaproponowano wygłoszenie wykładu rozpoczynającego każdy dzień obrad. Wystąpienie Gildasa Illiena było intrygujące na wielu płaszczyznach. Sam tytuł (Kochanie, musimy porozmawiać) wzbudził zainteresowanie i zwiastował podjęcie trudnych tematów dla bibliotekarstwa w dwudziestym pierwszym wieku. Illien poruszył kwestię charakteru zawodu bibliotekarza jako bibliografa rejestrującego dorobek dziedzictwa kulturowego oraz jako “archiwisty” dbającego o jego zachowanie. Nawiązał do zmian, jakie zaszły w BnF w tych dwóch obszarach oraz w kontekście publikowania i wykorzystywania danych bibliograficznych i wzorcowych w chmurze danych powiązanych (Linked Data). Illien scharakteryzował trzy filary usług informacyjnych BnF (biblioteka cyfrowa Gallica, serwis data.bnf.fr oraz archiwizacja zasobów cyfrowych) i na ich przykładach odniósł się do istotnych problemów współczesnego bibliotekarstwa :

  • zarządzanie i polityka rozwoju,
  • kultura organizacyjna, polityka kadrowa, nowe kompetencje,
  • pojęcie własności w działalności bibliograficznej, licencjonowanie metadanych,
  • stosowanie standardów w zakresie identyfikatorów, schematów metadanych, itp.

Gildas Illien w trakcie godzinnego wystąpienia postawił wiele pytań, ale dał też wiele odpowiedzi odwołując się do rozwiązań przyjętych w BnF. Szczególną konsternację wzbudziła teza Illiena, że w jego działalności zawodowej nie zależy mu na książkach. Dodał, że zależy mu jednak na ludziach, którzy ich potrzebują.
Prezentacja G. Illiena


Sesja specjalna – schema.org

 

W tle Dan Brickley omawia założenia Schema.org

 

Duże zainteresowanie wzbudziła sesja specjalna poświęcona projektowi schema.org. Jest to specyfikacja semantycznych znaczników zagnieżdżanych w strukturze dokumentu sieciowego (np. w kodzie HTML strony internetowej), które ułatwiają mechanizmom je przetwarzającym poprawną interpretację treści. Schema.org zawiera wykaz takich znaczników m.in. dla opisu organizacji, dokumentu, wydarzenia, produktu handlowego czy miejsca. Zaletą stosowania opisu z wykorzystaniem schema.org jest fakt, że są one poprawnie interpretowane przez cztery największe wyszukiwarki internetowe na świecie : Bing, Google, Yahoo, Yandex. To dzięki ich współpracy, w 2011 roku doszło do opracowania takiej specyfikacji. Tym samym, stosowanie dodatkowej warstwy znaczeniowej w opisie dokumentów korzystnie wpływa na ich wyszukiwalność.
Przedmiotem sesji było jednak wykorzystanie schema.org jako komplementarnej formy publikowania danych bibliograficznych w środowisku sieciowym. Sesję moderował Richard Wallis (OCLC). Jako pierwszy głos zabrał Dan Brickley (lider Schema.org i współpracownik Google), który przedstawił założenia tego projektu oraz kilka ciekawostek związanych z jego stosowaniem (np. każdy film zdeponowany w serwisie YouTube posiada automatycznie wygenerowany zestaw znaczników). Sébastien Peyrard przedstawił wykorzystanie schema.org w data.bnf.fr a Antoine Isaac w Europeanie. Richard Wallis podjął próbę pokazania realnych korzyści płynących ze stosowania tego rozwiązania podczas publikowania danych bibliograficznych w sieci. Każdy z prelegentów zaznaczał, że po zastosowaniu tego rodzaju “wzbogacania” metadanych zauważono zwiększenie wyszukiwalności elementów kolekcji. Użytkownicy bibliotek zaczynają swoje poszukiwania od wyszukiwarek internetowych a skoro znaczniki schema.org korzystnie wpływają na indeksowanie zawartości, to wydaje się racjonalne, żeby metadane biblioteczne również były reprezentowane w sieci za pomocą tego standardu. Sam opis z wykorzystaniem znaczników jest bardzo uproszczony w porównaniu z zawartością rekordu bibliograficznego, ale w założeniu schema.org ma umożliwić odnalezienie i identyfikację, nie zaś stanowić alternatywę dla np. MARC 21. Specyfikacja schema.org nie zawiera znaczników dla wszystkich typów materiałów bibliotecznych. W 2012 roku zawiązano jednak grupę (Schema Bib Extend Community Group), której celem jest opracowanie takiej specyfikacji i włączenie do standardu schema.org
Fragment kodu z uwzględnieniem znaczników schema.org, który zawiera informacje o książce jako produkcie handlowym:

 

Ubogi i popularny czy bogaty, ale samotny?

 

Prelegenci w sesji Data Enrichment and Transformation in the Lod Context:
Poor And Popular Vs. Rich And Lonely—Can’t We Achieve Both?

 

Przedmiotem sesji pt. Data Enrichment and Transformation in the Lod Context: Poor And Popular Vs. Rich And Lonely—Can’t We Achieve Both? była działalność bibliotek europejskich na rzecz publikowania zasobów bibliograficznych i kartotek wzorcowych w standardach sieciowych. Sesja miała formę panelu dyskusyjnego moderowanego przez Gordona Dunsire, gdzie po krótkich wystąpieniach odbywała się dyskusja z udziałem słuchaczy oraz pozostałych prelegentów. W sesji wystąpili:

  • Gildas Illien oraz Sébastien Peyrard (Bibliothèque nationale de France) – projekt data.bnf.fr (http://data.bnf.fr/).
  • Lars Svensson (Deutsche Nationalbibliothek) – projekt DNB Linked Data Service (http://www.dnb.de/EN/lds).
  • Daniel Vila-Suero (Universidad Politécnica de Madrid) oraz Ricardo Santos Muñoz (Biblioteca Nacional de España) – projekt datos.bne.es (http://datos.bne.es).

Wystąpienia miały formę krótkich referatów prezentujących wyniki prac nad publikowaniem metadanych bibliotecznych w modelu Linked Data oraz w jego odmianie opartej na wykorzystaniu tzw. wolnych licencji, tj. Linked Open Data. Kluczowym zagadnieniem w tym kontekście był sposób modelowania danych w omawianych projektach za pomocą ontologii i schematów metadanych. Tytuł sesji nawiązywał do ważnego problemu, który stoi nie tylko przed bibliotekarzami, chcącymi udostępnić swoje metadane zgodnie z założeniami Linked Data, lecz dotyczy modelowania danych w sieci semantycznej w ogólności. Punktem wyjścia, w większości projektów bibliotecznych jest MARC 21 jako najbardziej rozpowszechniony format danych. Problem pojawia się w momencie ustalania modelu danych oraz jego formalnej reprezentacji, do której mają być konwertowane zasoby bibliograficzne i kartoteki wzorcowe. Czy stosować najbardziej rozpowszechnione w sieci schematy metadanych (np. Dublin Core Terms) i/lub ontologie sieciowe (np. FOAF) tracąc często na szczegółowości i kontekście, czy też opracować własny schemat, profil aplikacyjny i doprowadzić do bezstratnej konwersji? W pierwszym przypadku tracimy na szczegółowości odwzorowania, ale stosujemy “słownictwo” rozpowszechnione w innych projektach sieciowych. Powoduje to większe szanse na użycie, czy też wielokrotne użycie danych bibliograficznych i wzorcowych w zasobach danych spoza kontekstu bibliotecznego. W drugim przypadku, zyskujemy na adekwatności konwersji, ale istnieje prawdopodobieństwo, że “nasze słownictwo” nie będzie zrozumiałe poza obszarem projektów bibliotecznych i nasze zasoby nie będą “atrakcyjne” dla podmiotów spoza tego obszaru. Jest to duże uproszczenie problemu modelowania danych bibliograficznych i ich reprezentacji za pomocą standardów sieciowych, ale jego konsekwencje sprowadzają się do kwestii interoperacyjności naszych zasobów, a więc spójności na płaszczyźnie ich wymiany. Ten problem jest widoczny w trzech prezentowanych projektach. Zarówno BnF, DNB jak i Biblioteka Narodowa Hiszpanii zastosowały odmienne sposoby i narzędzia konwersji danych z MARC 21 do modelu Linked Data. W każdym z tych projektów zastosowano funkcjonujące standardy sieciowe, lecz wykorzystano inne rozwiązania w kontekście doboru schematów metadanych, ontologii sieciowych oraz własnych propozycji w tym zakresie. Padło pytanie, czy należy opracowywać duże, dziedzinowe ontologie bibliograficzne (np. the Bibliographic Ontology, the FRBR-aligned Bibliographic Ontology, itp.) czy też specyfikować już istniejące i włączyć się w aktualny trend do wykorzystywania już istniejących standardów reprezentacji informacji.
W tej sesji podniesiono również kwestię użyteczności i potencjalnego wykorzystania naszych zasobów bibliograficznych oraz kartotek wzorcowych w Sieci Semantycznej. Istnieje potrzeba tworzenia i udostępniania tzw. scenariuszy przypadków użycia (use cases scenario), w których należy przedstawić konkretne sytuacje, gdzie metadane biblioteczne mogą być wykorzystane w aplikacjach sieciowych. Według danych z projektu data.bnf.fr, na chwilę obecną 40% katalogu tej biblioteki jest dostępne w modelu Linked Data. Jednak tego typu “obecność” w sieci powoduje, że 80% użytkowników trafia do tego serwisu prosto z rezultatów generowanych przez wyszukiwarki internetowe. 70% aktywności użytkowników serwisu data.bnf.fr prowadzi do pozostałych serwisów BnF, w tym kolekcji cyfrowych ale również do tradycyjnego katalogu OPAC.
Kolejny problem warty uwagi w tym kontekście to licencjonowanie metadanych. Każda kolekcja metadanych powinna posiadać stosowne i jasne określenie zasad ich użycia. Biblioteki Narodowe Niemiec i Hiszpanii udostępniają dane na licencji Creative Commons Zero (CC0) a BnF na Creative Commons Attribution 2.0 (CC-BY 2.0).

Standard zapisu dat i czasu a dane bibliograficzne

Hannah Tarver z biblioteki University of North Texas przedstawiła wdrożenie w kolekcjach cyfrowych standardu Biblioteki Kongresu pt. Extended Date/Time Format (EDTF) 1.0. Jest to specyfikacja, która określa sposób zapisu dat i czasu jako metadanych. Jako podstawę przyjmuje się tutaj normę ISO 8601. EDTF formalnie specyfikuje wahania związane z ustaleniem dat oraz ich zakresy, tak aby byłby spójnie odwzorowywane i mogły być automatycznie przetwarzane. EDTF zakłada trzy poziomy odwzorowania aspektu temporalnego:

  • Poziom 0 : zawiera podstawowy sposób kodowania dat (np. 2013-09-22 lub 2013-09 czy 2013)
  • Poziom 1 : zawiera podstawowe wykładniki odwzorowujące niepewność i brak dokładnych danych pozwalających na ustalenie daty i czasu oraz ramy czasowe
  • Poziom 2 : zawiera szczegółowe wykładniki dla poziomu pierwszego.

Hannah Tarver przedstawiła metodykę wdrożenia standardu EDTF w kolekcjach cyfrowych biblioteki University of North Texas oraz problemy związane z pełną automatyczną implementacją tego standardu.
Tekst i prezentacja : Lessons Learned in Implementing the Extended Date/Time Format in a Large Digital Library.

Nagrodę za najlepsze wystąpienie w ramach tegorocznej konferencji Dublin Core otrzymał zespół pod kierownictwem Atoine Isaac’a (EUROPEANA) pt. Achieving Interoperability between the CARARE Schema for Monuments and Sites and the Europeana Data Model.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>