Temat: biblioteka cyfrowa jako taka
Pomysł na tagowanie publikacji w BC bierze się z kilku przyczyn, z których wiele jest banalnych.
1. Treści jest zbyt wiele - ludzie pracujący w bibliotekach to ułamek populacji, która zna ułamek ułamka treści. By publikację trafnie opisać, trzeba ją przeczytać i zrozumieć. I tu zaczyna się ból.
2. Bibliotekarze są szkoleni w językach informacyjno-wyszukiwawczych - jednakże sami oni narzekają na ich "pustotę", kategorie są zbyt ogólne, udziwnioną składnię i odpytanie w średnim zbiorze dokumentów zwraca sporo odpowiedzi, jeśli w ogóle. Owszem można stosować coraz precyzyjniejsze określniki, ale - trzeba się na przedmiocie dzieła znać lub dość dokładnie je przejrzeć - by zrobić to trafnie. Można precyzyjnie stosować wiele haseł - ale na to trzeba mieć sporo czasu.
3. Dodatkową funkcją jęz. informacyjno-wyszukiwawczych jest - informowanie. Tj. prócz zaczepienia dla wyszukiwań, wyświetlenie słownika haseł ma poinformować użytkownika o jakichś nieznanych obszarach wiedzy lub być przynajmniej podpowiedzią do dalszych poszukiwań. Stosuje sie też system adnotacji, odsyłaczy, itp. by załatwić sprawę synonimów, wyrazów bliskoznacznych, itp. Konstruuje sie więc język sztuczny, który jest zbliżony do naturalnego, ale nim nie jest. Ma on ambicję "pokryć" znaczeniami uniwersum znaczeń dokumentów. Czy to się da - biorąc pod uwagę choćby dynamikę wiedzy czy kultury?
4. Zaczynają się wątpliwości czy użytkownicy w ogóle używają tego wszystkiego co im bibliotekarze przygotowali. Wydaje się że nie - jeśli tylko mogą - zadają pytania językiem naturalnym, oczekując by system biblioteczny ich "rozumiał", a nie by oni musieli się uczyć jego.
Otóż "dwazerowe" klasyfikowanie, chcąc ominąć ręczną robotę rzuca to wszystko A)śledzącym użytkownika maszynom. Stąd też "użytkownicy, którzy kupili to/oglądali to/poszli tam - kupili także tamto/obejrzeli tamto/poszli tam".
Każdy ruch myszą przędzie sieć znaczeń, którą mogą podążać inni, nawet jak ścieżki wcześniej nie znali.
B) Tagującym pasjonatom. Pojedynczy tag to "znaczenie subiektywne", lecz jeśli zostanie potwierdzony przez następnego taggera - i kolejnego - zaczyna on nabierać charakteru coraz bardziej intersubiektywnego, czyli może stanowić punkt komunikacji między użytkownikami oraz punk zaczepienia wyszukiwań. I może zawierać nowe znaczenia, które z czasem odkrywają użytkownicy.
Ostatnio w dyskusji z kolegami, którzy programują nasze BC - padł jeszcze jeden pomysł - by dla publikacji faktograficznych, źródłowych pozyskiwać słowa kluczowe poprzez zliczanie maksymalnych wystąpień w tekście słów znaczących (a więc bez spójników, zaimków, itp). Oczywiście na czystym tekście. Taki zbiór, poprawiony zmoderowany przez redaktora, mógłby dawać dość trafne klucze. Ale pełny tekst to przyszłość, choć już teraz jest w BC wiele tekstów digital born.
Zatem wydaje mi się, że w praktyce bibliotekarskiej, ową "zbiorową mądrość" można zręcznie wykorzystywać, bez specjalnie utopijnych, romantycznych uniesień związanych z "bezinteresownymi społecznościami"
Remigiusz Lis edytował(a) ten post dnia 25.09.07 o godzinie 23:38