konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Chcialbym zaprosic wszystkich zainteresowanych do udzialu w ewaluacji technologi semantycznych i spolecznych zaimplementowanych w bibliotece cyfrowej JeromeDL [ http://jeromedl.org/ ].

JeromeDL powstaje na bazie wspolpracy DERI Galway [ http://deri.ie/ ] i Politechniki Gdanskiej, w ramach prowadzonej przeze mnie grupy Corrib Cluster [ http://corrib.org/ ].

Z gory dziekuje za zainteresowanie i zapraszam pod adres http://q.digime.name/ w celu wziecia udzialu w ewaluacji

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Jak to działa?

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Joanna S.:
Jak to działa?

Jezeli chodzi o dzialanie samej biblioteki JeromeDL to idea jest taka zeby dostarczyc uzytkownikowi caly tabun mozliwych rozwiazan do wyszukiwania informacji. Calosc jest wspierana przez silnik semantyczny/asocjacyjny, czyli mozliwe jest znajdowanie ksiazek, artylow wg kryteriow ktore do tej pory nie byly mozliwe - np. nowe publikacje studentow prof. Decker. Prosze zauwazy ze duza role odgrywa tutaj tez informacja o tzw profilu spolecznym - uzytkownicy i autorzy (bo nie ma pomiedzy tym rozroznienia) tworza siec spoleczna. Jednym z rozwiazan jest tez nowatorski system zarzadzania i wymiany zakladek. Wiecej informacji pod adresem http://www.jeromedl.org/guide/ oraz (prezentacja najnowszych rozwiazan) http://q.digime.name/jeromedl-tutorial.mov [30MB] i http://q.digime.name/jeromedl-tutorial.pdf [3MB].

Zas co do samej ewaluacji. Sklada sie z kilkunastru krokow. Najpierw trzeba sie zarejestrowac w systemie (evaluation apparatus), potem wypelnic pierwsza ankiete na ogolne tematy zwiazane z bibliotekami cyfrowymi. Nastepnie pierwsze zadanie to poznac lepiej jedna z dwoch bibliotek (ktora zostala przydzielona automatycznie w czasie rejestracji) JeromeDL albo referencyjny DSpace - sa w tym celu przedstawione zadania do wykoania, m.in. zarejestrowac sie do systemu - czas na zabawe to conajmiej 6h - bo dopiero wowczas pojawi sie dostep do drugiej ankiety - zwiazanej z tym zadaniem. Po dalszych 3h (to sa czasy minimalne - wiec mozna wrocic nastepnego dnia) mozemy przejsc do kolejnego zadania - tym razem system zadaje pytanie z dziedziny psychologii w internecie (opracowane przez moja kolezanke z PG) - na odpowiedz mamy 45 min (mozna po polsku), a w tym celu nalezy sie posluzyc biblioteka cyforwa ktora zostal przydzielona zeby znalezc odpowiedz, i przedstawic liste artykulow ktore dotycza tego pytania. Po zakonczeniu testu (dokladnie 45 min od rozpoczecia) uaktywnia sie kolejna ankieta - po raz kolejny "badanie satysfakcji" uczestnika. Nastepnie jezeli wylosowany byl JeromeDL kolejne zadanie to polaczenie sie z innymi osobami w sieci spolecznej, oraz wypelnienie kolejnej ankiety.
Po 6h od pierwszego pytania pojawia sie kolejne (tj jest mozliwosc pobrania pytania - i ponownie mozna zrobic to pozniej o dowlnie wybranej porze) - ta sama procedura. W przypadku JeromeDL do dyspozycji dostepne sa dodatkowe uslugi - tym razem spoleczne - jak wymiana zakladek, komentowanie i ocenianie artykulow, wspolpraca przy przegladaniu biblioteki. Kolejna ankieta sprawdzajaca nasza opinie na temat ostatniego zadania.
I znowu conajmniej 6h przerwy - po nim ostatnie pytanie. Ta sama procedura - tym razem w JeromeDL pojawiaja sie rekomendacje dla kazdego artykulu (mozna sobie zmienic ich tryb dzialania), oraz w naszych zakladkach (Waznie zeby w czasie 2 zadania cos do tych zakladek wrzucic - inaczej ciezko jest obliczyc rekomendacje). No i znowu - ankieta ;)
Na tym konczy sie glowna czesc ewaluacji. Jezeli ktos sie nie zniechecil - to zapraszamy za miesiac na ostatnie zadanie - tym razem trzeba przypomiec sobie odpowiedz na jedno z wczesniejszych pytan.
Skromna nagroda [ http://blog.corrib.org/?p=23 ] dla wytrwalych na zakonczenie :)

Mam nadzieje ze udalo mi sie odpowiedziec chociaz na czesc z watpliwosci. Jezeli nie to zapraszam do kontaktu - email/GoogleTalk sebastian.kruk@gmail.com

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Zbyt skomplikowane i czasochłonne :/Joanna S. edytował(a) ten post dnia 15.01.08 o godzinie 11:00

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Joanna S.:
Zbyt skomplikowane i czasochłonne :/Joanna S. edytował(a) ten post dnia 15.01.08 o godzinie 11:00

Moze ja tylko nie potrafie tego za prosto wytlumaczyc ?
Cala procedura nie powinna zajac dluzej niz 3h lacznie - przyczym rozpisane na jakies 3-4 dni.

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Po prostu nie bardzo rozumiem, do czego to mi się może przydać... czy po tej całej procedurze uzyskam jakieś lepsze możliwości? Korzystam z polskich bibliotek cyfrowych i to, co mnie w nich najbardziej denerwuje, to trudność wyszukiwania czegokolwiek.

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Joanna S.:
Po prostu nie bardzo rozumiem, do czego to mi się może przydać... czy po tej całej procedurze uzyskam jakieś lepsze możliwości? Korzystam z polskich bibliotek cyfrowych i to, co mnie w nich najbardziej denerwuje, to trudność wyszukiwania czegokolwiek.

Taki jest zamysl wprowadzenia uslug spolecznych i semantycznych. Chodzi o to zeby wrocic do czasow kiedy jest bibliotekarz ktory moze nam pomoc. Poniewaz w bibliotekach cyfrowych jest to technicznie niewykonalne zeby byl pelnoetatowy bibliotekarz odpowiadajacy na pytania - wiec trzeba go czyms zastapic.
Semantyka powoduje ze komputery zaczynaja "rozumiec" informacje ktora przetwarzaja (np. w normalnej bibliotece zapytanie o "innych ludzi ktorzy pisali o podobnej tematyce co B. Prus" - jest prawie ze niemozliwe - przynajmniej nie w jednym kroku).
Techniki socjalne umozliwiaja dzielenie sie wiedza i doswiadczeniem. Nie mowie tu o prostych i popularnych SN - jak nasza-klasa.pl czy podobne. Ale o rozwiazaniach w stylu wspoldzielenia sie zakladkami (del.icio.us), rekomendacji informacji (w naszym rozumieniu to na dobra sprawe tylko chyba Twine), czy wspolnego wyszukiwania informacji (tego jeszcze nie spotkalem).

Rozwiazan jest cala gama - problem polega na tym ze nalezy je teraz rozwijac we wlasciwym kierunku, a moze niektore wrecz porzucic? Nie dowiemy sie jednak co robic bez pomocy osob ktore chca cos zmienic w swiecie bibliotek cyfrowych.

Dla mnie osobiscie jest to zamkniecie pewnego okresu badan. Dalsza praca mozliwa bedzie tylko dzieki zrozumieniu co zrobic lepiej, czego brakuje, a co zostalo poprostu skopane.

Pierwsze linie kodu do JeromeDL pisane byly jeszcze na Politechnice Gdanskiej, ktora do dzis ma 3 instalacje, m.in. http://www.wbss.pg.gda.pl/ gdzie jest nawet jeden multimedialny podrecznik dla studentow architektury :) Niestety, zabralo dobrego marketingu i pola do rozwoju. Mam nadzieje ze teraz z znaczniej bardziej dojrzalym rozwiazaniem uda nam sie rozpropagowac JeromeDL rowniez w Polsce.

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

A propos PG - wolałabym, żeby stworzono tu przynajmniej standardową bibliotekę cyfrową na systemie dLibra - wstyd, żeby taki ośrodek akademicki jak Gdańsk nie udostępniał swoich bibliotek przez internet.

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Joanna S.:
A propos PG - wolałabym, żeby stworzono tu przynajmniej standardową bibliotekę cyfrową na systemie dLibra - wstyd, żeby taki ośrodek akademicki jak Gdańsk nie udostępniał swoich bibliotek przez internet.

Biblioteka cyfrowa jest - nawet 2:
http://www.wbss.pg.gda.pl/ (postawilem ja 5 lat temu, caly czas - z tego co slyszalem - zasilana starodrukami ktore sa skanowane na PG - wszystko co jest zeskanowane jest tam)
http://kbc.pg.gda.pl/ (ciagle skromna - ale to nie jest ode mnie zalezne)

Z tego co wiem to trwaja prace nad jakims ogolno-pomorskim projektem biblioteki cyfrowej.

A co do dLibra - to z calym szacunkiem dla kolegow z PCSS, ktorych znam osobiscie i bardzo szanuje - nie jest ona jeszcze standardem. DSpace, FEDORA, Greenstone, czy E-Prints - to co innego :) [ale moze to tylko moja skrzywiona miedzynarodowa perspektywa ;( ]

Aj, wlasnie widze ze sie powtorzylem bo juz wczesniej wspomialem WBSS ... ;)

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Nie wygłupiaj się - kaszubska ma 6 sztuk publikacji i się nie rozwija od wielu miesięcy, a cyfrowa PG 190 sztuk i to w jakimś dziwnym formacie, którego nie udało mi się jeszcze ani razu ściągnąć i zapisac do korzystania w domu.

Porównaj z którąkolwiek biblioteką cyfrową innych ośrodków akademickich, w których zasobów przybywa w tempie kilkudziesięciu sztuk tygodniowo i są to zazwyczaj zbiory o tyle ciekawe, że niedostepne w normalnych bibliotekach.

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Joanna S.:
Nie wygłupiaj się - kaszubska ma 6 sztuk publikacji i się nie rozwija od wielu miesięcy, a cyfrowa PG 190 sztuk i to w jakimś dziwnym formacie, którego nie udało mi się jeszcze ani razu ściągnąć i zapisac do korzystania w domu.

Porównaj z którąkolwiek biblioteką cyfrową innych ośrodków akademickich, w których zasobów przybywa w tempie kilkudziesięciu sztuk tygodniowo i są to zazwyczaj zbiory o tyle ciekawe, że niedostepne w normalnych bibliotekach.

No masz racje - ja nie twierdze ze oni maja tam tony starodrukow - ale jak juz pisalem to juz nie moja wina - nie pracuje na PG od 4 lat - najwidoczniej nie maja mocy przerobowej zeby skanowac; szczerze powiedziawszy nie wiem.

Co do dziwnego formatu? Starodruki sa udostepniane przez applet java, pozostale to PDF. Jest to dosc standardowe. Z tego co slyszalem to maja nam dopisac modul do DeJaVu - czyli tego co uzywa dLibra. Zdecydowanie to mniej standardowe, ale wiem ze zyskuje popularnosc.

Powiedz mi z ktorym zasobem mialas problemy - to sprawdze - moze cos im padlo?

Ale ogolnie to sie z Toba zgadzam - brakuje jakiegos wiekszego "zycia" na Pomorzu; i to nie tylko w zakresie bibliotek cyfrowych :(

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Może jakiś nowy wątek na ten temat? może inni się przyłączą :)

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Joanna S.:
Może jakiś nowy wątek na ten temat? może inni się przyłączą :)

Wiesz - tak daleko to pociagnelismy ze ja bym tutaj nawet dwa watki widzial (conajmniej) :)
1) biblioteki cyfrowe na pomorzu - czego nam brakuje
2) dostep do dobr dziedzictwa narodowego - jak nalepiej dotrzec "pod strzechy" ?

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

zakładaj więc - obydwoma tematami jestem żywo zainteresowana :)

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Joanna S.:
zakładaj więc - obydwoma tematami jestem żywo zainteresowana :)

zrobione ;)
Andrzej Góralczyk

Andrzej Góralczyk Poprawiam
przedsiębiorstwa.
Właściciel portalu
Dyrekcja.pl

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Obejrzałem sobie plan tego badania i zniechęciłem się. Za duże, nie wezmę udziału.

Przy tej okazji zrodziło się pytanie: dlaczego nie zaczęto od przeglądu standardów i rozwiązań, które sprawdziły się, a które nie? Na przykład jest już sporo opracowań wyjaśniających, dlaczego DSpace nie zyskało popularności, a np. taki ArXiv.org nadal jest świetny, mimo że sędziwy.

W bibliotekach cyfrowych piętą achillesową są rzeczywiście narzędzia dostępu. Albo nic nie można znaleźć, albo jeśli już, to trzeba ślepić po całej stronie, aby zorientować się, co można z tym zrobić (ściągnąć, tylko czytać, cytować w formatach standardowych itd.?)

No i ta semantyka. Od dziesięcioleci próbują ją wykorzystywać informatycy, bezskutecznie, no bo bez udziału fachowców od semantyki. I na razie prawda jest taka, że nie ma dobrego rozwiązania na automatyczną maszynkę informatyczną, która zastąpiłaby bibliotekarza-dziedzinowca. Więc nie należy go zastępować, jeśli zasoby chcemy wykorzystywać, a nie tracić z oczu w czeluściach repozytoriów. Informatyka wówczas może się zająć tym, do czego się nadaje, czyli do budowania narzędzi dostępu do DOBRZE OPISANYCH zasobów. Rozwiązanie mam, tylko brakuje mi rzecznika patentowego, który nie bałby się tematu.

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Andrzej Góralczyk:
Obejrzałem sobie plan tego badania i zniechęciłem się. Za duże, nie wezmę udziału.

Przy tej okazji zrodziło się pytanie: dlaczego nie zaczęto od przeglądu standardów i rozwiązań, które sprawdziły się, a które nie? Na przykład jest już sporo opracowań wyjaśniających, dlaczego DSpace nie zyskało popularności, a np. taki ArXiv.org nadal jest świetny, mimo że sędziwy.

W bibliotekach cyfrowych piętą achillesową są rzeczywiście narzędzia dostępu. Albo nic nie można znaleźć, albo jeśli już, to trzeba ślepić po całej stronie, aby zorientować się, co można z tym zrobić (ściągnąć, tylko czytać, cytować w formatach standardowych itd.?)

No i ta semantyka. Od dziesięcioleci próbują ją wykorzystywać informatycy, bezskutecznie, no bo bez udziału fachowców od semantyki. I na razie prawda jest taka, że nie ma dobrego rozwiązania na automatyczną maszynkę informatyczną, która zastąpiłaby bibliotekarza-dziedzinowca. Więc nie należy go zastępować, jeśli zasoby chcemy wykorzystywać, a nie tracić z oczu w czeluściach repozytoriów. Informatyka wówczas może się zająć tym, do czego się nadaje, czyli do budowania narzędzi dostępu do DOBRZE OPISANYCH zasobów. Rozwiązanie mam, tylko brakuje mi rzecznika patentowego, który nie bałby się tematu.

Chyba nie za bardzo zrozumialem - dlaczego wg Pana DSpace nie zyskal popularnosci? Smiem twierdzic ze to najbardziej popularna z bibliotek. E-Prints czy Greenstone depcza jej wszak po pietach, a na FEDORA wkracza ostro do akcji. DSpace 2.0 kiedy powstanie bedzie juz zupelnie inny - jesli wierzyc opracowaniom z przed roku gdzie analizowano kierunki rozwojwu.

Ze ewaluacja za dluga? Pewnie ze tak - ale z drugiej strony i tak nie jestem pewien czy jest w stanie wszystko wykazac. Dlaczego? Bo zeby poprawnie zadzialaly semantyka, profilowanie, i funkcje spoleczne - potrzeba wielu zasobow (to powiedzmy ze mamy), dobrze opisanych (no prawie), wielu ludzi (i juz jest wasko) i duzo czasu/interakcji (patrz - dlaczego ewaluacja jest taka dluga). Pana opinia, za ktora dziekuje, to tylko znak na to ze oprocz pracy nad sama biblioteka - trzeba jeszcze popracowac nad sama ewaluacja :)

Zaczalem wlasnie analizowac pierwsze wyniki - sa bardzo ciekawe. Dam znac jak bede mial juz je opracowane.

Co do semantyki - hmm - racja jezeli wziac po uwage cale lata AI, a na dodatek zle pojmowane cele - to mozna powiedziec ze badania trawaja juz dziesieciolecia. Ale tak na prawde Semantic Web, z caly swoim podejsciem do otwartosci informacji, ontologiami, itp - to nowa dziedzina. A juz zdazyle zaliczyc porazke, nieprawdaz? Bo nagle wszyscy mowia o Web 2.0, i tam widac potencjal.
Moje badania to obraz tego co stara sie promowac DERI - czyli polaczenie obu tredow, i wyciagniecie maksymalnie ile sie z tego da. Sadze wiec ze mamy szanse na stworzenie "elektronicznego bibliotekarza" w postaci spolecznosci wspieranej roznymi mechanizmami AI/Semantyka.

Pierwsze kroki na tym polu stawia wlasnie JeromeDL, ktory jest ucielesnieniem tych pomyslow jakie ja nazywam Semantic Digital Libraries. SemDL zyskuja powoli coraz wieksze grono zainteresowan. W tym roku zaproszona nas juz do JCDL z tutorialem. Przez ostatnie dwa lata na naszych tutorialach na JCDL2006, ESWC2007 i WWW2007 bylo calkiem sporo ludzi.

I zgadzam sie z Panem w jednym - to czego potrzebujemy jako bazy to **dobrze opisane zasoby**. Problem polega na tym ze opisy w stylu MARC21 to za malo. Dlaczego? Bo chociaz sa wielkie i szczegolowe - to nie sa w zadnym wypadku do "zrozumienia" przez maszyny (ani przez zwyklych ludzi), i nie dosc ze nie ma formalnych polaczen pomiedzy takimi metadanym, to jeszcze opisy w jezyku naturalnym potrafia czasami wystepowac w kilku jezykach jednoczesnie - sam widzialem tego przyklady dla starodrukow z WBSS (wbss.pg.gda.pl) gdzie opisy byly po polsku i po niemiecku, i nie byly to tlumaczenia.

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Sebastian Ryszard K.:
A co do dLibra - to z calym szacunkiem dla kolegow z PCSS, ktorych znam osobiscie i bardzo szanuje - nie jest ona jeszcze standardem. DSpace, FEDORA, Greenstone, czy E-Prints - to co innego :) [ale moze to tylko moja skrzywiona miedzynarodowa perspektywa ;( ]

Pozdrowienia z PCSS ;-)

Standardem na świecie dLibra pewnie nie jest ;-) choć uważam, że została już zauważona. Dowodem tego może być chociażby uwzględnienie jej obok wymienionych przez Ciebie systemów w rejestrze OAI UIUC. Poza tym nasze działania nie idą w kierunku światowej dominacji - to zostawiamy innym ;-)

Dawno temu, w 1999 roku gdy ruszała dLibra, podstawowym założeniem było opracowanie narzędzia pozwalającego na (ogólnie rzecz biorąc) łatwą budowę dobrych bibliotek cyfrowych. Szczegóły można poczytać tutaj. Wydaje mi się, że to co nam się udało z dLibrą osiągnąć obecnie jest czymś unikalnym nawet jak się patrzy z "międzynarodowej perspektywy" ;-) Mamy dynamicznie rozwijający się system rozproszonych bibliotek cyfrowych działający na obszarze całego kraju. Zasoby dostępne w tym systemie są w pewien wirtualny sposób zintegrowane (m.in. poprzez wyszukiwanie rozproszone). Te rozproszone biblioteki osiągnęły już taki etap rozwoju, że zaczynają stanowić dla nas platformę do budowy na nich kolejnych usług (np. Federacja Bibliotek Cyfrowych). W ciągu najbliższego miesiąca udostępnimy system sieciowego profilu czytelnika, który pozwoli czytelnikom na korzystanie ze wszystkich bibliotek cyfrowych tak, jakby stanowiły one jeden system - czytelnik będzie miał jedno konto i będzie miał cały czas pod ręką ulubione publikacje, swoje tagi itd.

A najlepsze moim zdaniem jest to, że udało się to wszystko osiągnąć na bazie otwartych standardów takich jako OAI-PMH. Dzięki temu nie trzeba mieć dLibry, żeby do takiej rozproszonej platformy bibliotek się włączyć. Obecnie kilka krakowskich uczelni przygotowuje swoje systemy tak, aby wspierały one niezbędne standardy i mogły współdziałać z pozostałymi bibliotekami cyfrowymi. Zresztą BCPK już zdaje się to nawet zrobiła.

Tak więc podsumowując - zamiast "standaryzować" poprzez jak największą liczbę instalacji konkretnego systemu, lepiej spojrzeć trochę dalej i budować spójny system pozwalający na wykorzystanie wielu różnych rozwiązań technicznych :-)

konto usunięte

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Marcin, masz szczera racje - i rzeczywiscie na polskim rynku - dLibra to istny monopolista :D
Co do uzywania otwartych rozwiazan w celu lepszego polaczenia - jestem za.
Problem polega na tym ze co chwile jest ich wiecej i wiecej, a OAI-PMH to tylko "najnizszy wspolny mianownik" (chociaz istotny). Ja tylko czekam na to az bazy RDF beda w koncu mogly konkurowac z SQL - bo jak na razie to tylko to nam wiaze w duzej mierze rece :(
Marcin Malinowski

Marcin Malinowski IT Security
Specialist

Temat: Zaproszenie do ewaluacji technologii semantycznych i...

Marcin Werla:
Poza tym nasze działania nie idą w kierunku światowej dominacji - to zostawiamy innym ;-)

Nie wierzę :-) Nie mów, że czasami nie planujecie sobie, jak Pinky i Mózg, opanowanie wszystkiego i zrobienie z PCSS centrum sterowania wszechświatem :-)

Następna dyskusja:

seminarium - PROBLEMY CYFRY...




Wyślij zaproszenie do