Temat: Aplikacja która pobierze dane ze strony internetowej

Witam,
chciałabym się dowiedzieć co trzeba zrobić aby aplikacja wczytywała adres internetowy gdzie po wczytaniu wpisując informacje np. znaleźć firmę X na stornie http://pf.pl?

Na razie napisałam żeby program po wskazanym adresie URL wczytał zawartość strony ale niestety nie wiem co dalej trzeba zrobić aby móc to uzyskać
Czy jest jakiś cień szansy na skierowanie na właściwą ścieżkę ?

konto usunięte

Temat: Aplikacja która pobierze dane ze strony internetowej

HTTP post i get to słowa-klucze. Musisz znaleźć w swoim języku programowania metody na przygotowanie HTTP get lub post (w zależności od rodzaju formularza na stronie), a następnie pobrać stronę www, którą zwróci serwer w odpowiedzi na to żądanie.
Adrian C.

Adrian C.
projektant/programis
ta

Temat: Aplikacja która pobierze dane ze strony internetowej

Generalnie wygląda to tak jak opisał to kolega powyżej. Oczywiście o co dostaniesz w odpowiedz będziesz musiała obrobić.
Jeśli chcesz to zrobić dobrze to html należy przekształcić do formatu bardziej przyjaznego np. XML, tutaj przychodzi z pomocą: http://htmlcleaner.sourceforge.net/ , oczywiście jest wiele innych tego typu bibliotek. Następnie za pomocą XPATH należy wyłuskać dane albo przy użyciu transformaty XSLT i na wyjściu otrzymać xml z danymi, które Cię interesują. Jeśli chcesz się pobawić tutaj: http://web-harvest.sourceforge.net/ masz narzędzie które to wszystko robi, możesz nim popróbować. Nawet nie znając JAVA, ma fajne narzędzie GUI przydatne przy początkowych fazach pracy z web scraping' iem.

konto usunięte

Temat: Aplikacja która pobierze dane ze strony internetowej

Nie nazwałbym formatu XML szczególnie przyjaznym. Jeśli potrzebujecie biblioteki, która dobrze sobie radzi z HTML'em, to polecam Jericho: http://jericho.sourceforge.net/. Jeśli ktoś woli, można z niej też korzystać do wstępnego parsowania i czyszczenia HTML'a.
Adrian C.

Adrian C.
projektant/programis
ta

Temat: Aplikacja która pobierze dane ze strony internetowej

Mocno wiekowe to jericho. Dlaczego format XML nie nazwałbyś przyjaznym. Jak w ogóle widzisz proces wyłuskiwania danych ze stron internetowych? Zazwyczaj jak miałem takie zadanie starałem się sprawę sprowadzić do XML'a z interesującymi mnie danymi i wtedy sobie go sparsowac/zmapowac na model po stronie java.

konto usunięte

Temat: Aplikacja która pobierze dane ze strony internetowej

yawn ...
Łukasz Lech:
Nie nazwałbym formatu XML szczególnie przyjaznym. Jeśli potrzebujecie biblioteki, która dobrze sobie radzi z HTML'em, to polecam Jericho: http://jericho.sourceforge.net/. Jeśli ktoś woli, można z niej też korzystać do wstępnego parsowania i czyszczenia HTML'a.



Wyślij zaproszenie do