Paweł
Nowicki
Project Manager,
Programista PHP
Temat: Powrót do SimpleHtmlDOM - problem już na starcie
Witam, od rana bawię się cURL-em a jak wiadomo gdzie cURL tam i parser. Moim celem jest pobranie wszystkich odnośników zawierających id w stylu: id=thread_title_xxxxxx gdzie xxxxxx to dowolnej długości ciąg cyfr.Pobrałem więc stronę cURL-em, zapisałem do zmiennej, za pomocą echa wyświetla się idealnie.
Dalej parsuję stronę:
$html = str_get_html($site);
Sprawdzenie kodu:
var_dump ($html);
i zonk ponieważ wyświetla mi się multum linijek kodu w stylu:
object(simple_html_dom)#3 (23) { ["root"]=> object(simple_html_dom_node)#4 (9) { ["nodetype"]=> int(5) ["tag"]=> string(4) "root" ["attr"]=> array(0) { } ["children"]=> array(2) { [0]=> object(simple_html_dom_node)#5 (9) { ["nodetype"]=> int(6) ["tag"]=> string(7) "unknown" ["attr"]=> array(0) { } ["children"]=> array(0) { } ["nodes"]=> array(0) { } ["parent"]=> *RECURSION* ["_"]=> array(2)...
a nie powinien mi się ładnie wyswietlić kod parsowanej strony ?
Pobranie odnośników:
$titles = $html->find('a[id^=thread_title_]');
również nie działa i zwraca wyniki podobne do tych w/w
Miałby ktoś pomysł jak to naprawić?
Pozdrawiam