Krzysztof
Mierzejewski
SharePoint
Consultant
Temat: Pareser HTML (oferty dilerów otomoto)
Jakub Świegot:
Pojedź po prostu regexpami po stronie...
Same wyrażenia regularne są fajne dla XHTML. Dla HTML już nie, tutaj lepiej mieć parser na wzór tego używanego w rzeczywistych silnikach przeglądarek. Mi napisanie parsera rekursywno-zstępującego na modłę tego działającego w Gecko razem z unit testami zajęło 6 godzin. Może nie jest demonem szybkości (bo na zwykłym stosie przewijanym przy błędach niedomknięcia), ale parsuje tylko to co potrzebuję (olewa skrypty i style) i pozwala modyfikować DOM, a właśnie takie miałem wymaganie.