Darmowy parser HTML dla jezyka Java

JavaJericho HTML Parser jest biblioteką Javy umożliwiającą analizę i manipulowanie dokumentem HTML, również po stronie serwera. Jericho HTML Parser udostępniony jest na licencji LGPL.

Biblioteka wyróżnia się spośród innych parserów HTML następującymi cechami:

  • Nie jest generowane drzewo parsowania dla całego dokumentu. Tekst źródłowy jest przeszukiwany tylko dla znaczników związanych z bieżącą operacją. Pozwala to na analizę dokumentów zawierających niepoprawny  lub źle sformatowany kod HTML.
  • Jericho HTML Parser daje możliwość modyfikacji tylko wybranego segmentu bez konieczności poprawiania całego dokumentu. Czytaj dalej Darmowy parser HTML dla jezyka Java