Jericho HTML Parser jest biblioteką Javy umożliwiającą analizę i manipulowanie dokumentem HTML, również po stronie serwera. Jericho HTML Parser udostępniony jest na licencji LGPL.
Biblioteka wyróżnia się spośród innych parserów HTML następującymi cechami:
- Nie jest generowane drzewo parsowania dla całego dokumentu. Tekst źródłowy jest przeszukiwany tylko dla znaczników związanych z bieżącą operacją. Pozwala to na analizę dokumentów zawierających niepoprawny lub źle sformatowany kod HTML.
- Jericho HTML Parser daje możliwość modyfikacji tylko wybranego segmentu bez konieczności poprawiania całego dokumentu. Czytaj dalej Darmowy parser HTML dla jezyka Java