Что HTML разбора библиотеки вы рекомендуете в Java

голоса
12

Я хочу, чтобы разобрать некоторые HTML для того, чтобы найти значения некоторых атрибутов / теги и т.д.

Что HTML парсеры вы рекомендуете? Любые плюсы и минусы?

Задан 25/08/2008 в 19:54
источник пользователем
На других языках...                            


3 ответов

голоса
12

NekoHTML , TagSoup и JTidy позволит разобрать HTML , а затем процесс с помощью инструментов XML, как XPath.

Ответил 25/08/2008 d 20:22
источник пользователем

голоса
7

Я попытался HTML Parser , который мертв просто.

Ответил 25/08/2008 d 19:55
источник пользователем

голоса
1

Нужно ли вам сделать полный разбор в HTML? Если вы просто ищете для конкретных значений в пределах содержимого (определенный тег / Param), то простое регулярное выражение может быть достаточно, и вполне может быть быстрее.

Ответил 25/08/2008 d 19:56
источник пользователем

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more