Простейший HTML DOM парсер на PHP

Сегодня вы узнаете о простейшем HTML DOM парсере на PHP. Данный скрипт написан на PHP5+, поддерживает невалидную HTML разметку, и самое главное, с ним очень просто работать.

Скачать (.zip, 336 Кб)

Описание, Требования & Особенности

  • HTML DOM парсер, написанный на PHP5+, позволяет очень просто управлять структурой и данными HTML!
  • Для работы скрипта требуется установленный PHP 5+.
  • Есть поддержка невалидного HTML кода.
  • Есть возможность обращаться к селекторам на странице, как в jQuery.
  • Присутствует возможность извлекать содержимое HTML в одну строку.

Быстрый старт

[w2hideshow]

  • Как получить HTML элемент?

  • Как изменить HTML элементы?

  • Извлечение содержимого из HTML

  • Зачистка Slashdot!

Как создать HTML DOM объект?

  • Быстрый способ

  • Объектно-ориентированный способ

Как найти HTML элементы?

  • Основы

Как получить доступ к атрибутам HTML?

  • Получение, Установка и Удаление атрибутов

  • Магические атрибуты

  • Советы

Как обойти DOM дерево?

  • Основы

  • Обход DOM дерева

    Информацию по всем методам вы можете получить здесь.

    Метод Описание
    mixed
    $e->children ( [int $index] )
    Возвращает N-ый объект потомка, если установлен index, иначе возвращает массив элементов.
    element
    $e->parent ()
    Возваращает родительский элемент.
    element
    $e->first_child ()
    Возвращает элемент первого потомка, или null, если элемент не будет найден.
    element
    $e->last_child ()
    Возвращает элемент последнего потомка, или null, если элемент не будет найден.
    element
    $e->next_sibling ()
    Возвращает следующий соседний элемент, или null, если не будет такой найден.
    element
    $e->prev_sibling ()
    Возвращает предыдущий соседний элемент, или null, если не бидет такой найден.

Как сделать дамп содержимого DOM объекта?

  • Простой способ

  • Объектно-ориентированный способ

Как настроить поведение парсинга?

  • Обратные функции


Оставить комментарий