Сегодня вы узнаете о простейшем HTML DOM парсере на PHP. Данный скрипт написан на PHP5+, поддерживает невалидную HTML разметку, и самое главное, с ним очень просто работать.
парсинг
Руководство: Как создать паука-парсера на PHP
Парсер, паук, бот, робот или все равно как вы его назовете — это программа, которая автоматически получает (парсит) и обрабатывает данные с сайтов.
Например, Google индексирует и ранжирует страницы с помощью многочисленных пауков и ботов. Кроме того, есть проверяльщики ссылок, HTML валидаторы и веб-шпионы. Да, в этой статье мы вам покажем, как сделать своего веб-шпиона на PHP.