xandeadx.ru Блог музицирующего веб-девелопера

Drupal → Parser и иерархические термины

Опубликовано в

Добавил в Parser возможность создавать иерархию из терминов с помощью функции parser_create_terms_hierarchy($terms, $vocabulary).

Пример использования при парсинге товаров с ulmart:

// Находим список категорий в хлебных крошках
$categories = array();
foreach ($doc->find('.b-crumbs span[itemprop="title"]') as $element) {
  $categories[] = pq($element)->text();
}
 
// Создаём иерархию
$categories = parser_create_terms_hierarchy($categories, 'categories');
 
// Возвращаем tid последней категории
end($categories);
return key($categories);

Результат парсинга одного товара:

Список терминов

P.S.:

Следующий код:

$categories = array();
foreach ($doc->find('.b-crumbs span[itemprop="title"]') as $element) {
  $categories[] = pq($element)->text();
}

можно заменить на:

$categories = parser_get_pqelements_values($doc, '.b-crumbs span[itemprop="title"]', 'text');
Написанное актуально для Parser 2
Похожие записи

Комментарии RSS

Парсер - это хорошо... :)
Есть у меня к слову парсер. Возникла идея вынести его на другой сервер (отдельно от сайта). Вроде, к базе сайта при сохранении ноды подключиться можно, но как быть с картинками? Как их сохранять по ходу на сервере сайта? Можно сохранять картинки на сервере парсера, но тогда что нужно прописать в базу сайта, чтобы сайт показывал картинки с другого сервера? К слову, я не использую модуль media.

P.S.: Парсер мой. Теоретически можно или это больная фантазия?

Оставить комментарий

Содержимое этого поля является приватным и не будет отображаться публично. Если у вас есть аккаунт в Gravatar, привязанный к этому e-mail адресу, то он будет использован для отображения аватара.
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Доступные HTML теги: <a> <i> <b> <strong> <code> <ul> <ol> <li> <blockquote> <em> <s>
  • Строки и параграфы переносятся автоматически.
  • Подсветка кода осуществляется с помощью тегов: <code>, <css>, <html>, <ini>, <javascript>, <sql>, <php>. Поддерживаемые стили выделения кода: <foo>, [foo].

Подробнее о форматировании