Полезная информация

Многие проблемы быстрее решаются поиском по форуму и чтением FAQ, чем созданием новой темы и томительным ожиданием ответа.
  • Форумы
  •  » Флейм
  •  » захват нужных текстовых данных со страницы и передача их в excel/word

№116-03-2012 00:58:40

neAdmin
Участник
 
Группа: Members
Зарегистрирован: 18-12-2011
Сообщений: 9
UA: Firefox 10.0

захват нужных текстовых данных со страницы и передача их в excel/word

Не определился с разделом, пишу в флейм.
Как реализовать задачу.
Есть некий форум совместных покупок. В определенный момент мне необходимо печатать этикетки заказов участников форума.Сам же форум позволяет выводить на печать отчет о собранных заказах и их участниках в формате csv. Но в этом файле, для этикеток очень много лишнего и не хватает нужных данных. Зато есть страница отчета на которой есть все необходимые строки.
Подумал может можно аддон для FF создать, или может что то уже есть подходящее? Там все нужные строки находятся на одной странице. Из всей страницы нужно отфильтровать и выдернуть как то нужные строки и сформировать из них excel/word таблицу. Вот пример таблицы
Скрин web страницы тоже прилагаю. извиняюсь за корявость, наверно будет понятно.

Из web страницы нужны строки:
1. Ник пользователя.
2. Его номер телефона.
3. Город:/район ЕЦ.
4. Название закупки.

Возможно аддон будет цепляться за особенности структуры страницы или за html код, не знаю? Посоветуйте в каком направлении двигаться если заблуждаюсь.

Отсутствует

 

№216-03-2012 10:42:38

Shura
Участник
 
Группа: Members
Зарегистрирован: 06-05-2006
Сообщений: 1205
UA: Firefox 11.0
Веб-сайт

Re: захват нужных текстовых данных со страницы и передача их в excel/word

[firefox] ты сюда вообще не приплетай, он в таком деле не помощник.
Берешь любой менеджер закачек, например wget, выкачиваешь им нужные страницы и парсишь как тебе хочется.
Я сам написал бытакое на perl, вместе с закачками, парсингом и вставкой куда надо.


FreeBSD 8.2, IceWM

Отсутствует

 

№316-03-2012 20:50:23

neAdmin
Участник
 
Группа: Members
Зарегистрирован: 18-12-2011
Сообщений: 9
UA: Firefox 10.0

Re: захват нужных текстовых данных со страницы и передача их в excel/word

Shura пишет

ты сюда вообще не приплетай, он в таком деле не помощник.Берешь любой менеджер закачек, например wget, выкачиваешь им нужные страницы и парсишь как тебе хочется.Я сам написал бытакое на perl, вместе с закачками, парсингом и вставкой куда надо.

Звучит.  Я даже встретил несколько знакомых мне слов.... Попробую wget, может что получится, в остальном не силен((

Отсутствует

 

№417-03-2012 04:52:26

hydrolizer
Участник
 
Группа: Extensions
Зарегистрирован: 22-07-2009
Сообщений: 1945
UA: Firefox 11.0

Re: захват нужных текстовых данных со страницы и передача их в excel/word

Shura пишет

[firefox] ты сюда вообще не приплетай, он в таком деле не помощник.

Ну почему же. Учитывая одно из нововведений 11-й версии - очень даже помощник. Это, плюс нужный xpath query по странице должны дать нужные данные на выходе. Это, разумеется, если нет доступа к БД форума - иначе все делается намного проще, и совсем другими средствами.
А вот генерация word/excel документа действительно к FF не имеет никакого отношения.

Добавлено 17-03-2012 05:10:31
Я сам написал бытакое на perl, вместе с закачками, парсингом
тут сразу вспоминается Jamie Zawinski

Отредактировано hydrolizer (17-03-2012 05:10:31)

Отсутствует

 

№517-03-2012 12:53:16

neAdmin
Участник
 
Группа: Members
Зарегистрирован: 18-12-2011
Сообщений: 9
UA: Firefox 10.0

Re: захват нужных текстовых данных со страницы и передача их в excel/word

Наверно нужно уточнить немного. Доступа к базе данных действительно нет - проще не получится. По генерации таблицы excel, вовсе не обязательно чтоб это делал FF. Рас уж не получится сделать генерацию FFом, пускай по другому. Но тогда и от фокса вроде как не много толку, так как я и без него могу получить страницу с данными (нужными строками) вручную. У меня задача ставиться сэкономить время на моменте выдергивания нужных данных из кучи данных и формирования из них этикеток(лижбы можно было печатать)

Если и можно как то пропарсить страницу(online или offline, не важно) то я технически не представляю как это делать. Изучать кучу манов нет времени. Если есть возможность изучить тему парсинга узконаправлено и практически, то я не знаю от куда начинать. Может посоветуете...?

Отсутствует

 

№617-03-2012 13:06:52

hydrolizer
Участник
 
Группа: Extensions
Зарегистрирован: 22-07-2009
Сообщений: 1945
UA: Firefox 12.0

Re: захват нужных текстовых данных со страницы и передача их в excel/word

neAdmin пишет

то я не знаю от куда начинать.

  1. Получить страницу в виде DOM-документа - либо через асинхронный XMLHttpRequest, либо просто взять готовый DOM страницы, загруженной в браузере.
  2. Разобрать DOM:

    1. процедурной рекурсией;
    2. с помощью TreeWalker;
    3. с помощью XPath Queries.

Я бы выбрал последний вариант разбора - он наиболее лаконичен и оптимален по быстродействию.
Есть, конечно, еще один вариант, который лично я бы никогда не стал использовать - парсинг разметки как текста с помощью регэкспов.

Отсутствует

 
  • Форумы
  •  » Флейм
  •  » захват нужных текстовых данных со страницы и передача их в excel/word

Board footer

Powered by PunBB
Modified by Mozilla Russia
Copyright © 2004–2020 Mozilla Russia GitHub mark
Язык отображения форума: [Русский] [English]