>Форум Mozilla Россия http://forum.mozilla-russia.org/index.php >Флейм http://forum.mozilla-russia.org/viewforum.php?id=14 >захват нужных текстовых данных со страницы и передача их в excel/word http://forum.mozilla-russia.org/viewtopic.php?id=54170 |
neAdmin > 16-03-2012 00:58:40 |
Не определился с разделом, пишу в флейм. Из web страницы нужны строки: Возможно аддон будет цепляться за особенности структуры страницы или за html код, не знаю? Посоветуйте в каком направлении двигаться если заблуждаюсь. |
Shura > 16-03-2012 10:42:38 |
ты сюда вообще не приплетай, он в таком деле не помощник. |
neAdmin > 16-03-2012 20:50:23 |
Shura пишет
Звучит. Я даже встретил несколько знакомых мне слов.... Попробую wget, может что получится, в остальном не силен(( |
hydrolizer > 17-03-2012 04:52:26 |
Shura пишет
Ну почему же. Учитывая одно из нововведений 11-й версии - очень даже помощник. Это, плюс нужный xpath query по странице должны дать нужные данные на выходе. Это, разумеется, если нет доступа к БД форума - иначе все делается намного проще, и совсем другими средствами. 17-03-2012 05:10:31 |
neAdmin > 17-03-2012 12:53:16 |
Наверно нужно уточнить немного. Доступа к базе данных действительно нет - проще не получится. По генерации таблицы excel, вовсе не обязательно чтоб это делал FF. Рас уж не получится сделать генерацию FFом, пускай по другому. Но тогда и от фокса вроде как не много толку, так как я и без него могу получить страницу с данными (нужными строками) вручную. У меня задача ставиться сэкономить время на моменте выдергивания нужных данных из кучи данных и формирования из них этикеток(лижбы можно было печатать) Если и можно как то пропарсить страницу(online или offline, не важно) то я технически не представляю как это делать. Изучать кучу манов нет времени. Если есть возможность изучить тему парсинга узконаправлено и практически, то я не знаю от куда начинать. Может посоветуете...? |
hydrolizer > 17-03-2012 13:06:52 |
neAdmin пишет
Разобрать DOM:
с помощью TreeWalker; с помощью XPath Queries. Я бы выбрал последний вариант разбора - он наиболее лаконичен и оптимален по быстродействию. |