>Форум Mozilla Россия http://forum.mozilla-russia.org/index.php >Флейм http://forum.mozilla-russia.org/viewforum.php?id=14 >Есть ли такая программа? http://forum.mozilla-russia.org/viewtopic.php?id=22202 |
Logo > 21-03-2008 12:26:16 |
Нужна программа, чтобы обходила все html фалы в папке, и в них удаляла все элементы, у которых display:none. Желательно не на IE движке. |
krigstask > 21-03-2008 13:26:31 |
Это задача для несложного сценария на Python/PHP/Perl |
Logo > 21-03-2008 19:57:04 |
krigstask 'несложным' сценарием неполучится. Такой скрипт должен загрузить, распарсить таблицы стилей, HTML валидатор короч как минимум получется. Я иногда сохраняю сайты(прогой WinHTTrack)- различные книги, руководства. Чтобы потом читать на КПК. Удобно использовать CSS, чтобы отрубить рекламу и прочий мусор, но мобильные браузеры слабо его держат(IE особенно), кроме того страницы и так медленно рендрендятся, хорошо бы мусор совсем удалить. |
krigstask > 21-03-2008 23:47:17 |
Logo |
Al_H > 22-03-2008 01:00:26 |
Если без движка браузера, то нужно сделать маленькую программку, которая бы парсила HTML, выстраивала дерево объектов, затем парсила CSS в масштабах CSS2 или CSS2.1+часть CSS3, и, учитывая все селекторы, их вложенность, перекрытие стилей и так далее, рассчитывала display: none; для конкретных элементов, при этом для начала должны собираться все стили по всем linkам, importам, и конечно же контейнерам style и атрибутам style= и корректно рассчитываться весы элементов и порядок обработки и important, после чего делается вывод о порядке перекрытия стилей и уже вычисляется стиль для конкретного элемента. Затем мы все эти элементы собираем, и либо распарсиваем HTML и не нарушая вложенности тэгов удаляем, либо работаем с уже распарсенным, удаляя узлы из дерева тэгов. Не забывая при этом весь остальной код осталять в неприкосновенности. Раз плюнуть. |
Logo > 30-03-2008 16:54:17 |
Кстате можно сделать комбинированным PHP/JavaScript скриптом, и браузер тогда юзать любой. Вот кто бы еще сделал.. |
krigstask > 30-03-2008 17:25:50 |
Al_H А как это сделать через бразуер? Хотя бы алгоритм поясните. Есть альтернативное предложение: открывать страницы в Fx/Opera и "печатать" их в pdf. После чего смотреть уже в таком виде. |
Logo > 30-03-2008 18:04:21 |
Это почти не облегчает задачи(если без браузера), одни селекторы чего стоят.
Это будет изображение, на сколько я понимаю, по этому не подойдет. Т.к. экран у КПК/смарта маленький, придется елозить в лево-право, что жуть не удобно.
В DOM должно быть свойтво типа .style.display, яваскрипт будет загружать передаваемый пхп файл во фрейм, удалять все элементы с этим свойством ='none', и передавть обработанный код обратно пхп через POST. |
Infocatcher > 30-03-2008 18:13:48 |
Тогда уж |
krigstask > 30-03-2008 18:49:16 |
Logo
Это смотря какие селекторы. По-моему, обычно для блокировки используются несложные конструкции.
С каких это пор PDF у нас — изображение? Хотя, конечно, если PDF-читалка не умеет строчки переносить, тогда проблема есть.
Логично. Кстати, это полностью подходит под моё первое сообщение (-%Е |
Al_H > 30-03-2008 19:11:07 |
krigstask |
krigstask > 30-03-2008 19:40:24 |
Al_H Добавлено Sun Mar 30 19:42:57 2008 : |
Logo > 30-03-2008 21:29:14 |
Как раз наооборот, тут нужна вся мощь селекторов, ибо специальных атрибутов class и id мусор обычно не имеет.
Написал не подумавши, сохранение страницы совсем не подойдет, т.к. на выходе у нас html книга/мануал со ссылками, множеством страниц..
Там не просто список элементов, а селекторы, со всеми вытекающими...
В js не очень шарю.. |
krigstask > 30-03-2008 22:32:57 |
Logo
Хватит пугать меня уже словом «селекторы», я его не боюсь (-;Е
А. Ну тогда да. |
Logo > 30-03-2008 23:27:31 |
Ну вот хотябы писал такие правила
Поддержка селекторов должна быть полной, хорошо еще если + 3 версии. Это вовсе не простой скрипт. |
krigstask > 31-03-2008 01:19:39 |
Ну да, вторая запись — дело серьёзное. Но я с необходимостью таких конструктов не сталкивался никогда. А первая — элементарно |
Logo > 31-03-2008 08:24:56 |
Эт еще достаточно тривиально. Писалось чтоб это http://www.webix.ru/doc/html401 почиcтить. |
alleex88 > 03-04-2008 19:50:19 |
HTMLChanger ищи. Может заменять любой текст по заданым вхождениям в html файлах. |