UnMHT - расширение для просмотра и сохранения файлов формата MHT (веб-архивов).

Страница установки

Отличное расширение, давно хотел, Sid тебе респект

Хорошая новость - akai (автор UnMHT) прикрутил в расширение интеграцию с боковой панелью Scrapbook. Идею предложил MySh, за что ему спасибо. Выглядит это как пункт "Сохранить как MHT" в контекстном меню. То есть по идее можно быстро сохранить страницу из Scrapbook в MHT, не открывая её предварительно.

Плохая новость - сохранение работает, но получившийся файл MHT нормально открывается только в FF. При попытке открыть в IE и Опере - не подгружаются картинки и CSS, отображается голый текст.

Это старые глюки FF при сохранении, или что-то не так в Scrapbook'е? Кто соображает - подскажите, в каком направлении копать?

Sid

Хорошая новость - akai (автор UnMHT) прикрутил в расширение интеграцию с боковой панелью Scrapbook... Выглядит это как пункт "Сохранить как MHT" в контекстном меню. То есть по идее можно быстро сохранить страницу из Scrapbook в MHT, не открывая её предварительно.

Очень хорошая новость!
Но! Тут тоже есть проблема — Scrapbook, к сожалению, не позволяет выделять больше одной страницы в боковой панели, а это значит, что если страниц много, то сохранять всё равно придётся каждую по отдельности, и пункт в контекстном меню хотя и облегчит задачу, но, увы, не слишком сильно (представьте, что у вас больше скопилось 500 страниц, которые надо перетащить в MHT для просмотра на Windows-ПК). Специально для такого выделения и массового экспорта в Scrapbook предусмотрен инструмент «Управление каталогами», но в нём уже этого контекстного пункта нет.

Плохая новость - сохранение работает, но получившийся файл MHT нормально открывается только в FF. При попытке открыть в IE и Опере - не подгружаются картинки и CSS, отображается голый текст.

Что ж, будем надеяться, что это временные трудности. Кстати, насколько я понимаю, akai — из Японии, как и автор Scrapbook, поэтому, я надеюсь, им будет проще договориться между собой, решая эту проблему.

у меня ссылки из архива лисой не открываются,а ИЕ открываются...лажа

Подскажите, что означают следующие настройки расширения:
-Держать кэш в памяти;
-Не ограничивать время распаковки;
-Игнорировать CSS;
-Ограничение кэша.
Что сие означает и как этим пользоваться?
Для чего нужен "Фильтр"?
И в чём разница между сохранением "исходный файл" и "текущее состояние"?

Считаю, что это одно из самых нужных расширений. MAF давно не обновлялся и с FF3b3 работать отказывается (может быть, только у меня). Спасибо!

-Игнорировать CSS;

Не сохранять стили на сколько я понял (оформление страницы)

И в чём разница между сохранением "исходный файл" и "текущее состояние"?

Исходный файл - это то как страница выглядит.
Текущее состояние, допустим изменили страницу средствами scrapbook убили рекламу... вот он и сохранит текущее состояние, т.е. подправленую страницу.

Что-то написано в описании про кеш было, что может зависнуть при открытии больших файлов или сохранении... вроде бы... короче оставь все как есть.

Спасибо, Timon :)
А можно как-нибудь запретить MAF-у открывать MHT файлы, чтобы по умолчанию, при их открытии использовался UnMHT? Я так понимаю, что в самом MAF-е такой настройки нет, но может какой файл надо подправить?

alexmac

Подскажите, что означают следующие настройки расширения:

На домашней странице расширения есть небольшая инструкция, правда на английском. Если кратко, то:

-Держать кэш в памяти;

Расширение кэширует веб-архивы в память, а если снять галочку - то на диск (в папку "UnMHT" в профиле).

-Не ограничивать время распаковки;

По идее должно убирать окошко с процессом открытия файла. На самом деле у меня никакой разницы. :)

-Игнорировать CSS;

Игнорирует CSS при открытии (не при сохранении) файла -> облегчает рендеринг страницы -> быстрее отображает содержимое.

-Ограничение кэша.

По истечении заданного времени кэш самоочищается.

Для чего нужен "Фильтр"?

Чтобы извлекать из веб-архива только определённые файлы. Я с этим не заморачивался, сразу отключил.

И в чём разница между сохранением "исходный файл" и "текущее состояние"?

Это имеет значение, если страница содержит браузерные скрипты.
Например, если на нашем форуме набрать текст в поле ответа и нажать "Предварительный просмотр", а потом попробовать сохранить этими двумя способами, то в "текущем состоянии" текст будет, а в "исходном файле" - нет. Другими словами, "текущее состояние" сохраняет страницу "как есть", а "исходный файл" - неизменённую скриптами страницу.

Добавлено Mon Feb 25 19:12:02 2008 :

А можно как-нибудь запретить MAF-у открывать MHT файлы, чтобы по умолчанию, при их открытии использовался UnMHT?

В настройках UnMHT на первой вкладке есть специальная кнопка.

Ух Ты!!!
Спасибо, Sid :):)
А про совместимость с MAF что-нибудь подскажете, ну... как отключить его использование при открытии архивов и заставить работать UnMHT?

Использование кнопки не помогло :(

При открытии mht файла диалог сохранения не выскакивает, но появляется "прогресс-бар" открытия mht расширением MAF и firefox зависает...

Добавлено Mon Feb 25 19:29:28 2008 :
Поставил версию 3.5.0, нажал кнопку и... пока всё работает :)

Очень, очень рад, что наконец таки появилось такое расширение!!! Проверил ,работает отлично! Быть может когданибудь появится и расширения для сохранения страниц в chm....

chm это настолько некультурный формат, что делать с ним совместимость очень сложно...

Но нас культурой не испугаешь

На новой машине поставил FF 2.0.0.12 и UnMHT.
Ну так эта парочка совсем не видит ни одного *.maff файла из моей огромной многолетней коллекции. :(

Что можно предпринять?
Или после перехода на третьего ЛИса - все эти данные для меня будут окончательно потеряны?

Tiger

совсем не видит ни одного *.maff файла из моей огромной многолетней коллекции.

UnMHT, как следует из названия, работает только с MHT. ИМХО, это логично - всё-таки самый распространённый формат веб-архивов, а в Windows вообще нативная поддержка. :)

Или после перехода на третьего ЛИса - все эти данные для меня будут окончательно потеряны?

В прошлом году автор MAF торжественно обещал выпустить версию, совместимую с FF3. Так что остаётся ждать.

Tiger

Что можно предпринять?

Можно попробовать вручную через Scrapbook переконвертировать... Но это долго и сложно, так как всё придётся вручную делать.

Имею unMHT 3.9.0, и firefox 2.0.0.12 на FreeBSD 6.3. Наблюдаются проблемы:
- В меню "File" пункт "Сохранить как MHT" неактивен.
- Если на панели статуса нажать на иконку unMHT и выбрать пункт "Исходный код", то код показывается, но кодировка устанавливается Japanese (Shift_JIS).

Есть идеи как исправить?

Попробовал, поставил. Одного не пойму - чем он отличается по функциональности от MAF? Последний, у меня также прекрасно сохраняет в формате mht, в чем фишка? Да и MAF из контекстного меню сохраняет, тут я что-то не обнаружил этого...

chm это настолько некультурный формат, что делать с ним совместимость очень сложно...

Интересно, в чем его "некультурность"? Этот формат компактнее mht в среднем в 2-3 раза, в зависимости от содержимого. Его единственный недостаток, это отсутствие прямого редактора, но многие и не редактируют сохраняемое.
А для сохранение в формате chm в Лисе существует прекрасное расширение FOX2CHM, автору респект.


P.S. Как оказалось, я отстал от жизни! Появилось аж два визуальных chm редактора и один из них очень даже ничего! Перехожу на сhm! :rock:

Интересно, в чем его "некультурность"? Этот формат компактнее mht в среднем в 2-3 раза, в зависимости от содержимого.

Две фразы логически не связаны. Культура не в компактности. Тут важна близость формата и его конкретных реализаций к идеальному подразумеваемому эталону помойки.

Тут важна близость формата и его конкретных реализаций к идеальному подразумеваемому эталону помойки.

Вот эта формулировка и наиболее близка к указанному "эталону". Ибо не имеет ничего общего с сутью.
Формат chm не только меньше по размеру. Он оставляет "живыми" все гиперссылки внутри архива. В mht это сплошь трупы. только поэтому даже mht не соперник chm. Единственный недостаток последнего был в сложности редактирования. Но появился CHM Editor и эта проблема практически решена.

Одного не пойму - чем он отличается по функциональности от MAF?

Тем, что работает.

Его единственный недостаток, это отсутствие прямого редактора, но многие и не редактируют сохраняемое.

Единственный? Тогда расскажите, пожалуйста, как в один-два щелчка мышью сохранить .chm в Linux из Firefox? Может быть, я чего-то пропустил?

В принципе ни первый ни второй вариант не являются хорошими по одной весьма простой причине, вот две ссылки:
1. http://filext.com/file-extension/MHT.
2. http://filext.com/file-extension/chm.
Да, это их компания-разработчик. Все права на эти форматы принадлежат понятно кому. Но это не самое их большое зло.
Самая их плохая особенность в том, что оба этих формата не используют стандартизированные технологии.

Например, CHM (Compiled HtMl, кстати) сжимает не ZIP-ом или другим известным архиватором, а своим собственным и по своим особым правилам — сжимает только текст, картинки разве что перепаковать в другой формат способен, но даже не пытается сжимать. Оглавление в нём вообще сделано отдельным файлом внутри структуры, а индекс слов вообще нужно генерировать и складывать рядом в другой файл (как Винда и делает). Этот формат вообще разрабатывался не для хранения веб-страничек или книг, а для создания интерактивной помощи в винде. Скажем спасибо тем глупцам, которые первыми догадались пихать в него книги и прочий хлам, из-за них этот формат приобрел популярность. Теперь с ним прихоодиться считаться. А ведь его никогда не делали для массового использования. Кстати, файл в этом формате в стандартном виндовом вьювере по сети вы не посмотрите, надо на винт качать (я был рад качать одно такое чудо на 300 Мб весом). Для сохранения в этот формат долгое время требовалась специальная утилита всё от той же фирмы. Корявая, кстати, очень, но всем приходиться пользоваться либо ею (чаще всего опосредованно, ибо напрямую это совсем страшно), либо искать альтернативные реализации, благо уже появились. Впрочем, формат был фигнёй, ей и остался по сей день. Попрошу раз и на всегда запомнить: этот формат НИКОГДА не разрабатывался для хранения книг, вебстраниц или чего бы то ни было ещё кроме виндового хелпа. То, что в нём это таки возможно хранить вовсе не значит, что так нужно делать.
Кстати, если вам попадётся в руки такой файлик с панелькой навигации сверху страницы, то знайте, что это не динамически сгенерированные по шаблону страницы и даже не динамически сгенерированная панель навигации, а заранее нагенеряченные страницы, в каждой из которых присутствует своя уникальная копия «панели навигации» в нужном состоянии. Если приспичит отредактировать — милости просим, не забудьте переписать эту панельку. Её обычно встраивают при помощи автогенераторов.

MHT (Microsoft HTml? :) не гораздо лучше, он так же разрабатывался для решения конкретной задачи в конкретной среде и никто никогда его не проектировал как мультиплатформенный формат для хранения веб-архивов. Просто позволяет сохранить 1 страницу в 1 файл, не более. Плюс его в том, что он таки проектировался для сохранения веб-страниц, а не для отображения интерактивного хелпа. Минус в том, что это нечто вроде текстового формата, в котором всё свалено в одну кучу без сохранения деления на отдельные файлы. Т.е. это просто свалка, чаще всего это огромная и неупорядоченная свалка, в которой текст перемешан с кодированными картинками и прочим мусором. В отличие от CHM для хранения более чем одной страницы не предназначался никогда и, на сколько я помню, такого делать просто не умеет.

Вывод — оба формата отвратительны, но из-за их распространенности с ними приходиться считаться ведь в первый сохраняют все пользователи ИЕ, а во втором уже есть масса книг. Именно поэтому уже существуют средства для их сохранения/открытия не только средствами стандартного виндового CHM-вьювера и браузера. Но ведь эти форматы от этого не становятся лучше, не так ли?

Чем был хорош MAFF? Он сохранял оргиниальную структуру страницы, каталогов и файлов (правда не вполне ровными средствами Фокса, все помним про сохранение картинок прилепленных черес CSS) и упаковывал её в стандартный ZIP. Его можно было просто распаковать любым архиваторои и открыть любым браузером, даже если он MAFF не понимал, ведь это были обычные файлы, упакованные всем понятным ZIP-ом.  CHM и MHT такого сделать просто так не позволяют. Для первого нужен специальный распаковщик, для воторого вообще надо учить браузер понимать эту кашу. Причём, либо при помощи стандартных библиотек винды (линуксоиды и яблоководы в экстазе), либо, опять же, искать/придумывать свой способ сохранения/открытия этого чудо-формата.

К сожалению формат не имел шансов. Какие могут быть шансы у формата, который реализовывался только как расширение для не самого популярного (к сожалению, но ведь это до сих пор правда) браузера в мире? Честно говоря я бы хотел, что бы MAFF вернулся, но только в кроссбраузерном решении. Т.е. что бы были плагины как для Фокса, так и для Оперы, и для Сафари, и для ИЕ. Хотя с начала хватит Фокса и ИЕ. Иначе у формата будущего не будет, пока Фокс не будет самым популяным браузером и пока не отвыкнут от CHM/MHT.

Если я правильно понял, то автор сего расширения сделал собственный код для загрузки/сохранения чудо-формата MHT, именно поэтому он пока совместим не со всеми его вариантами, в отличие от расширения MAFF, которое открывало MHT только в винде. Зато им теперь можно пользоваться на любой операционке.

Так я ж не говорю, что CHM заметно хуже, я говорю, что он плох.

Кстати, файл в этом формате в стандартном виндовом вьювере по сети вы не посмотрите, надо на винт качать (я был рад качать одно такое чудо на 300 Мб весом)

Это Вы про что? Потоковый... веб-архив?

Чем был хорош MAFF? Он сохранял оргиниальную структуру страницы, каталогов и файлов (правда не вполне ровными средствами Фокса, все помним про сохранение картинок прилепленных черес CSS) и упаковывал её в стандартный ZIP. Его можно было просто распаковать любым архиваторои и открыть любым браузером, даже если он MAFF не понимал, ведь это были обычные файлы, упакованные всем понятным ZIP-ом.  CHM и MHT такого сделать просто так не позволяют.

Ну вот если бы был упакованный ZIPом некривой формат, то есть что-то вроде сохраненной ScrapBookом папки, но в архиве, тогда можно было бы говорить о чем-то серьезном. Как в odt - текст оттуда можно достать и без офиса.

Это Вы про что? Потоковый... веб-архив?

Нет, конечно же. Обращение к документам внтури архива происходят по путям вроде: drive:\path\file.chm?file_inside.ext
Я точно не помню какой там именно разделитель, но проблема не в нём.
Пусть по сети приобретает вид: \\comp\path\file.chm?file_inside.ext
Так вот от путей такого формата вьюверу "рвет крышу". Если оглавление он отобразить еще способен, то странички по таким путям для него оказываются недоступными и он отображает стандартную страницу ИЕ, когда тот не может достучаться до указанного адреса.
Т.е. что бы посмотреть .chm-файл из локальной сети вам его обязательно надо скачать себе иначе можно только оглавление посмотреть. :)

Ну вот если бы был упакованный ZIPом некривой формат, то есть что-то вроде сохраненной ScrapBookом папки, но в архиве, тогда можно было бы говорить о чем-то серьезном. Как в odt - текст оттуда можно достать и без офиса.

Вот я и говорю, что по сути MAFF был замечательным форматом и то, что там что-то терялось было не его виной. Т.е. если прикрутить упаковку в ZIP к ScrapBook'у, то будет просто замечательно. Можно будет архивировать как отдельные статьи, так и группы статей.
Я одного в MAFF так и не понял. Зачем там был .rdf в корне и зачем содержимое сохранялось в папку со случайным цифровым именем, которое прописывалось в тот самый .rdf-файл. Есть архив, в его корне есть "index.html". Зачем ещё что-то? О_о

Впрочем, это всё оффтопик, можно продолжить дискуссию в топике про MAFF.

Т.е. что бы посмотреть .chm-файл из локальной сети вам его обязательно надо скачать себе иначе можно только оглавление посмотреть. :)

Если Вам не нужен потоковый формат, тогда отсутствие сетевой поддержки у HH некритично. Я ZIPы сначала скачиваю, потом смотрю, и PDFы тоже - не люблю вьюер открывать в окне браузера, по ряду причин.
Со СкрапБуком вот какая штука. Реальный выигрыш там даст упаковка нескольких папок в solid-архив вроде WinRAR или WinAce. Если это делать со всей базой, будет оооочень медленно, и довольно опасно. У меня, например, ScrapBook на 3 с чем-то гига.

Добавлено Mon Mar 31 21:24:55 2008 :
На диске, я имел в виду. Файлы меньше занимают.

Если Вам не нужен потоковый формат, тогда отсутствие сетевой поддержки у HH некритично. Я ZIPы сначала скачиваю, потом смотрю, и PDFы тоже - не люблю вьюер открывать в окне браузера, по ряду причин.

Это не потоковый формат. Имелась в виду ЛОКАЛЬНАЯ сеть и доступ к обычным расшаренным папкам. Такой доступ удобен, например, в сети крупной фирмы. Зачем каждому копировать этот файл себе, если все его итак могут прочитать по сети? У меня как раз такой случай. Потоковый формат подразумевает последовательное считывание всего файла с параллельным его воспроизведением. Тут же имеется в виду произвольный доступ к любой части файла, который и так обеспечивается протоколом и файловой системой в локальной сети. Например, если открыть ZIP-файл по сети тем же 7zip или WinRAR, то можно распаковать любой его фрагмент не скачивая весь файл. Теоретически формат такой доступ поддерживает, а практически его не поддерживает виндовый вьювер.

Со СкрапБуком вот какая штука. Реальный выигрыш там даст упаковка нескольких папок в solid-архив вроде WinRAR или WinAce. Если это делать со всей базой, будет оооочень медленно, и довольно опасно. У меня, например, ScrapBook на 3 с чем-то гига.

Сжатие в solid-архив действительно штука хорошая, но имеет несколько но:
1. Невозможен произвольный доступ к любому файлу в архиве. Его можно только эмулировать при помощи последовательной распаковки файлов, стоящих в архиве перед ним.
2. Невосстановимое повреждение одной из частей архива приведёт к потере всех данных после этой точки архива, положения могут спасти контрольные чексуммы... Но выигрыша в размере тогда почти не будет, впрочем будет выигрыш в надёжности.
Т.е. архивация в solid-архив имеет смысл только для создания резервной копии основного архива с чексуммами или для переноса части/всего архива между двумя скрапбуками. Если рассматривать в контексте формата для сохранения и постоянного доступа, то solid-сжатие будет не лучшим выбором. На малых фрагментах его эффективность будет мизерной, а на крупных оно будет существенно тормозить работу. Обычное сжатие у асимметричных алгоритмов архивации в данном случае выигрывает. Скорость сохранения замедлена, зато распаковка почти столь же быстра. При этом файл архива занимает немного места. Это, кстати, одна из причин, по которой тот же ODF и OOXML сжаты самым обычным ZIP-ом. Он обеспечивает достаточное сжатие при минимальных потерях в скорости распаковки и позволяет получить произвольный доступ к любому файлу без распаковки всех файлов перед ним.

Ещё раз и кратко:
1. Solid-сжатие -- для транспортировки/создания бэкапа.
2. Обычное сжатие -- для повседневного использования.

А под Flock заточить расширение автор может? :iron:

SoulWar
А UnMHT в принципе работает во Flock или нет?
То есть что подразумевается под словом "заточить" - просто вписать Flock в install.rdf или адаптировать неработающее расширение?

Ну ИМХО если автор скажет, что работает под флок тогда можно будет смело ставить, но поскольку этого не заявлено значит не факт, что работать будет правильно (без глюков).
На странице http://forum.mozilla-russia.org/viewtopic.php?id=21653 перечисленны все поддерживаемые браузеры и флока я среди них не вижу. А ставить опыты, чтоб потом ловить баги, как-то желания нет :angel: Не потому, что мне лень, а потому как не могу сказать, что  именно есть ошибка.

SoulWar
Автор сказал, что во флоке всё работает и добавил поддержку в install.rdf - можешь ставить UnMHT 3.9.1 (development version). :D
Других отличий от 3.9.0 нет.

Sid
Отличная новость.
Спасибо :beer:

Lain_13

Да, это их компания-разработчик. Все права на эти форматы принадлежат понятно кому. Но это не самое их большое зло.
Самая их плохая особенность в том, что оба этих формата не используют стандартизированные технологии.

MHT (Microsoft HTml?

1. MHT расшифровывается как MIME HTML
2. MHT стандартизирован как RFC 2557

Читаем http://en.wikipedia.org/wiki/MHTML

Unghost
Спасибо, что ткнул носом. Виноват. Если с CHM я опыт работы имел, то с MHT почти не разбирался и "делал предположения". Как обычно позиция "не пробовал но осуждаю" оказалась ложной, я пробовал, но мало и не изучал. :)
Впрочем, это не уменьшает общей кошмарности этого формата, даже если он стандартизирован. Для хранения нескольких страниц он не подходит, к тому же требует внешнего сжатия, так как это plain-text.
Т.е. поддержка этого формата это, конечно, хорошо, но это не тот формат, в котором стоит хранить web-архив. Совсем не тот формат.

подскажите пж-та, что делать, чтобы скрапбук сохрнял с сабжем )
возможно ли такое?

Клацнуть ПКМ по статье в списке скрапбука и выбрать "Save as MHT"?
Открыть страницу и сохранить?

В любом случае это не прокатит с многостраничными документами.

сабж не открывает нормально мхт файлы в линуксе  - билеберда нечитаемая получается( убунту 7.10, 8.04) :(

MHT - это вообще большое зло! Не раз и не на одной машине встречал, что эксплорер не может эти MHT открыть, так текстом и показывает. В том числе и у меня.
Наконец-то нашёл средство, которым таки могу смотреть mht. А вот сохранять в нём - ни за что не буду сам, и призываю не делать так остальных.

Была бы нормальная альтернатива...

azg

сабж не открывает нормально мхт файлы в линуксе  - билеберда нечитаемая получается( убунту 7.10, 8.04) sad

У меня всё открывается. Может быть, проблема с несовместимостью расширений? Или файл неправильный?

MySh

Тем, что работает.

Какой процент народа использует Linux, если без фанатизма?
А в Win MAF прекрасно работает.
Timon

Была бы нормальная альтернатива...

Вот именно. Мне совершенно неважно что и насколько стандартизированно и кто/что об этом думает. Важно что тот же chm является одним из самых распространенных форматов, открывается на любом компе стандартными средствами Windows и занимает минимум места.

Важно что тот же chm является одним из самых распространенных форматов, открывается на любом компе стандартными средствами Windows и занимает минимум места.

+1

Никогда у меня не было проблем с chm. И кстати, линукс не использую, но для фокса есть расширение chmreader, плюс ещё что-то слышал про средства для открытия chm в линуксе, плюс 7-zip умеет chm-файлы распаковывать. Так что, думаю, и под линуксом с этим форматом не должно быть так уж много проблем.

Да проблем там почти и нет уже с CHM-ом, сказывается его распространенность. Вот только поддержка этого формата не должна реализовываться в этом расширении. Пусть будет новое. Не надо всё в одну кучу сваливать.

з.ы. Всё же CHM это безумная фигня, а не формат... Но что делать...

не сохраняет эту страничку http://www.gaz-online.ru/
а опера сохраняет, не подскажете в чем проблема?

Lucio
нормально сохраняет

у меня вот че пишет
capture_22062008_093339687.jpg
интересно в чем проблема?

млин вот еще один сайт попался http://www.syaivo.com.ua/
та же ошибка:cry:
версия 4.4.0

Пофиксили. Качай UnMHT 4.5.0

Lucio
у меня вообще 4.2.1 :)

В 4.5.0 все супер, спс :beer:

А где автор обитает? Только не на японском плиз... Как насчёт K-Meleon подходит?

Лично у меня, включение этого расширения приводит к появлению утечек памяти в FireFox. Впрочем, меня и  ScrapBook вполне устраивает.

А нельзя ли добавить фичу для «seamonkey»: сразу создать архив и по почте отослать аттачем, без промежуточного сохранения файла?

Уважаемые, подскажите пожалуйста что за глюк проявляется иногда. Вот так открываются страницы сохранённые с помощью UnMHT.
e0d3edcd8b9e3b808f18f70d6449336f
Бывает не часто, но всегда не вовремя. Такой файл уже не открыть ни в IE, ни в Opera. Opera пишет "attachment:/2/attachment2.css". Как избавиться от фичи))? Со страху уже проверяю все сохранённые файлы на открытие. Кстати если выявились такие файлы, как их открыть? Помогите пожалуйста.

angry_dog
может с кодировкой что при сохранении :)

Установил UnMht 5.1.0.1 на Firefox 3.0.6 и заметил одну проблему при открытии сохраненных файлов mht,суть проблемы в том, что если файл сохранен в папку, название которой состоит из двух слов,то Firefox не может его открыть,в строке адреса путь к файлу указан не верно,например вот так file:///E:/Downloads/Из ,а должно быть file:///E:/Downloads/Из интернета/файл,через меню "Файл-Открыть файл" открывает нормально,но это не удобно.Может кто то знает решение этой проблемы ?

никто не сталкивался с такой проблемой...? Сохраненные в FF страницы, смотрю на других компьютерах в IE - не показываются картинки. Хотя в папке они есть. А если смотрю Оперой, картинки показываются. Не могу понять что делать...

Сегодня попробовал на работе,здесь у меня установлено все тоже самое что и дома,за исключением chmreader-а,все нормально работает.Попробую  сегодня дома удалить chmreader,если не пойдет,то попробую профиль с работы.О результатах отпишусь.

Перепробовал все что можно, и chmreader удалил и профиль с работы ставил и новый профиль создавал,все впустую,уже не знаю что и делать.Четыре года сижу на Firefox и ,честно говоря,постоянно какие то проблемы возникают,то страницы ,сохраненные как "Веб страница полностью",в новых версиях открывались без картинок,то Fox2CHM стал криво страницы сохранять или вовсе не сохранял,теперь нашел Unmht,обрадовался и на тебе.....Люди помогите решить проблему!!!!!!!! Не дайте ,из-за этого UnMHT ,перейти на Opera!!!!!!!!!:whiteflag:

Алексей78

если файл сохранен в папку, название которой состоит из двух слов,то Firefox не может его открыть

Проверил у себя - никаких проблем нет!

:::: Mozilla/5.0 (Windows; U; Windows NT 6.0; ru; rv:1.9.1b2) Gecko/20081201 Firefox/3.1b2

Версия расширения 5.1.6

Алексей78 а попробуйте  "другой" браузер ;)

Спасибо что откликнулись и пытались хоть как то помочь.Проблему свою я решил,совсем отчаявшись решил задать вопрос на офсайте расширения и на мое счастье там откликнулись практически сразу же и очень мне помогли.Для тех, кто возможно столкнется с этой проблемой,хочу озвучить это  решение. В общем все завязано с ассоциацией файлов в винде,необходимо выбрать тип файлов MHT и выбрать приложение для него,а конкретно Firefox, в графе <Приложение,исполняющие действие> Вы увидите следующую строку "C:\Program Files\Mozilla Firefox\firefox.exe" %1,для того что бы файлы MHT нормально открывались из любых папок нужно эту строку подправить следующим образом "C:\Program Files\Mozilla Firefox\firefox.exe" "%1" и все будет в порядке.

попробуйте  "другой" браузер

Спасибо за совет.А что это за версия такая,вроде как последняя официальная версия 3.0.6 ?

Алексей78

А что это за версия такая,вроде как последняя официальная версия 3.0.6 ?

Версии 3.1b* - "Shiretoko" и 3.2a1pre - "Minefield" находятся в стадии разработки. Тем не менее любой желающий может свободно скачать и установить себе данные программы. На данный момент наиболее доработанной является версия 3.1b* - со дня на день ожидается выход 3.1b3. А там и до оф. релиза не долго. 3.2а1пре, как видно из названия, находится в начальной стадии разработки. Ежедневно обновляющиеся версии (так называемые "ночнушки") можно скачивать по отсюда на свой страх и риск:). Сам пользуюсь одной из первых версий - достаточно стабильная, практически без вылетов, работают все нужные мне расширения. Обе версии используют новый, более быстрый движок. Более подробно - на оф сайте Мозиллы.

.А что это за версия такая,вроде как последняя официальная версия 3.0.6 ?

Алексей78 это официальная бета-версия
с которой UnMHT5.1.0.1 совместим :)

Совместимость:

    * Firefox: 1.0 – 3.1b2

Duble3,Z&N,спасибо что объяснили,попробую.

Установил,почти все хорошо,главная проблема-это не показывает письма с ним.Отключаешь,все показывает.Кто знает как решить проблему?

Уважаемые знатоки!
Часто сохраняю странички в формате mht - быстро и удобно.Огорчает одно - очень долго (секунд 20-30)открывается файл mht :(
Подскажите в чем может быть дело?Фаил открываю IE 8

у меня mozilla не открывает mht , даже после того как я выставляю по умолчанию,чтобы открывала mozilla

да совершенно верно.UnMHT стоит и включен.
подметил,что не все mht странички открываются долго,некоторые довольно быстро,а на некоторых IE просто виснет на какое-то время

Спасибо,за совет попробую.
На самом деле очень быстро открывается архив maff

Teylor пишет

у меня mozilla не открывает mht , даже после того как я выставляю по умолчанию,чтобы открывала mozilla

Была в свое время аналогичная проблема, все действия предложенные okkamas_knife не помогали, пришлось проассоциировать mht и firefox через правку реестра.

Teylor то что советует okkamas_knife работать не будет, правильно написал Алексей78
Приложение, исполняющее действие: "C:\Program Files\Mozilla Firefox\firefox.exe" "%1"

Здравствуйте люди Добрые.
Замучился уже просто напрочь.
Подскажите, кто что может по ситуации:

- ось Windows 7
- установлена Лиса версии 3.6
- установлен UnMHT версии 5.5.0.

Все включено, все работает.
Страницы в MHT благополучно сохраняются и нормально открываются другими программами.
Но при попытке открыть этот же самый MHT файл Лисой, который она же собственно и создала, вместо текста отображается какая то крякозяба, которая нормально выглядит только в Японской кодировке (соответственно японскими же символами).

Ну что за ерунда такая? (все настройки перерыл, пробовал переустанавливать версии браузера и плагина ... одна петрушка :( )
Как заставить UnMHT корректно (с русским языком) открывать создаваемые им же самим файлы?

В процессе различного рода поисков и переустановок удалось добиться того, что UnMHT теперь адекватно открывает через Лису те файлы, которые создает сам.
Эти же файлы так же хорошо открывает и IE, а вот MHT-шки созданные например Макстоном, UnMHT по прежнему отказывается видеть в русских буквах, присваивая им японскую кодировку, в то время как IE эти же самые файлы читает запросто, отображая на нормальном русском языке.
Есть идеи, в чем прикол?

А при чем тут настройки Макстона?
Повторюсь, что IE сохраненные им (Макстоном) файлы открывает ровно и красиво, как и любые другие программы, а вот UnMHT (в Лисе) присваивает им (этим же самым файлам и как я уже полагаю любым другим, кроме тех которые он создает сам) японскую кодировку.
Думается мне что проблема все таки в настройках UnMHT или самой Лисы ... скорее все таки UnMHT потому как MAF, установленный в Лису, те же файлы тоже спокойно открывает ... вот только знать бы еще где именно и что именно подправить нужно ... там настроек то в этом UnMHT раз, два и обчелся, а где править не понятно :(.

Здравствуйте.
У меня ситуация схожая с предыдущими. Открываю mht  в FF3.6.2, в котором установлены плагины UnMHT и Coral IE Tab в новом профиле, и появляются чёрный фон окна и название вкладки unmht://coralietab/chrome.5/content/container.html?url=0 ...
593b3b18ad7c8e08708b81c4c79130ba.png
Если отключить Coral IE Tab, то открывается, но с заметной задержкой по сравнению с Opera.

Два вопроса:
1. Как заставить работать эти два плагина слаженно?
2. Как ускорить открывание mht  в FF ?

Heddik1 пишет

1. Как заставить работать эти два плагина слаженно?

Sid пишет

Расширение конфликтует с IETab, если не удалить строку /^file:\/\/\/.*\.(mht|mhtml)$/ из фильтра IETab.

Это сделано?

Heddik1
Старая известная проблема конфликта UnMHT с IETab. Решается удалением строки /^file:\/\/\/.*\.(mht|mhtml)$/ из списка фильтров IETab.

Sid, MySh
У меня проблема плагин немного другой: Coral IE Tab
b8c0b98bef28d719ce4c55d65d5ab3e7.png

Heddik1
Не суть важно. Раздвинь мышкой заголовки, чтобы было видно текст в первой колонке, и удали этот злосчастный фильтр.

Sid пишет

Heddik1
Не суть важно. Раздвинь мышкой заголовки, чтобы было видно текст в первой колонке, и удали этот злосчастный фильтр.

Сдеалал вот что, и помогло. Спасибо.
bfd3468bf71d8e6f326ec76d2a6d222f.png

Друзья, помогите решить проблему.
Вот так страница выглядит. Так её сохраняет Лиса (UnMHT) и так её открывает осёл и опера. Т.е. сохраняет UnMHT её правильно.
01c64afe457ct.jpg
Вот так она открывается в Лисе. Повторю что осёл и опера открывают созданный лисой mht правильно.
22a27ce9eea0t.jpg
Мои предположения что это как то связано с блокировкой рекламы, но где грабли не пойму

angry_dog
А RequestPolicy, часом, не стоит?

А RequestPolicy, часом, не стоит?

Нет такого. Попробовал поставить MAF - всё отлично и сохраняет и отображает, но не русский, да и привык я к UnMHT. Хочется разобраться.

Почему то лис падает,при попытке сохранения файла.

UnMHT не работает в 4.0b7pre. Сам не открывается, не сохраняет, не открывает MHT.  Говорят у других на пребете работает. Подскажите альтернативу UnMHT, для открытия MHT. Полчаса на addons.mozilla.org лазил, не нашел.

Galantic
Берём с сайта автора дев-версию и нет проблем
http://www.unmht.org/unmht/files/unmht-5.6.7.xpi

Выложите, пожалуйста, UnMHT 5.6.7 или 5.6.8, с оф. сайта скачать не удается.

UnMHT 5.6.8

http://www.mediafire.com/?9xshy5d5khqml84

pohunohi
Спасибо!

Залил к себе - http://unghost.ru/firefox/extensions/un … -5.6.8.xpi

Unghost

Автор расширения: Nicolas FROIDURE
Домашняя страница: http://www.unmht.org/unmht/en_index.html (временно не работает)

Временно не работает или... :sick: Вы владеете какой-нибудь информацией?

pohunohi
Не владею, но надо же что-то написать.

Сайт автора снова работает. :D К счастью самые плохие опасения не подтвердились.

Опять сайт автора не работает. Может ли такое случится, что мы останемся без UnMHT, или кто-то подхватит его разработку?

Кто то нашёл решение? Довольно востребованное расширение, жаль потерять.

Adept Cifry пишет

Кто то нашёл решение? Довольно востребованное расширение, жаль потерять.

Решение чего?

Решения того, как заставить данное приложение работать в Fx 6

Лично я давно уже перешёл на Mozilla Archive Format
Отлично работает под [nightly]9.0a1
К тому же, автор в поте лица работает над версией 2.0

Tiger.711 пишет

Лично я давно уже перешёл на Mozilla Archive Format
Отлично работает под [nightly]9.0a1
К тому же, автор в поте лица работает над версией 2.0

Спасибо, поставил MAF, пока заметил, что он в разы быстрее, по сравнению с unMHT, открывает сохранённые *.mht- файлы. Посмотрим как он в работе.

Нашёл http://nijiura-doll.info/unmht-5.6.14-maxVersion100.xpi

Adept Cifry пишет

Решения того, как заставить данное приложение работать в Fx 6

А в чем состоит неработоспособность UnMHT в 6-ке, если оно прекрасно работает в Fx 7-ке, 8-ке и 9-ке? Версия 5.6.12.

А офсайт все дохлый. :(

28-08-2011 20:57:49

Это самоделка какая-нибудь? Или официальное расширение с подправленным rdf?

Потестил немного сохранение в MHTML с разными брузерами.
Для теста я сохранил главные страницы сайтов BBC, Engadget, Wired и Компьютерры.
Использовал IE9 с апдейтами, одну из последних Opera 12 alpha и Firefox 6.0.
IE и Opera сами могут сохраненять в MHTML, для Firefox поставил плагины MAF 2.0.1 и UnMHT 5.6.14.
В Opera стоят какие-то баннеро- и флешерезалки, их убирать не стал.
Детально копать времени нет, но если кому надо, вот архив: http://narod.ru/disk/23312619001/mht_test.7z.html
Теперь краткий разбор полётов.
Opera сохраняет страницы практически мгновенно. Внутри архива файлов меньше, чем у MAF и UnMHT, но больше, чем у IE.
.css и .html. практически не трогает, оставляет как есть.
IE сохраняет меньше всего, капитально переформатирует .css и .html. По скорости сохранения на 2 месте. В старых версиях было сильно хуже.
UnMHT сохраняет больше всего данных. Работает довольно быстро. Можно сказать - эталон.
MAF По скорости примерно равен UnMHT, может чуть быстрее. Сохраняет данных немного меньше UnMHT, при этом окрывает диалог сохранения, что бесит.
Кроме того, перелопачивает .html - вырезает оттуда скрипты и тд., сохраняет ВСЕ .js скрипты пустыми - вырезает их содержимое,
переделывает .css - переформатирует, преобразует относительные ссылки в прямые - что другие не делают.
Выяснять зачем и что сохраняется в архив нет ни времени, ни желания. Как и проверять идентичность сохранённого оригиналу.
Основной браузер у меня Opera, остальными пользуюсь по необходимости. На Firefox остаюсь с UnMHT, пока хак не перестанет работать :)

У MAF стоило бы в настройки заглянуть...

Зачем? Включить опцию сохранения страниц и скриптов "как есть"?
Это не исправит других его недостатков. Как и того, что у UnMHT
настроек на порядок больше :)

All
У кого-нибудь есть оригинальный unmht-5.6.14.xpi с офсайта?

nimdamsk пишет

В Opera стоят какие-то баннеро- и флешерезалки, их убирать не стал.
Opera сохраняет страницы практически мгновенно. Внутри архива файлов меньше, чем у MAF и UnMHT, но больше, чем у IE.
.css и .html. практически не трогает, оставляет как есть.

Вот потому в [opera] файлов и меньше, что она всякую рекламную лабуду не грузит. А UnMHT (при условии что [firefox] не в оффлайне) всю эту дрянь тянет, даже если включены вякие адблоки. :( В IE ведь наверняка какие-то адблоки тоже стоят?

Подтягивание всей дряни при сохранении (любом, не только в MHT) ИМХО это один из главных недостатков [firefox].

А в чем состоит неработоспособность UnMHT в 6-ке, если оно прекрасно работает в Fx 7-ке, 8-ке и 9-ке? Версия 5.6.12.p

а где ее такую взять? на аддонах, только для 5

На офсайте была, когда он еще работал. Это бета, последняя вообще 5.6.14 была, но офсайт к тому времени уже сдох. :(

Но и та, что на аддонах, прекрасно пашет при отключенной проверке на совместимость.

WatsonRus пишет

Вот потому в [opera] файлов и меньше, что она всякую рекламную лабуду не грузит. А UnMHT (при условии что [firefox] не в оффлайне) всю эту дрянь тянет, даже если включены вякие адблоки. :( В IE ведь наверняка какие-то адблоки тоже стоят?
Подтягивание всей дряни при сохранении (любом, не только в MHT) ИМХО это один из главных недостатков [firefox].

Я считаю что должно сохраняться всё, что подгрузилось, полное состояние DOM как оно есть.
Со всеми скриптами, стилями, картинками, флешем и видео. Я сам решу, что мне надо, а что нет.
В этом плане у Opera есть недоработки, и именно из-за этого я иногда сохраняю из UnMHT.

nimdamsk пишет

Я считаю что должно сохраняться всё, что подгрузилось, полное состояние DOM как оно есть.

С точки зрения пользователя, сохраняться должно то, что он видит.
Вы же, когда фотографируете лесной пейзаж, не хотите на распечатанной фотографии дом увидеть, правда? (:

если на то уж пошло, то сохранятся должно не "ТО, ЧТО ......"
а "ТАК, ЧТО БЫ" при открытии пользователь увидел и получил теже фукции что и в оригинале
и какая разница как оно "это" делает и сколько файлов сохраняет

mike2003 пишет

сохранятся должно не "ТО, ЧТО ......"
а "ТАК, ЧТО БЫ"

Поясните, что именно Вы имели ввиду?

...а "ТАК, ЧТО БЫ" при открытии пользователь увидел и получил теже фукции что и в оригинале

mike2003 :angel:

ScrapBookрасширение Firefox, позволяюще сохранять веб-страницы для просмотра в офлайне в виде древовидной базы данных.

Возможности программы
Захват веб-страниц, включая картинки, стили, мультимедиа, архивы, JavaScript, задание параметров захвата по умолчанию....

Многоуровневый захват веб-страниц — захват также страниц, на которые ведут ссылки с данной страницы, количество уровней ссылок задаётся в настройках.....

+ ScrapBook MAF Creator

для хранения информации с веб я потихоньку перехожу на Evernote (и подобное)
иметь оффлайновую коллекцию уже не катит

Постестил ScrapBook MAF Creator.
С одной стороны, сам ScrapBook страницу сохраняет довольно сносно.
С другой - ScrapBook MAF Creator создаёт только .maff архивы, которые
по сути есть зазипованный каталог с файлами. Формат, конечно, лучше
MHTML, но его понимает только Firefox, поэтому он мне не нужен.
А ещё сохранять можно только по одному адресу. Спасибо, не надо.

...но его понимает только Firefox, поэтому он мне не нужен.

альтернативка > ScrapBook CHM Creator :angel:

Chm универсальный, но еще хуже, потому что использует ИЕ движок и его настройки

mike2003 пишет

Chm универсальный, но еще хуже, потому что использует ИЕ движок и его настройки

А MHT что использует? ИМХО тоже IE движок. Формат-то IE-шный, а [firefox] родной (встроенной) поддержки не имеет.

WatsonRus
А как тогда [firefox] открывает уже сохранённое? IE-фреймом что ли? О__о

А MHT что использует?

что открывает, то и использует - свой движок
а СХМ тока виндовой оболочкой и там только ИЕ (в нормальных условиях)
тем более там и интерфес корявый и интеграция с браузером уже теряется
так что mht по прежнему удобен и универсален как однофайловая интерпретация html и связаной с ним информацией

Офсайт UnMHT ожил. Кому надо, пользуйтесь моментом. Там версия 5.7.0 выложена.

02-09-2011 18:31:30

Tiger.711 пишет

WatsonRus
А как тогда [firefox] открывает уже сохранённое? IE-фреймом что ли? О__о

[firefox] без UnMHT открывает MHT? Если нет, то еще неизвестно чем UnMHT открывает.

Мне MHT [firefox]-ом открывать не нужно, поэтому мне все равно.

WatsonRus
Это был такой тонкий (тонкий?) намёк. UnMHT и MAF используют свои собственные движки для обработки MHT. При чём, разные.
[opera] кстати, тоже использует собственный движок а не IE фрейм.

Tiger.711 пишет

UnMHT и MAF используют свои собственные движки для обработки MHT.

Вот теперь все встает на свои места. ;)

Tiger.711 пишет

[opera] кстати, тоже использует собственный движок а не IE фрейм.

Я в курсе. Но в [opera] он встроенный.

WatsonRus пишет

Но в [opera] он встроенный.

В [opera] движок голосового управления встроенный...

Unghost пишет

Нашёл http://nijiura-doll.info/unmht-5.6.14-maxVersion100.xpi

Спасибо за ссылку!
Долго искал для Nightly 9.0a1 64 bit способ сохранять страницы в mht, теперь с этим проблем нет.

А новая UnMHT 5.7.0 не устанавливается, пишет несовместимость. Как можно обойти и установить?

alex1551 пишет

http://nijiura-doll.info/unmht-5.6.14-maxVersion100.xpi

спасибо за ссылку.Установил на ФФ 6.0.2 и всё работает.

Почему страницы сохранённые в UnMHT весят в два раза больше чем аналогичного формата, сохранённые в IE ?

При открытии архивов .mht кликом мышью - открывается два окна FF. Как исправить и в чём тут может быть дело?

UNMHT дублирует комментарии (один под другим) при сохранении на форумах.
Это поправимо?

Установленное на чистом профиле в [firefox] 40 дополнение UnMHT не отобразилось в контекстном меню "Инструменты" и не выдало на панель свои кнопки. Если кто в курсе такой проблемы - прошу подсказать решение. Поиск по форуму и в сети ничего не дал, шаманство с бубнами тоже никак не помогло.

Подтверждаю проблему. Перепрыгнул на Mozilla Archive Format.

Xvost пишет

Подтверждаю проблему. Перепрыгнул на Mozilla Archive Format.

Тоже установил МАФ, но в нем нет так нужной мне функции сохранения нескольких вкладок одним файлом.

UPD: Пофиксили в UnMHT 8.0. Теперь все в порядке

Здравствуйте, уважаемые пользователи!

Использую расширение "UnMHT" для сохранения статьей из Интернета, предварительно очистив их от мусора при помощи "DOM-очистка страницы" (расширение Scrapbook). Очень удобно - ничего лишнего. В связи с жёсткими ограничениями программы "Evernote" на объём хранимых заметок решил не пользоваться его клиппером, а хранить все представляющие информационную ценность заметки в виде файлов mht в облаке в определённой папке на жёстком диске. Но для адекватного поиска через средство поиска "Windows 7" хочется каждому файлу mht присвоить ключевые слова, чтобы я мог ввести, например, виндовый синтаксис "ключевыеслова:рецепт И личное тип:mht" и получить при этом рецепты всех опробованных блюд. :) Подскажите, как можно присвоить ключевые слова файлам mht? Использование программы для заметок "Wiz Note" не совсем подходит, так как тот не умеет в строке поиска искать заметки по тегам и сохранять поисковые запросы (как это делает "Evernote"). Может, есть какие-то решения у расширения Scrapbook с синхронизацией между устройствами? Важно, чтобы доступ к данным был возможным без Интернета на всех десктопных устройствах Windows по ключевым словам.

Хочу поднять больной для меня вопрос в связи с тем, что все дополнения на XUL перестанут работать в Firefox 57. То есть UnMHT работать перестанет. У меня множество страниц в MHT формате. Когда начинал им пользоваться даже речи не шло о том, что Firefox перестанет поддерживать XUL.

Знаю что Chrome, Chromium, Opera, Vivaldi умеют сохранять .mht страницы и открывать. Это можно включить в дополнительных настройках, но функция экспериментальная и сохранение я пробовал, не сохраняло и не открывало некоторые ресурсы в отличии от UnMHT.

Архив сохраненного у меня не маленький. Всякие дополнения на WebExtensions API типа дополнения Save Page WE даже близко не подобрались.
А еще я видел исходный код Save Page WE и могу сказать, что оно в любой момент может сломаться или не все сохранить или даже отобразить, алгоритм его работы очень ненадежен.

Что мне делать?

Для тех, у кого накопилось дофига всего в mht, maf, скрапбуке, остаётся только надеяться, что, скажем, к выходу 59 esr к лисе приделают-таки уже нормальную замену этих аддонов. Если нет, то придётся до упора держать сборку [firefox] 56, или, например, 52 esr исключительно как оболочку для скрапбука, etc. Вот как некоторые на XP сидят исключительно по причине того, что какой-нибудь необходимый софт или железо не работают на более поздних виндах.

Про ненадёжность Save Page WE подтверждаю. Сам напоролся буквально с первой же попытки пощупать замену UnMHT/MAF.

Для меня это действительно проблема. Я храню множество информации в том числе по работе, потому что не люблю зависит от интернета, и не везде он есть.

Я бы мог предложить короткий алгоритм реализации сохранения страницы целиком на WebExtensions API. Но
1. Его еще надо реализовать и обойти все подводные камни, если это вообще возможно
2. Всеравно останется вопрос с тем что делать с архивом.

Алгоритм привожу для тех, кто захочет попробовать свои силы:

Алгоритм сохранения:
1. Пользователь жмет кнопку сохранить. Страница перезагружается с очисткой каша (аналог ctrl + F5, который можно вызвать в API). Это для того чтобы все запросы на все ресурсы шли в сеть, а не в кэш. Можно назвать это вход в режим сохранения.
2. Для вкладки которая вошла в режим сохранения запускается перехватчик запрос. Все запросы сохраняются в массив, индексы которого - их параметры. То есть сохранить нужно и запрос, и его параметры.
3. Пользователь может ходить по странице, открывать/закрывать выпадающие меню и т.д. Все это время запущенный перехватчик запросов работает.
4. Пользователь нажимает сохранить второй раз.
5. Запускается сохранение resources[url][params] = base64Response. То есть сохраняется ответ запрос, его ссылка, его параметры. Сам ответ преобразуется в base64 перед занесением в элемент массива в качестве строки.
6. Сохраненный выше массив запросов и их ответов преобразуется из объекта в строку JSON.stringify(resources) и сохраняется где-то на странице: <my-tag>JSON.stringify(resources) </my-tag>
7. В дополнения ко всему выше придется сохранить текущее состояние Local Storage, Session Storage, Cookies. Возможно придется переопределить стандартные функции для работы с ними, и доставать значения не только те которые могут появиться на странице, но и сохраненные. Это нужно для того, чтобы работали сайты которые хранят аналог cookie - то есть token внутри Session Storage. Для других данных тоже это нужно.
8. Собираем все содержимое страницы, конвертируем в blob и вызываем сохранения (с новым javascript API это просто). Далее пользователь сохраняет это как обычный файл.

Алгоритм открытия:
1. Проверяем существует ли на странице тег с сохраненными в нем в качестве строки ресурсами. Если да, то запускаем алгоритм открытия.
2. Перехватываем все запросы со страницы. И перенаправляем их на сохраненные base64 представления ответов на запросы. И да, это будет работать, если сделать redirect скажем на base64 скрипта или картинки, то они даже если это простая строка подойдут в качестве ответа и будут использованы (проверял).
3. Само собой, нужно будет либо записать все содержимое сохраненных  Local Storage, Session Storage, Cookies, либо подсовывать их через переопределенные функции для работы с ними.

Я пробовал такое делать. Частично реализовал. Не получилось обойти несколько проблем.
1. По какой-то причине иногда срабатывает ограничение на кросс доменные запросы, причем чаще всего никаких проблем с этим нет. Конечно попробовал подставлять различные заголовки, давать права и подобное, что позволило WebExtensions, не помогло. Но я не искал долго. И вот это настоящая проблема, т.к. я не знаю причины возникновения, то и не могу сказать возможно ли это обойти.
2. Сама последовательность вызова операций достаточно запутанна :) у меня не получилось их синхронизировать правильно. Но это просто время нету.
3. Все работало в основном в Chrome, т.к. Firefox по какой-то причине не любил шрифты определенных форматов и на них ругался. Возможно к этому времени уже внесены исправления.
4. Как ни странно, когда страница начинает посылать запросы в сеть, и мы хотим подсунуть ей сохраненное base64 вместо ответа из интернета, то я не смог определить что просит страница. Хочет она http или https протокол вначале ссылки. Дело в том, что все запросы идут на ссылки вида file://google.ru или file:///google.ru (различие в количестве слэшей) где разница между ними в том, что это либо внешний, либо локальный ресурс. Это ссылки на которые заменяются нормальные ссылки после обычного сохранения страницы ( а у нас обычное, просто тег с ресурсами внутри еще есть). И по этим ссылка нельзя сказать были они http или https до авто замены.

Надеюсь это описание кому-то поможет. :) Сам я планирую закончить, как только появится время, если сделать такое конечно вообще возможно.

UPD
Написав это понял, что может быть слишком много текста для простой логики. Опишу сокращенно.
1. Перехватываем все запросы со страницы.
2. Конвертируем ответы в массив base64, и сохраняем в виде строки внутрь какого-нибудь тега страницы.
3. При открытии перехватываем все запросы и подставляем им сохраненные base64 ресурсы.

Пользователь жмет кнопку сохранить. Страница перезагружается с очисткой каша

Дальше не читал. Что делать со страницами, которые сгенерировались динамически? В смысле, на клиенте, а не на сервере. Что делать с заполненными полями? В смысле, я когда где-то заполняю какую-нибудь анкету, перед отправкой данных вполне могу сохранить в скрапбуке — и там сохранится ровно то состояние, в котором я нажал на сохранение. В том числе заполненные мною поля. Этакий бэкап.

А так да, у меня тоже очень много накопилось сохранённой информации, которую выход квантума похерил. Хорошо хоть я предпочитаю формат maf, а его в квантуме будет читать WebScrapBook (не являющийся заменой скрапбуку).

Wave

сгенерировались динамическ

Это как ? :) Я нормально отношусь к критике, но не обоснованную не люблю. Страница вам приходит в браузер в виде запросов, не важно что в них и какие они. Алгоритм выше описывает как сохранить ответы совершенно всех запросов внутрь страницы и подменять ответы сохраненными. Без разницы что у вас с сервера пришло, текст это, картинка или скрипт.
Возможно дочитай вы до места, где я писал что пробовал это и в основе своей алгоритм работает, то это чем-то помогало бы :)

UPD
Вот как сохраняются заполненные вами поля в UnMHT я без понятия. Т.к. в стандартном поведении браузеров для html они в кэше хранятся. Сохранять еще и его? Возможно, эту тему я не прорабатывал.

cozolih пишет

Wave

сгенерировались динамическ

Это как ? :) Я нормально отношусь к критике, но не обоснованную не люблю. Страница вам приходит в браузер в виде запросов, не важно что в них и какие они. Алгоритм выше описывает как сохранить ответы совершенно всех запросов внутрь страницы и подменять ответы сохраненными. Без разницы что у вас с сервера пришло, текст это, картинка или скрипт.
Возможно дочитай вы до места, где я писал что пробовал это и в основе своей алгоритм работает, то это чем-то помогало бы :)

Да? Ну давайте, расскажите, как вы вот такую страницу сохраните со второго раза, но так, чтобы в ней было то, что было при первой загрузке?

Выделить код

Код:

<html>
<body>
<div id="elem">
HI!
</div>
<script>
var elem = document.getElementById('elem');
elem.innerHTML = Math.random();
</script>
</body>
</html>

Конечно, Math.random — это читерство, но ведь страница может динамически сформироваться и каким-нибудь другим способом. На основе реальных данных. Которые не повторяются при повторных запросах.
(и это я ещё не беру во внимание состояние canvas и тому подобные мудрёности)


cozolih пишет

UPD
Вот как сохраняются заполненные вами поля в UnMHT я без понятия. Т.к. в стандартном поведении браузеров для html они в кэше хранятся. Сохранять еще и его? Возможно, эту тему я не прорабатывал.

Тут я слегка неправ, потому что смешал понятия. Т.е. аддоны. Сохраняю я в таких случаях в скрапбук. Но смешал потому, что в квантуме отваливается всё, что относится к сохранению: unmht, maf, scrapbook.


Upd. А вообще WebScrapbook для квантума как раз является заменой maf. Используйте для сохранения его, а для чтения уже сохранённых mht то, что эти mht может читать.

В 57 ожидаемо отключилось. Аналога не нашлось. Кто нибудь знает, автор будет переделывать или нет?

cozolih назначьте IE для открытия .mht

15-11-2017 06:59:29
похоже не будут http://maf.mozdev.org/index.html

Капец, неужели так трудно сделать сохранение в MHT штатными средствами? Вон, и хром и IE сохраняют в этом формате по умолчанию. У меня куча информации сохраненной в MHT, и что мне теперь делать, перелазить на другой браузер ради этого?

Ап: просвета в этой безысходности не появилось?

Hommit
Видно.
Уже несколько раз тут называли дополнение Web ScrapBook.
Только оно не умеет отображать .mht, зато умеет .htz, .maff
Можно поставить на старый Firefox дополнение Mozilla Archive Format, with MHT and Faithful Save и пересохранить .mht в .maff. Только возможно не все типы ресурсов сохранит.
Но напомню, что и при сохранении в стандартный .mht через дополнение UnMHT это дополнение не умело сохранять совсем все и сайты в которых много javascript бывало не полностью сохранялись, т.к. часть ресурсов подгружалась как-то необычно.

В Web ScrapBook чтобы сохранять javascript внутри страницы нужно в настройках поставить для Scripts - Save.

А еще это дополнение умеет интересную вещь. Оно может сохранять полностью страницу со всеми javascript, стилями, картинками и прочими ресурсами в обычный .html файл, который потом можно открыть в любом браузере без этого дополнения. Для этого в поле Save captured data as нужно выбрать Single HTML. Но! Как писал разработчик этого дополнения в режиме Single HTML может не сохранять некоторые ресурсы, файл получается большего размера и требует больше компьютерных ресурсов для открытия.
Я пользуюсь режимом Single HTML, могу сказать, что большинство файлов сохраняет нормально и просматривать можно без проблем.

Разработчик этого дополнения писал, что в будущем планирует сделать просмотр файлов типа .mht без возможности сохранения. Технически это возможно.

Еще один момент. Разработчик писал, что новая версия Web ScrapBook уже несколько месяцев находится на досмотре в Mozilla и поэтому не добавлена в https://addons.mozilla.org. Причина: нестандартные права доступа, которые нужны для работы этого дополнения. Это дополнение работает и в Chrome браузере и там последняя на текущий момент версия, если есть желание пользоваться свежей версией смотрите ее или скачивайте и устанавливайте в Firefox вручную последнюю версию с сайта разработчика.

UPD
Замечу. Что разработка такого дополнения сложна из-за ограничений нового WebExtensions API (возможностей новых дополнений). Поэтому разработчик использует много необычных трюков и не для всех типов данных может быть готовый трюк.
Другими словами, какие-то типы ресурсов могут не сохраниться.

UPD2

Алексей78 пишет

Капец, неужели так трудно сделать сохранение в MHT штатными средствами? Вон, и хром и IE сохраняют в этом формате по умолчанию. У меня куча информации сохраненной в MHT, и что мне теперь делать, перелазить на другой браузер ради этого?

В Chrome не сохраняется много ресурсов, по крайней мере так было когда я пробовал последний раз. Толку от такого сохранения мало. Насчет IE я вообще без понятия.

UPD3
Уточню, что я не проверя предложенный мной выше способ сохранения mht в maff. Но учитывая то, что в старом Firefox нету ограничений на функции, то такое возможно, пусть даже путем модификации дополнения.
Как и возможно сделать скрипт который конвертирует все файлы сам.
Вопрос в том кто это будет делать и сколько это будет стоить :D

можно поставить расширение сохранения в pdf, хотя это медленно, страница преобразуется на сайте расширения, а не на компьютере https://addons.mozilla.org/ru/firefox/user/pdf-mage/?src=api

sputnikkhasia@
И что? Оно тоже имеет сохранять javascript внутри страницы, чтобы были видны блоки которые без javascript на практически всех современных сайтах не видны? Что-то у меня большие сомнения в этом.

Чем современным можно открыть .MHT 2012 года, созданные расширением UnMHT для FF? При открытие файла в FF предлагает открыть его Оперой. В Опере 70 и ИЕ 11 открывается пустая страница.
Нормально открываются на виртуальной ХР в IE8 и FF 52.9.0 esr (если установлено UnMHT).

sputnikkhasia@ пишет

Чем современным можно открыть .MHT

Палемун + MozArchiver или юзайте портативный FF52-56

harryk пишет
sputnikkhasia@ пишет

Чем современным можно открыть .MHT

Палемун + MozArchiver или юзайте портативный FF52-56

Спасибо. Печальная ситуация. Странно, что ИЕ8 видит без всяких ухищрений, а остальные нет