Web scrapbook как пользоваться
Перейти к содержимому

Web scrapbook как пользоваться

  • автор:

Чем вы заменяете Scrapbook (для Firefox) в Google Chrome?

Кто не в курсе: для Firefox есть такое приложение — Scrapbook, для целиком_и_полностного сохранения веб-страничек со всем их содержимым, скриптами (почти всегда), флешками и прочим. Все организовано в виде дерева, все сохраняется в виде файлов на диск. Да чуть тормозит (особенно на пятигигабайтном «скрапбуке», видимо, из-за того, что «дерево» хранится в XML и при запуске его бы надо парсить, а на диске — это огромное количество папок), но работает и это для меня всегда было жуть как удобно.

Но со временем Firefox’ом пользоваться стало просто невозможно, перешел на Chrome. И встретил засаду — нет ничего подобного для него. Первое время даже доходил до маразма: понравилось что-то (в хроме), копируем ссылку, открываем в фоксе, сохраняем. Естественно, это быстро надоело.

Самый большой косяк всех приложений для Chrome — это то, что хранят свою базу они где-то в глубинах юзерпрофайла, в запакованном формате. Последнее, что меня добило в них — это отсутствие синхронизации их данных и настроек при таком раскладе. Произошел как-то случай: установил на нетбук хром, он синхронизировал профиль с лэптопом, я посчитал, что кое-что из аддоном не минибуке не нужны — и удалил, в том числе и пару «скрэпбуков» с сохраненными страницами. Я и не думал, что сия операция тоже синхронизируется. Повторная их установка данных, к сожалению, не вернула.

На данный момент пользуюсь Evernote. Но это тоже не то. Хотелось бы исходного вида страниц + чтобы можно было взять такой веб-архив и перенести на другой комп (как это было и есть с фоксовским скрапбуком).

Расскажите, чем пользуетесь вы?

  • Вопрос задан более трёх лет назад
  • 22953 просмотра

Web scrapbook как пользоваться

Firefox

12 Участник Группа: Members Зарегистрирован: 14-07-2009 Сообщений: 610 UA: 54.0

Re: Способы сохранения и хранения Вэб конетента

MHTML не сохраняет. Потом что это не программа, а формат файла. Сохраняет таки браузер.

ну эт ясно. Я к тому как это умеют [opera] [chrome][chromium]

Выложенный файл у меня Internet Explorer 8 открыть не смог — крутил колёсико ожидания до бесконечности. Хотя сам сайт показывает без существенных дефектов.

[ie]не нужно если есть [opera][chrome]

В общем мне порядком надоели єти танцы с бубном вокруг [firefox]Хотя я на [firefox]с 2005 Этот год будет решающим для меня. И думаю, что я мигрирую все таки на [chromium]
Так как это «кидалово» с e10s+webextentions мне не подходит. Мне пришлось отказаться от моих любимых дополнений которыми пользовался не один год, а это Scrapbook, UnMHT, MAFF, все они не работают с e10s+webextentions а вменяемых замен нет.

№80 27-07-2017 13:03:55

IE

mokujin Участник Группа: Members Зарегистрирован: 17-02-2017 Сообщений: 493 UA: 11.0

Re: Способы сохранения и хранения Вэб конетента

А pdf не ? Print pages to PDF (из мазилла-магазина его убрали по упоротым соображениям , что dll и бинарники в расширениях — это плохо)
The add-on does its job without sending any content over the internet; all processing is done locally, so privacy is guaranteed. Print pages to PDF uses the open source library wkhtmltopdf, with all its power and limitations.
Отлично сохраняет.

. программисты словно войну какую-то ведут за свои обновления. Блин, почему сейчас повсюду мания ухудшать интерфейсы и делать их максимально неудобными?! Radiation

№81 27-07-2017 13:20:40

Firefox

12 Участник Группа: Members Зарегистрирован: 14-07-2009 Сообщений: 610 UA: 54.0

Re: Способы сохранения и хранения Вэб конетента

mokujin
попробовал, не сохраняет. На любой странице «prepearing 100%» и крутится кружок до бесконечности

№82 27-07-2017 13:44:58

IE

mokujin Участник Группа: Members Зарегистрирован: 17-02-2017 Сообщений: 493 UA: 11.0

Re: Способы сохранения и хранения Вэб конетента

все оно сохраняет. яхз. и в PM и в FF (>52) плуг отлчино сохраняет в pdf любые страницы. Хоть текст, хоть картинки, хоть ролики там будут.
смотри свои плугины, смотри консоль, какие ошибки, почему.

. программисты словно войну какую-то ведут за свои обновления. Блин, почему сейчас повсюду мания ухудшать интерфейсы и делать их максимально неудобными?! Radiation

№83 27-07-2017 15:48:55

Firefox

12 Участник Группа: Members Зарегистрирован: 14-07-2009 Сообщений: 610 UA: 54.0

Re: Способы сохранения и хранения Вэб конетента

mokujin
не знаю. Чистый Палемун. Создал новый профиль отключил плуги те что дефолтные(ява, флеш) — не сохраняет — мурыжыт на Prepearing

№84 27-07-2017 16:12:20

IE

mokujin Участник Группа: Members Зарегистрирован: 17-02-2017 Сообщений: 493 UA: 11.0

Re: Способы сохранения и хранения Вэб конетента

вот правда, незнаю. Уже давненько стоит и работает в PМ и в FF. такое было у мя тоже, на каком-то обновлении PM, тоже так тормозился и висел. В консоли ошибки , что-то там про файлы, или не те параметры передавались или не те имена ф-ций(связано было с изменениями в PM) но его вскоре выложили у себя, исправив. И с тех пор уже с пол-года пользуюсь.
Смотри консоль ошибок и ищи что\где\почему.

можешь взять UnMHT — тоже отличный плуг, тоже сохраняет без проблемм и в PM и FF UnMHT for Firefox
тот же MozArchiver Add-ons — MozArchiver | Pale Moon

и есть еще куча сервисов, кнопок(даже тут) , навалом способов разных.

:lol:

зы. Все твои «неработает» тупо связаны с Win10 скорей всего так шо тут увы. перелез на это чучело — терпи.

. программисты словно войну какую-то ведут за свои обновления. Блин, почему сейчас повсюду мания ухудшать интерфейсы и делать их максимально неудобными?! Radiation

№85 28-07-2017 01:10:28

Chrome

12 Участник Группа: Members Зарегистрирован: 14-07-2009 Сообщений: 610 UA: 60.0

Re: Способы сохранения и хранения Вэб конетента

[firefox]

Print pages to PDF что под 10, что под 7, не работает только что проверил
UnMHT и MAFF закрываются в ноябре с выходом 57

Отредактировано 12 (28-07-2017 01:11:44)

№86 28-07-2017 02:03:14

Firefox

mokujin Участник Группа: Members Зарегистрирован: 17-02-2017 Сообщений: 493 UA: 32.0

Re: Способы сохранения и хранения Вэб конетента

Print pages to PDF что под

.. я тебе у же сказал , из под W7 оно работает и в PM и в FF

[firefox]

UnMHT и MAFF закрываются в ноябре с выходом 57

а тебе чего? зачем тебе 57 ? зачем тебе дев..версия FF , если ты не программер?
зачем тебе W10 — если ты не мазохист :P :lol:(а мож да, хехех. )

зачем ты сам себе создаёшь проблеммы, которые ты , в приципе , не способен решить, а? яхз.

Все эти расширения, кнопки, сервисы и библиотеки(wkhtml) писали люди наааааааааамного более шарящие в предмете чем ты и я. За это Я им очень благодарен, не треплюсь попусту, стараюсь разобраться и применить как оно задумано. Ими задумано. Им спасибо, кодерам, хакерам. И оно работает.

Удачи, в молочных реках + кисельных берегахъ твоих грёз. уж извини.

Добавлено 28-07-2017 02:07:03
Кнопку Зделать хорошо_и_красиво_всегда_и_везде — еще пока не создали, хотя запросов мноооооооожество , да.
нету.

Отредактировано mokujin (28-07-2017 02:09:15)

. программисты словно войну какую-то ведут за свои обновления. Блин, почему сейчас повсюду мания ухудшать интерфейсы и делать их максимально неудобными?! Radiation

№87 28-07-2017 02:27:22

Firefox

12 Участник Группа: Members Зарегистрирован: 14-07-2009 Сообщений: 610 UA: 54.0

Re: Способы сохранения и хранения Вэб конетента

mokujin пишет

а тебе чего? зачем тебе 57 ? зачем тебе дев..версия FF , если ты не программер?

[firefox]

еще раз для тех кто в танке — с ноября 2017 с выходом 57 MAFF+UnMHT+Scrapbook(и много других) перестанут работать и разрабатываться

mokujin пишет

зачем тебе W10 — если ты не мазохист

вообще все девайсы и их ОС это в большей или меньшей степени мазохизм. Смотря с чем сравнивать. 10 по сравнению с Линупс совсем не мазохизм.

mokujin пишет

Кнопку Зделать хорошо_и_красиво_всегда_и_везде — еще пока не создали, хотя запросов мноооооооожество , да.
нету.

[firefox]

вот как раз из современных браузеров такое и стараются во всю сделать их разработчики в угоду моде, а я лишь хочу поддержки mhtml в

Отредактировано 12 (28-07-2017 02:28:10)

№88 28-07-2017 02:56:16

Firefox

mokujin Участник Группа: Members Зарегистрирован: 17-02-2017 Сообщений: 493 UA: 32.0

Re: Способы сохранения и хранения Вэб конетента

[firefox]

еще раз для тех кто в танке — с ноября 2017 с выходом 57 MAFF+UnMHT+Scrapbook(и много других) перестанут работать и разрабатываться

дык, я те так и сказал. а ты оказалось танкист

mokujin пишет

а тебе чего? зачем тебе 57 ?

чем тебе , на твой совершенно простой вкус не нравиццо 52 или даже 45 (ESR) ? В них всё работаел и очень хорошо. кардинальных изменений в WEB-e не случилось и долго еще не случится.

[firefox]подох уже, ты этого не видишь. ну желай, хоти. А лучше — беги :lol:

mokujin пишет

Удачи, в молочных реках + кисельных берегахъ твоих грёз.

. программисты словно войну какую-то ведут за свои обновления. Блин, почему сейчас повсюду мания ухудшать интерфейсы и делать их максимально неудобными?! Radiation

№89 17-09-2017 00:40:36

Firefox

12 Участник Группа: Members Зарегистрирован: 14-07-2009 Сообщений: 610 UA: 55.0

Re: Способы сохранения и хранения Вэб конетента

вот только нагуглил расширение 57+, сохраняет страничку в один хтмл файл, еще не тестил но работает не на всех сайтах
Save Page WE

зы похоже что использует для сохранения Base64 кодирование

UPD
а вот этот 57+ аддон умеет хорошо сохранять в PDF
PDF Mage

Отредактировано 12 (21-09-2017 01:58:23)

№90 26-09-2017 15:57:11

Firefox

web_mas Участник Группа: Members Зарегистрирован: 19-02-2013 Сообщений: 70 UA: 56.0

Re: Способы сохранения и хранения Вэб конетента

mokujin пишет

чем тебе , на твой совершенно простой вкус не нравиццо 52 или даже 45 (ESR) ? В них всё работаел и очень хорошо.

mokujin пишет

кардинальных изменений в WEB-e не случилось и долго еще не случится.

Смешно. Просто один из применров:
В [firefox]полноценная поддержка flexbox’ов есть только с 54-ой версии — http://caniuse.com/#feat=flexbox || https://image.prntscr.com/image/0PyNfXH … o1whwQ.png
[chrome]обновляется автоматически (никого не спрашивая). Поддержка flexbox’ов у [chrome]есть аж с марта 2016-ог. Многие разрабы перешли на флексы. Изменения в WEB-e случаются ежесекундно, особенно во фронтэнде. На своих устаревших браузерах, скоро ты неизбежно будешь сталкиваться с поплывшей вёрсткой и с глюками похлеще.

№91 26-09-2017 17:52:04

Firefox

mokujin Участник Группа: Members Зарегистрирован: 17-02-2017 Сообщений: 493 UA: 52.0

Re: Способы сохранения и хранения Вэб конетента

web_mas пишет

полноценная поддержка flexbox’ов

:/

и что это такое?? где его можно пощупать Очередная невиданная хрень , типа овалов, звуковых дорожек в видосиках и прочий изврат?

web_mas пишет

скоро ты неизбежно будешь сталкиваться с поплывшей вёрсткой и с глюками похлеще.

С этим я могу столкнуться, только в случае если дизигнеры-однодневки и их наставники из «корпораций_бобра» , начнут намеренно мне вредить, игнорирую по UA и другим способом; специально давая кривые стили и скрипты — вынуждая делать выбор: или отказаться от ихнего сайта\услуги или менять бравзер на одобренный_кошеrный.

. программисты словно войну какую-то ведут за свои обновления. Блин, почему сейчас повсюду мания ухудшать интерфейсы и делать их максимально неудобными?! Radiation

№92 11-10-2017 13:11:15

Firefox

css Участник Группа: Members Зарегистрирован: 07-04-2014 Сообщений: 186 UA: 56.0

Re: Способы сохранения и хранения Вэб конетента

web_mas пишет

Поддержка flexbox’ов у есть аж с марта 2016-ог. Многие разрабы перешли на флексы. Изменения в WEB-e случаются ежесекундно, особенно во фронтэнде. На своих устаревших браузерах, скоро ты неизбежно будешь сталкиваться с поплывшей вёрсткой и с глюками похлеще.

Поплывшая вёрстка из-за вполне нестарой версии браузера это такое фи, что такой сайт я даже видеть брезгую. Если разработчик уважает пользователей, то он сто раз подумает, прежде чем оставить большой кусок аудитории с перекошенным дизом. Есть масса фиксов и хитростей, чтобы этого избежать. Кто их не использует по неважно какой причине, тот в принципе не веб-строитель, а так, фигулька на подтанцульках и пусть сам свою поделку пользует.

Меня беспокоит не поехавший диз, а безопасность. Ну и вообще, какой-то грустный выбор получается: либо ты сидишь с мегаудобным ScrapBook и упёршейся в тупик, необновляемой версией любимого браузера, либо обновляешь браузер и начинаешь понимать, что любовь, таки, зла. В общем, я бы тоже хотела найти альтернативу ScrapBook, без него прям никак. Чтоб и страницы адекватно сохранял и навигацию по ним организовывал.

№93 22-10-2017 19:39:19

Firefox

Wave Участник Группа: Members Зарегистрирован: 27-09-2007 Сообщений: 494 UA: 52.0

Re: Способы сохранения и хранения Вэб конетента

Сохранил страничку с большим количеством картинок. Картинок внутри не оказалось. Полез в настройки, проставил галочки на всё, что вообще возможно, сохранять, мол, всё-всё-всё. Картинки в файле сохранились, судя по тому, что файл раздуло на четыре мегабайта (предыдущий вариант был в триста кил, а maff этой странички весит два мегабайта). Так вот, картинки в файле сохранились, но я на всякий случай проверил в оффлайне: не отображаются. В онлайне отображаются, но подгружаются с сайта. *censored*

Не люблю PDF как явление, за то, что его открыть можно только в одном из неудобных и тормозных pdf-просмотрщиков, а также за статичность, но похоже, на ближайшее будущее это единственный вменяемый вариант сохранить страницу в один файл.
Не-не! Полная хрень! Во-первых, сохраняет ЧЕРЕЗ СТОРОННИЙ СЕРВИС! Блин, это вообще за гранью добра и зла! Сохранить себе страницу на локальный диск через сторонний сервис. А во-вторых, тоже далеко не всё сохраняет. Ту самую страницу с кучей картинок, о которой написал выше, сохранило без картинок в шести(уже шести-, почти семи-)-мегабайтный файл. Тогда как maff, повторюсь, сохраняет её в два мегабайта и нет никаких проблем как с отображением, так и с тем, чтобы открыть страницу архиватором и полистать отдельно картинки.

Блин, неужели мозилловцы, потерявшие за последние годы солидный кусок аудитории, не боятся растерять её остатки с этими экспериментами?

Отредактировано Wave (22-10-2017 19:45:40)

№94 07-06-2018 13:36:35

Firefox

Wave Участник Группа: Members Зарегистрирован: 27-09-2007 Сообщений: 494 UA: 52.0

Re: Способы сохранения и хранения Вэб конетента

Полгода спустя. Похоже, в квантуме единственный способ нормально сохранять страницу в single-файл — WebScrapbook. В maff или htz.
При том, что функционала веб-органайзера Scrapbook нет и не будет.
Save Page WE не работает.

№95 07-06-2018 17:48:50

Firefox

cisux Участник Группа: Members Зарегистрирован: 16-05-2018 Сообщений: 22 UA: 60.0

Re: Способы сохранения и хранения Вэб конетента

Wave
На некоторых страницах наоборот, работает Save Page WE, а WebScrapbook нет. Я их оба держу.

Расскажите что такого незаменимого было в старом Scrapbook. Никак не могу понять.

Добавлено 07-06-2018 17:52:02
К слову. На странице Save Page WE есть инструкция как много файлов mht перевести в maff несколькими кликами, а потом их можно открыть в WebScrapbook. Я для открытия maff использую Chromium потому что там в настройках дополнений можно разрешить доступ к файловой системе. Для Firefox чтобы открыть файл нужно извращаться со скриптами на Python и возможно локальным сервером, тут инструкция.

Отредактировано cisux (07-06-2018 17:52:52)

№96 09-06-2018 12:46:05

Firefox

Wave Участник Группа: Members Зарегистрирован: 27-09-2007 Сообщений: 494 UA: 52.0

Re: Способы сохранения и хранения Вэб конетента

cisux пишет

Расскажите что такого незаменимого было в старом Scrapbook. Никак не могу понять.

Ну ёлы-палы, блин! Старый скрапбук — это веб-органайзер. А новый — это только сохранение страниц.
Вот представьте, вы вернулись на двадцать лет. Ещё нет гугла, да и инет медленный и дорогой, чтобы каждый раз асталавистить или яхуить нужную страницу. Приходится пользоваться закладками. И вдруг вам дают браузер, не имеющий механизма закладок. И вам приходится их отдельно в текстовом файле хранить и организовывать. Вас это устроит? Достаточно наглядно показывает, почему без скрапбука мне жизнь не мила?

cisux пишет

На некоторых страницах наоборот, работает Save Page WE, а WebScrapbook нет. Я их оба держу.

Остаётся только материться. Т.е. предполагается, что я сохранил страницу, и мне тут же нужно смотреть, как она сохранилась, и если что, пересохранять другим аддоном. Квантум — дно пробито!
Не говоря уже о том, что теперь я не могу открывать maff-файлы одним нажатием, мне сначала нужно запустить квантум, в нём кликнуть на «посмотреть maff», а туда уже перетащить нужный файл драг-н-дропом.
А, ну да, спасибо за инструкцию. Можно и с меньшими усилиями открывать, но предварительно питон поставив. Кстати, по этой же схеме, т.е. ректально, теперь работают и аддоны типа старого it’salltext. Старый был удобнейшим, пара новых аналогов требуют вот эти вот межсерверные взаимодействия, так что проще тупо копи-пастить текстовые области.

№97 10-06-2018 18:08:28

Firefox

cisux Участник Группа: Members Зарегистрирован: 16-05-2018 Сообщений: 22 UA: 60.0

Re: Способы сохранения и хранения Вэб конетента

Wave пишет

Достаточно наглядно показывает, почему без скрапбука мне жизнь не мила?

Понятно возмущение, что Scrapbook стал по сути UnMHT. Но при этом сохранил старое название. Но вот меню старого Scrapbook с его хранением файлов в профиле да еще в распакованно виде мне не нравилось и плюсов по сравнению с обычным хранением .mht или .maff файлов в структуре каталогов я не видел. К тому же в Total Commander (или krusader в kde) я могу просто переключиться в древовидный режим каталогов и по сути будет то что в старой боковой панели.

Wave пишет

Можно и с меньшими усилиями открывать, но предварительно питон поставив

WebExtensions дополнения могут общаться с софтом через запрос-ответ. Только эту программу предварительно нужно написать. Вот оно: Native messaging. Питон в данном случае выбрали потому что на нем быстрее всего было сляпать скрипт. Можно было и обойтись программой в пару кило байт.

В теории. Не знаю точно как сейчас хранится кэш Firefox. Но если он изолирован по сайтам, то поддержку mht можно реализовать такой отдельной маленькой программой, которая просто находила бы текущий кэш и паковало бы его в mht (zip по сути).

:)

Но сама по себе проблема сохранения страницы целиком глубже. Современные сайты построены на js. В теории возможно, что один и тот же url с одними и теми же параметрами может вернуть разные данные в зависимости от времени между запросами и положения звезд на небе вообще. А чтобы контент сайта не воровали туда могли еще и случайную строку добавлять к каждому url. Сервер знает как с ними обращаться, а вот браузер при загрузке такой сохраненной страницы — нет.
Короче говоря. Всегда есть вариант при котором страницу сохранить невозможно. И уже не важно XUL это дополнение или нет.
С ростом популярности js фреймворков количество страниц, которые нельзя будет сохранить будет расти. А если популярность наберет какой-то плагин-обфускатор запросов по url, то сохранить нельзя будет вообще ничего. Разве что делать что-то вроде uBlock Origin (adBlock) с подписками в которых будет приходить алгоритм для обхода таких плагинов. Но это по настоящему адская работа, обходить такие проверки.

Вот такое печальное будущее. То что сейчас большинство страниц можно сохранить даже с помощью Web Scrapbook это скорее остатки старых веб технологий. И они со временем исчезнут.
Нужно искать какой-то другой способ. Или привыкать хранить страницу в картинке png.

WebScrapBook

web-scrapbook icon

Расширение браузера, которое точно фиксирует веб-страницу с помощью настраиваемых конфигураций.

  • Open Source Free
  • Vivaldi Browser
  • Opera
  • Firefox
  • Chrome
  • Linux
  • Mac
  • Windows
  • Android

WebScrapBook — это расширение для браузера, которое фиксирует веб-страницу с настраиваемыми конфигурациями. Этот проект унаследован от устаревшего аддона Firefox ScrapBook X.

Wab-страницу можно сохранить в виде папки, архивного файла в формате zip (HTZ или MAFF) или в виде отдельного HTML-файла (по желанию можно добавить его в сценарий). Архивный файл можно просмотреть, открыв страницу индекса после распаковки, используя встроенную программу просмотра архивной страницы или другие вспомогательные инструменты.

С работающим внутренним сервером, который может быть размещен с пакетом Python webscrapbook, захваченные веб-страницы могут быть далее организованы с помощью папок, разделителей и т. Д. Также встроен индексатор сайта, который можно использовать для создания статического сайта для захваченных веб-страниц. Кроме того, папка данных устаревшего ScrapBook X может быть импортирована с помощью индексатора.

Это расширение доступно для браузеров на базе Chromium (Google Chrome, Opera, Vivaldi и т. Д.), А также Firefox для настольных ПК и Android.

Просмотр веб-архивов MHT в браузере

Аддон UnMHT помер, других средств просмотра MHT в новом Firefox Quantum нет (и, возможно, не будет), так что вот:

На моих файлах работает. Принимаю баг-репорты.

opennota
08.05.18 20:14:08 MSK

почему никто не конвертит в pdf или какой-нибудь формат вебархива?
тогда можно просто натравить программу на кучу файлов один раз, и всё. а не пользоваться ей каждый раз.

system-root ★★★★★
( 08.05.18 20:20:21 MSK )

ptah_alexs ★★★★★
( 08.05.18 20:23:56 MSK )
Ответ на: комментарий от ptah_alexs 08.05.18 20:23:56 MSK

A wab page can be saved as a folder, a single HTML file, a scripted single HTML file, or a ZIP-packed archive file (HTZ or MAFF). An archive file can be viewed via the built-in archive page viewer, or by opening the entry page after unzipped.

opennota
( 08.05.18 20:28:21 MSK ) автор топика
Ответ на: комментарий от system-root 08.05.18 20:20:21 MSK

mht и есть один из форматов веб-архива.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *