Проект:Библиотека/Инструментарий

Google Books Downloader

Для удобного скачивания книг с Google Books существует средство Google Books Downloader. Скачать можно с

  1. сайта проекта http://www.gbooksdownloader.com/ (инсталлятор)
  2. https://yadi. sk/d/FEFr1RGhkZMcz (распаковано и пригодно к использованию).

Программа позволяет скачать и сформировать в виде одного файла все страницы, доступные с вашего ip-адреса.

Второй вариант может оказаться предпочтительней, поскольку штатный инсталлятор при недостаточно аккуратном использовании приведёт к появлению в системе огромного количества нежелательного ПО, которое будет сложно удалить. Также во втором варианте удалён limit.jpg, вставляемый вместо недоступных страниц. Если вы решите воспользоваться первым вариантом, то этот файл надо удалить из каталога установки.

Алгоритм работы программы интуитивно понятен:

  1. В поле Google Book URL указывается адрес книги, например https://books.google.ru/books?id=js30HODt2aYC
  2. В поле Output folder указывается место, куда должна быть сохранена книга.
  3. Опционально указывается формат и разрешение страниц. Для определённости пусть это будут настройки по умолчанию, pdf и 800px.
  4. Нажать кнопку Start, дождаться результата и проверить его.

wGooBooDo

Участник u:kmorozov создал программу для загрузки книг из Google Books. Она предоставляет возможность использовать как интуитивно понятный графический интерфейс, так и интерфейс командной строки. Написана на Java. Разумеется, open source, GitHub. Логика работы программы такая: она выкачивает и аккуратно складывает в папку страницы указанной книги. Папка отдельная для каждой книги, и собирает их в pdf файл. В целом, утилита выкачивает не меньше, чем видно в браузере. А при многократном запуске больше, так как при последовательных запусках могут открыться новые страницы, такие вот чудеса.

Пользоваться очень просто:

  1. Установить Java не ниже 13-й, скачанную по ссылке
  2. Скачать последнюю версию программы с https://github.com/kvmorozov/wGooBooDo/releases
  3. В командной строке: java -jar [имя файла].jar -i BEvEV9OVzacC -o C:\Work\imgOut — надо запускать из папки, куда положена утилита.
Здесь -i — идентификатор книги (обязательный параметр) (Если адрес книги https://books.google.ru/books?id=E_2twD6wgE0C , то её ид = E_2twD6wgE0C);
Здесь -o — корневая папка, куда будут скачиваться страницы (обязательный параметр);
Есть ещё необязательный параметр -p — управление используемыми прокси-серверами. Можно указать местоположения файла со списком адресов прокси в формате <ip:port> , по одной записи в строке или "web" для скачивания списка с http://www.proxz.com/proxy_list_anonymous_us_0.html . Экспериментальная поддержка браузера tor в качестве прокси доступна для энтузиастов, которые соберут программу из исходников.
Есть ещё необязательный параметр -w — можно задать желаемое разрешение скачиваемых страниц (максимум = 1280).
Есть ещё необязательный параметр -r — если флаг указан, то программа смотрит - если ранее была скачана страница в более низком качестве, чем указано сейчас в параметре -w, то страница перескачивается (если она доступна). Также перегружает битые файлы.
Есть ещё необязательный параметр -s — безопасный режим, все запросы будут выполняться только через прокси.
Есть ещё необязательный параметр -a — данные аутентификации, может быть использовано а случае, если параметр -i указывает на ид из archive.org. В таком случае должно быть примерно так: -i docereverboetexe0000bynu -a <логин или email> <пароль>. Необходимо перед использованием сделать borrow книги.
Необязательный параметр -x pdf_skip — отключает сборку скачанных страниц в pdf-файл.

В конце работы программа выдаёт отчёт о пока ещё нескачанных страницах. Среднестатистически, запуская программу в течение недели, можно скачать 80-90% страниц любой книги.

1dollarscan

Расположенный в США сервис деструктирующего сканирования книг. Удобен возможностью прямой пересылки книг из магазинов, что при заказе в США или Канаде может быть значительно дешевле пересылки в другой регион.

Краткая инструкция по использованию (для не имеющих Platinum/Platinum Lite подписки на сайте):

(0.) Зарегистрируйтесь на сайте, после регистрации подтвердите свой адрес электронной почты, пройдя по ссылке в присланном письме.
1. Определившись с книгой или книгами, которые вы планируете отсканировать, создайте новый заказ.
1.1. В начале страницы заказа укажите количество полных или неполных 100-страничых блоков (sets), на которые будет разделена ваша книга. К примеру, если в книге 220 страниц, то необходим указать «3 Sets». Блоки считаются для каждой книги отдельно, две книги по 220 страниц — это 6 блоков, а не 5.
1.2. Уберите все дополнительные опции, добавьте «Amazon Direct — 1$/Set; Accept direct shipment from Amazon or other online book stores.» Если вы волнуетесь об успехе сканирования, можно также добавить «Rescan Insurance — 0.2$/Set», однако до сих пор мне (DR) она ещё ни разу не потребовалась. Если вы присылаете не книгу, а журнал (или журналы) — выберите дополнительно опцию «Magazine»
1.3. Оформите и оплатите заказ (оплата обычно через PayPal). После оплаты вы получите номер заказа. Этот же номер можно посмотреть в списке своих заказов (Order History). Номер выглядит как несколько групп чисел — к примеру «1234-23456-48-1-1-0». В будущем вас интересуют только первые две части (в приведённом примере — «1234-23456»)
2. Найдите книгу в любом онлайн-магазине или аггрегаторе (Amazon, abebooks и т. д.). Скорее всего вас устроит и б/у книга — они обычно значительно дешевле новых, а информация там та же самая.
2.1 Закажите её. В качестве адреса доставки укажите:
1DollarScan.com (zLibro Inc.) - (Ваше имя)
1723 Rogers Avenue Suite G
(Note: первые две части номера заказа)
San Jose, CA 95112
Для вышеприведённого номера заказа адрес может выглядеть как:
1DollarScan.com (zLibro Inc.) - (Ivan Ivanov)
1723 Rogers Avenue Suite G
(Note: 1234-23456)
San Jose, CA 95112
В случае, если требуется телефон, укажите (650)492-5111
Более подробно это описано на странице How to send, в секции «Sending a package by our Amazon Direct option», иллюстрация «Regular Online BookStore Label»
3. Ждите. Вы получите уведомление от 1dollarscan после получения ими вашей посылки и ещё одно — после того, как сканирование будет завершено.

Примечание: Будьте внимательны при выборе количества сетов в заказе! Если вы купили меньше сетов, чем требуется (например, книга на 566 страниц, Вы купили 5 сетов, хотя нужно 6), НЕ ДОКУПАЙТЕ 1 сет. Это вызовет БЕСКОНЕЧНОЕ количество проблем. Дождитесь, когда книга дойдет до компании, компания получит книгу и выставит инвойс на недостающий сет.

В случае возникновения вопросов обращайтесь в службу поддержки 1dollarscan или к участнику DR.

Книги из Архива Интернета

Дешифровка шифрованного PDF

Архив Интернета содержит защищённые DRM сканы множества книг, которые можно "взять" на небольшой срок. Есть возможность снять с таких файлов защиту от копирования и получить обычный файл. Для этого:

  1. Создайте учётную запись на сайте Архива Интернета (в правом верхнем углу сайта - SIGN UP).
  2. На странице интересующей вас книги нажмите сверху кнопку "Borrow this book", после чего ниже в правой колонке DOWNLOAD OPTIONS скачайте .acsm-файл интересующего вас формата (epub, pdf...). Единовременно вы можете взять не более нескольких книг, досрочно вернуть их вы можете нажатием кнопки "Return it" на месте "Borrow".
  3. Способ 1:
    1. Скачайте установщик программы Adobe Digital Editions с этой страницы, установите её. Теперь .acsm-файлы будут открываться в ней, запустите такой файл, программа Adobe Digital Editions загрузит зашифрованный файл и позволить просматривать его внутри себя в течение ранее определённого срока.
    2. Снять защиту от копирования можно разными программами, например
  4. Способ 2:
    1. С помощью утилиты wGooBooDo (см. выше) с ключами -o <путь для сохранения> -i <ид книги> -a <аккаунт> <пароль>
    2. Если какие-то страницы не прокачались, запустить повторно

ВНИМАНИЕ - расшифровка сработает, если срок взятия книги ещё не истёк и вы не вернули её досрочно. После расшифровки книгу можно сдавать.

Снятие скриншотов страниц

Качаете бесплатную программу ShareX отсюда. Берёте книгу, открываете её в браузере так, как вы будете её скриншотить (конкретно в вебархиве можно уменьшить интерфейс браузера через контрол-минус несколько раз, тогда отображаемый размер страниц книги увеличится до максимума, я сейчас так делал). Запускаете шарекс, в левой колонке-меню выбираете "Настройки задач" (возможно, сначала надо будет переключить интерфейс на русский, ну или поймёте, как это на английском), там выбираете в левой же колонке "Захват" и в настройках внизу жмёте "Выбрать область", после чего обводите мышкой рамкой разворот книги в браузере. Закрываете крестиком окно настроек, выбираете ниже пункт "Горячие клавиши", в пункте "Захват подготовленной области экрана" назначаете клавишу, нажатием которой вы будете делать снимки (у меня это была клавиша рядом с энтером, где русская "э"). Закрываете окно настроек, утаскиваете окно шарекса вбок, чтобы оно не перекрывало разворот книги и жмёте последовательно кнопку снимка и стрелку вправо, чтоб листать страницы (иногда нужно чуть подождать, чтобы страница прогрузилась): э → э → э → э → ... Когда дойдёте до конца, все страницы будут сохранены в папку, указанную в настройках программы, по умолчанию должно быть что-то вроде "Мои документы/ShareX/Screenshots/yyyy-mm/".