Wget - это утилита командной строки, которую можно использовать для загрузки практически всего, что доступно в Интернете. Суть в том, что он должен быть доступен по протоколам HTTP, HTTPS или FTP; в противном случае Wget не сможет его скачать. Существует несколько способов использования Wget, например, вы можете использовать Wget для загрузки каждого изображения на веб-сайте, или вы также можете скачать один файл. Wget даже способен возобновить загрузку, когда это возможно. Итак, если вам интересно, как работает Wget и что он может для вас сделать, вот как использовать Wget :
Установка Wget
1. Установка Wget на MacOS Sierra
Прежде чем мы начнем использовать Wget, нам нужно установить его в нашей системе. К счастью, большинство дистрибутивов Linux поставляются с предустановленным Wget, так что вам не придется выполнять дополнительную работу. Однако, если вы работаете на Mac, вам придется установить Wget. Это можно легко сделать с помощью Homebrew (скачать). Если вам нужна помощь, вот шаги, которые вы должны будете выполнить:
- Во-первых, вам нужно будет установить Homebrew на ваш Mac, чтобы иметь возможность загрузить Wget. Для этого просто запустите терминал и введите следующую команду:
/ usr / bin / ruby -e "$ (curl -fsSL //raw.githubusercontent.com/Homebrew/install/master/install)"

- После завершения команды Homebrew будет установлен в вашей системе. Теперь вы можете использовать Homebrew для установки пакетов, таких как Wget. В Терминале просто запустите следующую команду:
заваривать установить Wget

- Homebrew автоматически начнет загрузку, распаковку и установку Wget в вашей системе. Этот шаг может занять некоторое время, в зависимости от скорости вашей сети, поэтому наберитесь терпения. После завершения команды вы сможете использовать Wget на своем Mac. Чтобы проверить, установлен ли он, просто используйте команду:
Wget -V

2. Установка Wget на Windows
Установка Wget на Windows занимает немного больше усилий, но это легко сделать. Если вы хотите установить Wget на ПК с Windows, просто выполните следующие действия:
- Сначала загрузите Cygwin, а затем запустите загруженный установочный файл .
- Когда он запрашивает источник загрузки по умолчанию, выберите параметр « Установить из Интернета » и нажмите «Далее».

- Выберите каталог для установки Cygwin, а также каталог, в котором он будет сохранять файлы пакетов для установки утилит.

- На следующем экране вам необходимо выбрать подключение к Интернету. Если вы используете прокси-сервер, выберите тип прокси-сервера и заполните данные. Тем не менее, для большинства пользователей выбор будет « Прямое подключение ».

- Затем вам будет показан список зеркал, выберите любое из них для загрузки Cygwin. Если загрузка не удалась, вы можете попробовать еще раз с другим зеркалом.

- В следующем окне найдите «wget» и нажмите на плюс рядом с «web» в появившемся списке. Здесь флажок рядом с « wget » будет установлен автоматически. Просто нажмите «Далее».

- На следующем экране будут показаны пакеты, которые необходимо загрузить. Просто нажмите «Далее».

- После завершения установки вам будет предложено создать значок на рабочем столе и / или добавить запись в меню «Пуск» . Это полностью вопрос личных предпочтений, но я бы посоветовал вам хотя бы добавить его в меню «Пуск», чтобы вы могли легко его найти.

Вот и все. Wget теперь установлен на вашем ПК с Windows. Однако вы не сможете запустить его из командной строки. Вместо этого вам придется запустить терминал Cygwin и использовать Wget оттуда .
Как использовать Wget
Теперь, когда мы установили и запустили Wget в нашей системе, давайте рассмотрим все интересные способы использования Wget для загрузки файлов, папок и даже целых веб-сайтов из Интернета. Вот несколько интересных вещей, которые вы можете сделать с помощью Wget в своей системе.
Примечание : я использую Wget на MacBook Air с бета-версией macOS Sierra 10.12.3. Однако, поскольку используемая нами утилита одинакова (Wget), команды будут одинаковыми в любой операционной системе, в которой вы можете использовать Wget.
1. Используйте Wget для загрузки файлов
Вы можете использовать Wget для загрузки файлов из Интернета с легкостью. Просто используйте следующую команду
Wget

- Загрузите файл и сохраните его с определенным именем файла
Файлы на серверах иногда имеют самые странные имена, и вы можете захотеть загрузить файл, и Wget автоматически переименует его в нечто более подходящее для вас. Для этого просто используйте следующую команду
Wget -o

- Загрузить только определенные типы файлов
Веб-сервер может содержать несколько разных файлов. Итак, что, если вы хотите загрузить все PDF-файлы на сервер или, возможно, все GIF-файлы? Просто используйте следующую команду:
wget -r -A pdf

Эта конкретная команда была введена Марком Цукербергом в его комнату в общежитии Гарварда, чтобы загрузить все изображения одной командой и создать печально известный веб-сайт facemash.com.
wget -r -A jpg, jpeg, png, bmp

2. Скачивайте файлы с нескольких URL с помощью Wget
Скажем, вам нужно скачивать файлы из разных мест в Интернете. Может быть PDF-файл на url1, важный ZIP-файл на url2 и что-то еще в url3 . Если вы использовали Wget традиционным способом, вам придется запустить его три раза. Тем не менее, есть гораздо более простой способ сделать это.
- Сначала создайте файл со всеми URL-адресами, с которых необходимо загрузить данные. Убедитесь, что вы держите каждый URL в отдельной строке . Сохраните файл и убедитесь, что вы помните имя.

- В терминале используйте следующую команду для загрузки файлов со всех URL-адресов:
Wget -i

где « имя_файла » - это имя файла, который вы создали со всеми URL, необходимыми для загрузки материалов.
3. Скачать весь сайт с Wget
Да, вы правильно прочитали. Вы также можете использовать Wget для загрузки содержимого всего сайта. Очевидно, что если веб-сайт слишком большой, выполнение этой команды займет много времени, не говоря уже о том, что оно будет занимать много места в вашей системе. Тем не менее, если вы хотите использовать Wget для загрузки всего сайта, просто используйте следующую команду:
wget --mirror -p -P ./LOCAL-DIR ВЕБ-САЙТ-URL

Это позволит загрузить весь веб-сайт в папку « LOCAL-DIR » внутри вашего рабочего каталога. Файлы сайта будут храниться в папке с тем же именем, что и сайт, благодаря « WEBSITE-URL ».
4. Используйте Wget в качестве веб-паука
Вы также можете заставить Wget действовать как веб-сканер (или веб-паук). Это полезно, если вы хотите подтвердить, что URL-адрес файла, который вы хотите загрузить, действителен . Чтобы использовать Wget в качестве веб-паука и проверить правильность URL-адресов, просто используйте следующую команду:
wget --spider

Это проверит, существует ли упомянутый вами URL, и вы получите ответ, сообщающий вам результаты проверки.
- Положительный ответ:

- Отрицательный ответ:

5. Продолжить незавершенные загрузки
Это еще одна крутая вещь, которую может сделать Wget. Скажем, вы скачивали файл с помощью Wget, но по какой-то причине вам пришлось выключить ноутбук. В следующий раз, когда вы захотите загрузить этот же файл, Wget сможет продолжить загрузку для вас. Вам просто нужно убедиться, что вы находитесь в той же папке, куда вы загружали файл в прошлый раз, а затем использовать следующую команду:
wget -c

Когда Wget обнаружит, что часть файла уже присутствует в вашей системе, он автоматически продолжит загрузку.
Примечание . Если файл на сервере был изменен с момента последней попытки его загрузки, вам не следует использовать эту команду, так как это приведет к повреждению файла, который вы не сможете прочитать.
Кроме того, если сервер не позволяет продолжить загрузку, то Wget откажется начинать загрузку с нуля. Если вы хотите начать загрузку с нуля, сначала вам придется удалить частично загруженный файл из вашей системы .
Есть еще несколько условий использования этого аргумента, и вы можете прочитать больше об этом на странице руководства Wget.
6. Ограничить скорость загрузки
Если вы используете Wget для загрузки файлов и просматриваете интернет вместе с ним, вы, вероятно, не захотите, чтобы вся ваша пропускная способность использовалась Wget. К счастью, в Wget есть аргумент, который вы можете использовать для ограничения пропускной способности, которую Wget может использовать для загрузки файлов в вашей системе:
wget --limit-rate =

Примечание : имейте в виду, что скорость указана в байтах, а не в битах. Итак, если вы используете Wget –limit-rate = 20k, это ограничит использование полосы пропускания 20 кБ, а не 20 кБ.
7. Используйте Wget для загрузки файлов с FTP-серверов.
Если вам нужно загрузить файл с FTP-сервера, вы можете сделать это и с помощью Wget. Просто используйте следующую команду для загрузки файлов с FTP-серверов:
Wget

- Скачать файлы с FTP-серверов с логином
Если вашему FTP-серверу требуется логин для загрузки файлов, вы также можете просто передать учетные данные с помощью Wget. Просто используйте следующую команду:
wget --ftp-username = ИМЯ ПОЛЬЗОВАТЕЛЯ --ftp-пароль = ПАРОЛЬ

Легко используйте Wget для загрузки файлов из Интернета
Вы можете использовать Wget для загрузки файлов из любого места в Интернете. Однако, хотя Wget почти всегда работает, существуют определенные серверы, которые запрещают доступ к Wget, и в этом случае вы можете попробовать изменить параметр –user-agent для своей команды Wget. Однако это не рекомендуемый курс действий, если вы не знаете, что делаете. По большей части, Wget позволит вам скачать любой файл из Интернета, если у вас есть доступ к нему и его URL.
Итак, вы когда-нибудь использовали Wget для загрузки файлов из Интернета? Сообщите нам о своем опыте использования Wget для загрузки файлов по протоколам HTTP, HTTPS и FTP. Кроме того, если вы знаете о некоторых других применениях Wget, которые, по вашему мнению, заслуживают того, чтобы быть в этом списке, сообщите нам о них в разделе комментариев ниже.