Электронная библиотека книг Александра Фролова и Григория Фролова.
 
Библиотека
Братьев
Фроловых
Электронная библиотека книг Александра Фролова и Григория Фролова.
Библиотека системного программиста
Программирование на JAVA
ПК. Шаг за шагом
Другие книги
Восстановление данных
Антивирусная защита
Статьи для
программистов
Пользователю компьютера
[Назад] [Содержание] [Дальше]

Всемирная паутина. Ваш спутник в Интернете

(С) Александр Фролов, Григорий Фролов, 2000

  • Глава 7 Утилиты для Web
    • Автоматизированная загрузка файлов
    • Копирование материалов с серверов Web
    • Перевод содержимого страниц Web
    •  

      7. Утилиты для Web

      Современные браузеры способны выполнять практически любую работу, связанную с просмотром и печатью страниц серверов Web, а также с загрузкой файлов. Однако, несмотря на это, разработаны и разрабатываются сотни различных дополнительных утилит (программ), облегчающих решение типовых задач в Интернете.

      В этой главе мы расскажем об установке, настройке и использовании утилит, облегчающих загрузку отдельных файлов и содержимого серверов Web, а также обеспечивающих автоматический перевод текста страниц с одного языка на другой (в частности, с английского, немецкого и французского на русский).

      Большинство описанных утилит можно бесплатно загрузить из Интернета, хотя за их использование в течение длительного времени придется заплатить небольшую сумму денег.

      Автоматизированная загрузка файлов

      В предыдущей главе мы рассказывали, как с помощью браузеров Microsoft Internet Explorer и Netscape Communicator загружать файлы, расположенные на серверах Web. Этот способ достаточно хорош, но обладает одним существенным недостатком — при случайном обрыве связи процесс загрузки файла в большинстве случаев приходится начинать с самого начала.

      Утилиты автоматизированной загрузки файлов умеют возобновлять прерванный процесс загрузки файла с того места, на котором он оборвался. Такая возможность особенно полезна, если Ваш компьютер подключен к Интернет через модем и коммутируемую телефонную линию связи. При загрузке файлов размером в несколько мегабайт применение упомянутых утилит позволит сэкономить немало времени.

      Хотя на сегодняшний день создано множество утилит автоматизированной загрузки файлов, мы остановимся только на двух — ReGet и Download Accelerator. Первая обладает превосходным интерфейсом и снабжена подробной документацией (на русском языке), а вторая обеспечивает ускоренный процесс загрузки по сравнению с обычным браузером.

      Утилита ReGet

      Эту утилиту Вы можете бесплатно загрузить с сервера http://www.reget.com. Дистрибутивный файл ReGet версии 1.6 занимает примерно 700 кбайт дисковой памяти, поэтому его загрузка не отнимет много времени. Загрузив и установив эту замечательную программу, Вы облегчите и ускорите загрузку других описанных в нашей книге утилит, предназначенных для работы в Интернете. Поэтому мы рекомендуем Вам обязательно познакомиться с этой программой.

      Заметим, что на сервере http://www.reget.com предлагается две версии утилиты. Одна из них бесплатная, однако при ее использовании в окне утилиты отображаются рекламные баннеры. Вторая не будет раздражать Вас рекламой, но Вам придется зарегистрироваться, и эта услуга платная (впрочем, стоимость ее не слишком высока).

      Установка

      Загрузив дистрибутивный файл, который для бесплатной версии 1.6 называется rgl16ru.exe, запустите его на выполнение. На экране появится диалоговое окно с предложением ввести личную информацию (рис. 7-1).

      Рис. 7-1. Диалоговое окно для сбора статистики

      Вы можете заполнить поля в этом окне или проигнорировать их, щелкнув кнопку OK. Далее предлагается указать путь к каталогу для установки программы (рис. 7-2).

      Рис. 7-2. Выбор пути для установки программы

      Согласитесь с предложенным каталогом или выберите другой каталог, щелкнув кнопку Browse (хотя программа установки утилиты ReGet «разговаривает» на английском языке, сама эта утилита обладает русским пользовательским интерфейсом). Когда Вы щелкнете OK, начнется копирование файлов утилиты и перезагрузка операционной системы.

      Настройка параметров работы

      Когда Вы попытаетесь запустить программу ReGet в первый раз сразу после установки, то увидите на экране первое окно мастера настройки параметров, показанное на рис. 7-3.

      Рис. 7-3. Первое окно мастера настройки параметров утилиты ReGet

      Здесь просто щелкните кнопку Далее (Next). Мастер предложит Вам указать путь к каталогу, в котором будут храниться файлы (рис. 7-4).

      Рис. 7-4. Указание пути к каталогу для загрузки файлов

      Выберите здесь с помощью кнопки Обзор любой каталог, расположенный на диске с достаточным свободным пространством, а затем щелкните кнопку Далее (Next).

      Если Ваш компьютер подключен к Интернету через офисную локальную сеть (интрасеть), поинтересуйтесь у администратора сети, есть ли в ней прокси-серверы и какие им присвоены адреса. Прокси-серверы применяются для защиты локальной сети от вторжения из Интернета. Их адреса для работы с серверами FTP и Web нужно указать в соответствующих полях окна, показанного на рис. 7-5.

      Рис. 7-5. Указание адресов серверов прокси

      Пользователи домашних компьютеров, подключенных к Интернету напрямую, не должны отмечать флажки Использовать для FTP и Использовать для HTTP.

      В последнем окне мастера выберите простой или расширенный режим, а также отметьте флажок Просмотр документации (рис. 7-6).

      Рис. 7-6. Выбор режима работы утилиты ReGet

      Щелкнув кнопку Готово (Finish), Вы увидите главное окно программы. На рис. 7-7 мы показали это окно в простом режиме (отображается только самая необходимая информация). Всего же режимов два — простой и расширенный.

      Рис. 7-7. Окно утилиты ReGet в простом режиме отображения

      Загрузка файлов

      Пользоваться утилитой ReGet совсем несложно. Щелкнув правой клавишей мыши ссылку на файл, расположенную на странице Web, выберите из меню строку Закачать с помощью ReGet. На экране появится окно Параметры закачки, показанное на рис. 7-8.

      Рис. 7-8. Окно Параметры закачки

      В большинстве случаев для запуска загрузки файла Вам нужно просто щелкнуть кнопку OK. Сразу после этого в главном окне утилиты появится новая строка, отражающая процесс копирования. На рис. 7-9 эта строка — в нижней части окна утилиты.

      При необходимости, однако, Вы можете уточнить адрес URL, отредактировать путь к каталогу, в котором будет сохранен загруженный файл, изменить имя файла, а также задать идентификатор и пароль для доступа к файлу.

      Рис. 7-9. Запущена загрузка нового файла

      Таким способом можно запустить загрузку нескольких файлов одновременно.

      Средства меню и кнопки инструментальной панели позволят Вам управлять процессом загрузки отдельных файлов, приостанавливая, возобновляя или прекращая этот процесс.

      В окне утилиты для каждой загрузки отображается такая информация, как общий размер файла и размер загруженного фрагмента файла, приблизительное время, необходимое для завершения процесса загрузки, и средняя скорость загрузки.

      Расширенный режим работы

      Выбрав из меню Настройки строку Расширенный режим, Вы увидите более подробную информацию о процессе загрузки (рис. 7-10).

      Рис. 7-10. Окно утилиты ReGet в расширенном режиме отображения

      По диаграмме, расположенной в левом верхнем углу окна, а также в правой части панели состояния, можно судить об изменении скорости загрузки с течением времени. В нижней части окна помещается служебная информация, отражающая все этапы выполнения загрузки.

      Если в процессе загрузки файла оборвется соединение с сервером провайдера, то после его восстановления утилита ReGet попытается продолжить загрузку файлов с прерванного места. Все, что Вам нужно сделать для продолжения загрузки, это восстановить соединение с Интернетом и запустить программу ReGet.

      Дополнительную информацию об использовании утилиты ReGet Вы найдете в электронной справочной документации, воспользовавшись в меню Помощь, а также на сервере разработчика утилиты по адресу http://www.reget.com. Вся документация переведена на русский язык и достаточно просто изложена, поэтому мы рекомендуем Вам обязательно с ней ознакомится.

      Утилита Download Accelerator Plus

      Другая утилита, аналогичная по своему назначению только что рассмотренной программе ReGet, называется Download Accelerator Plus и доступна для бесплатной загрузки с сервера http://www.lidan.com. Она также поставляется в двух вариантах — бесплатно, но с рекламой, или без рекламы, но с платной регистрацией.

      Помимо возможности возобновления прерванной загрузки файлов с серверов Web и FTP, эта утилита способна ускорять сам процесс загрузки.

      За счет чего это возможно?

      Для загрузки файла утилита Download Accelerator Plus устанавливает с сервером не одно, а несколько соединений, причем иногда сразу с несколькими серверами. При этом пока одно из соединений находится в состоянии ожидания, другое используется для передачи данных.

      Утилита Download Accelerator Plus умеет подбирать для загрузки файла зеркальные серверы (то есть имеющие идентичное содержание, но расположенные в разных местах и по разным адресам), обладающие наилучшими характеристиками.

      Установка и использование

      Теперь мы расскажем об установке и использовании этой программы.

      Загрузив дистрибутивный файл с именем dap3908.exe, запустите его на выполнение и следуйте инструкциям, появляющимся на экране. По завершениb установки необходимо перезапустить браузер.

      Далее загружайте файлы при помощи браузера, как обычно. При попытке загрузить файлы типа EXE, ZIP, MP3, ARJ, RAR, LZH, Z, GZ, GZIP, TAR, BIN, MP3, AVI и MPG на экране появится диалоговое окно Download File Info, показанное на рис. 7-11.

      Рис. 7-11. Диалоговое окно Download File Info

      В поле URL здесь отображается адрес URL загружаемого файла. Щелкнув кнопку Change, задайте путь к каталогу, в котором будет сохранен загружаемый файл. Этот путь отобразится в поле Save As.

      Для запуска загрузки щелкните кнопку Start Download. На экране появится окно, в котором отражается процесс загрузки (рис. 7-12).

      Рис. 7-12. Запущена загрузка файла

      В окне появятся различные статистические данные и параметры загрузки. Обратите внимание на поле Resume. Если в этом поле имеется строка Resume NOT supported, это означает, что утилита не сможет восстановить прерванную загрузку для этого сервера. Причина в том, что некоторые серверы не способны возобновлять отправку файла с прерванного места, а всегда начинают эту операцию заново. При загрузке большого файла лучше поискать его на других серверах, способных восстанавливать прерванные загрузки. Заметим, что иногда при работе с прокси-серверами не удается возобновить прерванную загрузку.

      В качестве примера на рис. 7-13 показан процесс загрузки утилиты EraseUndo с другого сервера.

      Рис. 7-13. Сервер способен восстановить прерванную загрузку

      В поле Resume здесь находится строка Resume supported. Это признак того, что сервер способен возобновить прерванную загрузку файла.

      Процесс загрузки также отображается в главном окне утилиты Download Accelerator Plus (рис. 7-14).

      Рис. 7-14. Главное окно утилиты Download Accelerator Plus

      Чтобы возобновить прерванную загрузку, достаточно дважды щелкнуть левой клавишей мыши по соответствующей строке в этом окне.

      Если Вам известен точный адрес URL загружаемого файла, нет необходимости выполнять загрузку из браузера. Запустите утилиту Download Accelerator Plus, выберите из меню Url строку Add New URL и введите адрес в окне Enter new URL (рис. 7-15).

      Рис. 7-15. Окно для ввода адреса URL загружаемого файла

      Разрешается временно отключать утилиту Download Accelerator Plus. Для этого запуская загрузку файлов, щелкните мышью соответствующую ссылку при нажатой клавише Alt.

      Настройка параметров

      Чтобы вызвать на экран окно настройки параметров утилиты Download Accelerator Plus, выберите из меню Downloads строку Options/Configurations. На экране появится окно с разделом общих параметров программы General (рис. 7-16).

      Рис. 7-16. Раздел общих параметров программы General

      Здесь в поле Default download directory нужно указать путь к каталогу, в который будут сохраняться загружаемые файлы. Для выбора каталога щелкните кнопку Browse. В поле Temporary directory укажите путь к каталогу для хранения временных файлов. Этот каталог должен быть расположен на диске с достаточным свободным объемом.

      Флажки Integrate into Microsoft Internet Explorer и Integrate into Netscape Communicator нужно оставить отмеченными. При этом программа Download Accelerator Plus будет интегрирована с браузерами Microsoft Internet Explorer и Netscape Communicator.

      Заметим, что данная утилита способна работать и с другими браузерами, но без интеграции. В этом случае Вам либо придется вводить адрес загружаемого файла вручную (рис. 7-15), либо выполнять перемещение мышью. В последнем случае выберите из меню Downloads строку Download Basket. На экране появится маленькое окошко, в которое можно перемещать ссылки на загружаемые файлы.

      В списке Automatically start downloading the following extensions перечислены расширения файлов, загружаемых посредством программы Download Accelerator Plus. При необходимости этот список можно пополнить.

      Отметив флажок VirusChecking, Вы получите право подключить к утилите программу антивирусной проверки. Щелкнув кнопку Find, укажите путь к загрузочному файлу антивирусной программы, а в поле Scanner Options задайте параметры запуска для этой программы.

      На рис. 7-17 мы показали раздел параметров соединения Connection.

      Рис. 7-17. Раздел параметров соединения Connection

      В списке Connection Type/Speed выберите тип соединения и скорость передачи данных. Для модема, например, укажите значение 33.6 К.

      Если Вы отметите флажок Disconnect After Download is completed, после завершения загрузки файла соединение с сервером провайдера будет автоматически разорвано. Таким образом Вы сэкономите деньги на оплату соединения и время — Вам не придется ждать окончания загрузки. Флажки из поля Mirror Search задают режимы поиска зеркальных серверов для загрузки утилиты. Их оставьте отмеченными.

      Зеркальные серверы

      Зеркальные серверы Web содержат ту же информацию, что и главные. Они нужны в качестве запасных на случай отказа или перегрузки главного сервера, а также каналов передачи данных, соединяющих главный сервер с Интернетом. Зеркальные серверы физически располагаются в другом месте и подключены к Интернету другими каналами связи, нежели главные.

      Если Вам не удается просмотреть страницы главного сервера, Вы можете получить ту же самую информацию с зеркального сервера.

      В качестве примера можно привести сервер каталога бесплатного и условно-бесплатного программного обеспечения Tucows Network (http://www.tucows.com). Его зеркальные серверы расположены по всему миру.

      Так как этот сервер посещают миллионы посетителей во всем мире, при отсутствии «дублеров» он был бы перегружен. А при действующей схеме посетителям предлагается подключиться к одному из зеркальных серверов Tucows Network — и проблема решена.

      И наконец, значение в поле Max simultaneous определяет максимальное количество соединений, открываемых для загрузки файлов.

      Раздел параметров Proxy/FireWall позволяет при необходимости указать адреса прокси-серверов и брандмауэров (firewall). Вы можете узнать эти адреса у администратора своей локальной сети.

      Расширенные параметры работы утилиты Download Accelerator Plus устанавлтвают в разделе Advanced (рис. 7-18).

      Рис. 7-18. Установка расширенных параметров работы утилиты

      Вы можете определить поведение утилиты при запуске и отмене загрузки, а также после ее успешного завершения. Например, чтобы избавиться от появления окна Download File Info, достаточно отметить флажок Immediately start download (Without INFO window).

      Копирование материалов с серверов Web

      Содержимое некоторых серверов Web бывает столь обширно, что на полный просмотр требуется очень много времени. Например, на сервере могут храниться книги, разделенные на множество глав и разделов и снабженные большим количеством иллюстраций.

      Чтобы не тратить много денег на оплату времени подключения, необходимого для просмотра материала на сервере, можно вначале сохранить все нужные страницы на локальном диске, а затем просматривать их в автономном режиме. В предыдущей главе мы рассказывали о том, как выполнить такую операцию при помощи браузеров Microsoft Internet Explorer и Netscape Communicator. Хотя браузер Microsoft Internet Explorer умеет загружать страницы вместе с иллюстрациями и связанными страницами, намного удобнее выполнять операцию загрузки серверов Web и их отдельных каталогов на локальный компьютер при помощи специальных утилит.

      Утилита Anavawe WebSnake

      Утилита Anavawe WebSnake позволяет копировать серверы Web. Ее бесплатная копия доступна на сервере http://www.anawave.com. После установки на экране появится окно с сообщением о том, что Вы можете бесплатно пользоваться этой утилитой в течении 30 дней (рис. 7-19). После этого ее необходимо зарегистрировать.

      Рис. 7-19. Сообщение о необходимости регистрации утилиты Anavawe WebSnake

      Утилита Anavawe WebSnake способна, подобно змее, «заползать» во все уголки указанного сервера Web, загружая на локальный диск Вашего компьютера содержимое хранящихся там файлов. Все операции Вы можете выполнять по расписанию, например в ночные часы, когда стоимость времени подключения к Интернету минимальная.

      Мастер копирования материалов с серверов Web

      Сразу после запуска утилиты на экране появляется первое окно мастера копирования материалов с серверов, показанное на рис. 7-20.

      Рис. 7-20. Первое окно мастера копирования серверов

      Здесь Вам надо указать, какую операцию Вы собираетесь выполнять. Чтобы скопировать материал с сервера для просмотра в автономном режиме, отметьте флажок Snake a copy of a website for off-line browsing. Утилита способна также сделать полную копию, включающую все ссылки на почтовые адреса, расположенные на сервере, создать карту сервера Web (план расположения страниц) или извлечь отдельные файлы. Мы опишем только первый режим работы, при необходимости дополнительную информацию Вы найдете в электронной справочной системе утилиты.

      Итак, выбрав режим копирования сервера, щелкните кнопку Next. В следующем окне мастера (рис. 7-21) необходимо введите адрес URL сервера (в поле Starting Address/URL) и название проекта (в поле Project Name).

      Рис. 7-21. Указание адреса сервера и названия проекта

      Здесь можно указать не только адрес главной страницы сервера, но и адрес любой из его страниц.

      Если для получения доступа к серверу необходимы идентификатор и пароль, следует задать их в следующем окне, предварительно отметив флажок Yes (рис. 7-22).

      Рис. 7-22. Ввод идентификатора и пароля для доступа к защищенным страницам

      Окно мастера, показанное на рис. 7-23, позволяет задать «глубину» просмотра каталогов сервера, а также общий размер загружаемых файлов.

      Рис. 7-23. Определение ограничений на загрузку данных с сервера

      Максимальную «глубину» просмотра каталогов Вы сможете задать, если отметите флажок Limit the number of levels snaked to. Уровень просмотра устанавливают в поле, расположенном справа от флажка.

      Максимальный объем загружаемых файлов определяют в поле Stop project if space left on local drive is less than. Цифра, задаваемая Вами, означает минимальное свободное пространство на локальном диске, при котором загрузка должна прекратиться. Обращаем Ваше внимание на то, что операционная система Microsoft Windows не будет нормально работать, если на системном диске (то есть на том диске, где она установлена) нет свободного места. Так как общий объем файлов на некоторых серверах Web составляет сотни мегабайт, а то и несколько гигабайт, такие меры предосторожности не окажутся лишними.

      Если в окне, показанном на рис. 7-23, Вы щелкнете кнопку Next, можно указать дополнительные параметры копирования сервера.

      Прежде всего, это время, когда следует запустить процесс копирования (рис. 7-24).

      Рис. 7-24. Задание времени запуска процесса копирования сервера Web

      Вы можете запустить загрузку сервера сразу, отметив флажок Snake Off-line Browsing Project now, или позже, отметив флажок Snake Off-line Browsing Project later, или задать дополнительные параметры. В любом случае после щелчка кнопки Finish на экране появится диалоговое окно Save As выбора каталога, в который будет записан проект загрузки сервера Web (рис. 7-25).

      Рис. 7-25. Выбор каталога для сохранения проекта загрузки сервера Web

      Укажите здесь каталог, имя файла проекта (с расширением SNK), а затем щелкните кнопку Save.

      Установка параметров проекта

      В том случае, если в окне, показанном на рис. 7-24, Вы отметили флажок Setup advanced settings, на экране появится окно свойств проекта загрузки Project Properties (рис. 7-26).

      Рис. 7-26. Вкладка General окна свойств проекта загрузки Project Properties

      На вкладке General можно изменить адрес сервера, имя проекта и уровень просмотра вложенных каталогов, указанные на начальном этапе работы мастера копирования сервера Web.

      Вкладка Limits (рис. 7-27) предназначена для определения параметров, недоступных в окнах мастера.

      Рис. 7-27. Вкладка Limits окна свойств проекта загрузки Project Properties

      Прежде всего мы советуем Вам указать, что программа не должна загружать связанные страницы, расположенные за пределами данного сервера Web.

      Зачем это нужно?

      Обычно на страницах серверов Web располагаются ссылки на другие серверы, причем ссылок может быть очень много. Никакие ограничения на глубину просмотра каталогов сервера не избавят от загрузки страниц, которые, скорее всего, никогда не потребуются.

      Когда Вы отметите флажки Stay with qualified domain или Stay with qualified server, будут то загружаться только страницы, расположенные в пределах указанного домена или сервера соответственно. Например, если на страницах, расположенных в каталоге http://www.geocities.com/eraseundo есть ссылки на страницы сервера http://www.geocities.com, последние тоже будут загружены.

      Пометив флажок Stay within starting address/URL, Вы зададите загрузку исключительно тех страниц, что находятся в каталоге http://www.geocities.com/eraseundo и в подкаталогах этого каталога. Заметим, что этот режим установлен по умолчанию.

      В том случае, когда Вас интересуют и страницы других серверов, на которые ссылается указанный сервер, отметьте флажок Follow all links found.

      В некоторых случаях можно сократить объем загруженных файлов, отказавшись от обхода каталогов, в имени которых встречаются специальные символы, например ~. Чтобы это сделать, отметьте флажок Do not explore path that contain this character и укажите символ в поле, расположенном справа от этого флажка.

      Вкладка Filters, показанная на рис. 7-28, позволяет задать больше ограничений на загрузку, чем в соответствующем окне мастера загрузки.

      Рис. 7-28. Указание ограничений на вкладке Filters

      Здесь можно отказаться от загрузки материала с сервера Web, если обнаружится, что:

      ·         размер загружаемого файла превысит указанный предел (флажок Stop project if downloaded files exceed);

      ·         на локальном диске останется мало места (флажок Stop project if space left on drive is less than);

      ·         скопированных файлов слишком много (флажок Stop project if number of downloaded files exceed);

      ·         скопированных страниц HTML слишком много (флажок Stop project if number of HTML files exceed).

      Кроме того, отметив флажок Do not download files whose size exceeds, Вы откажетесь от загрузки файлов слишком большого размера.

      Вкладка Filetypes (рис. 7-29) позволяет указать типы файлов, которые нужно загружать.

      Рис. 7-29. Указание типов загружаемых файлов

      Например, если на сервере много архивных файлов ZIP, но Вам нужно только текстовое описание этих файлов, сбросьте флажок zip в группе Other. Правильный выбор, сделанный на вкладке Filetypes, позволит Вам сократить объем передаваемых данных, отказавшись от загрузки ненужных файлов.

      На вкладке Linking (рис. 7-30) задают действия, которые надо выполнять при невозможности прямой загрузки страниц, создаваемых динамически программами расширений CGI, ISAPI, серверными сценариями или аналогичными активными компонентами серверов Web.

      Рис. 7-30. Вкладка Linking окна свойств проекта загрузки Project Properties

      Если отметить флажок Link to the original URL, то ссылки на динамически создаваемые страницы останутся в первоначальном виде. Чтобы просмотреть такие страницы, Вам придется установить соединение с Интернетом. Такой режим используется по умолчанию.

      Отметив флажок Link to a message file, Вы включите режим замены проблемных ссылок ссылками на файл с сообщением о невозможности загрузки страницы. Если же отметите флажок Ignore dead links, утилита будет игнорировать ссылки, которые нельзя использовать для загрузки страниц.

      На вкладке Password (рис. 7-31) указывают идентификатор и пароль для доступа к защищенным страницам сервера Web.

      Рис. 7-31. Вкладка Password окна свойств проекта загрузки Project Properties

      В том случае, если для доступа к загружаемым страницам требуется несколько идентификаторов и паролей, воспользуйтесь флажками, расположенными на этой вкладке.

      Флажок Ignore and continue to search for other matching files отмечен по умолчанию. При этом предполагается, что защищенные страницы, к которым не подходит идентификатор и пароль, указанные в полях User Name и Password, игнорируются.

      Однако, если Вы отметите флажок Prompt for user name and password, при загрузке таких страниц на экране появится приглашение для ввода идентификатора и пароля. Очевидно, этот режим не подходит для автоматической загрузки в ночное время без участия пользователя.

      И наконец, если Вы установите флажок Stop project, процесс копирования будет остановлен при невозможности загрузки защищенных страниц.

      Вкладка Schedule позволяет выбрать график копирования сервера Web (рис. 7-32).

      Рис. 7-32. Выбор графика копирования сервера Web на вкладке Schedule

      Чтобы выбрать график копирования, отметьте флажок Schedule this project. Затем задайте периодичность запуска процесса копирования, отметив один из флажков в поле Run. Вы можете запускать копирование ежечасно (флажок Hourly), ежедневно (флажок Daily), еженедельно (флажок Weekly), ежемесячно (флажок Monthly), при загрузке операционной системы (флажок At Startup) или когда компьютер простаивает (флажок When Idle).

      Флажок Wait until the compute has been idle for X minutes позволяет задать интервал времени, в течение которого компьютер должен бездействовать, чтобы программа начала загрузку.

      И наконец, в полях Start At и Which Days задают соответственно время и дни недели, когда нужно запускать копирование.

      Просмотр сервера Web в автономном режиме

      Сразу после запуска процесса копирования на экране появится главное окно утилиты Anavawe WebSnake (рис. 7-33).

      Рис. 7-33. Главное окно утилиты Anavawe WebSnake

      В нижней части этого окна отображается процесс копирования, в левой — список проектов копирования, а в правой — дерево загруженных каталогов, страниц, файлов и ссылок.

      Чтобы просмотреть содержимое скопированного сервера Web в автономном режиме, дважды щелкните название загруженной страницы — запустится браузер, и в его окне отобразится интересующая Вас страница.

      Подготовив проект, сохраните его. Для этого выберите из меню File строку Save Session As и укажите имя проекта, а также путь к каталогу, куда нужно записать файл проекта.

      Для создания нового проекта с помощью мастера копирования выберите из меню File строку Add project Wizard.

      Настройка параметров работы утилиты Anavawe WebSnake

      Как правило, параметры работы утилиты Anavawe WebSnake, установленные по умолчанию, подходят в большинстве случаев. Однако при необходимости Вы можете их изменить.

      Для того чтобы попасть в окно настройки параметров, выберите из меню View главного окна утилиты строку Options. На экране появится вкладка General окна настройки параметров утилиты, показанная на рис. 7-34.

      Рис. 7-34. Настройка параметров утилиты Anavawe WebSnake

      Посредством флажков, расположенных в поле Agent Identification, Вы можете указать, каким образом утилита Anavawe WebSnake идентифицирует себя при обращении к серверам Web. В Интернете немало серверов, оптимизированных для работы с тем или иным браузером или, хуже того, отказывающихся работать с браузерами определенного типа.

      Когда утилита загружает файлы с серверов FTP, она сообщает им в качестве пароля для анонимного входа адрес электронной почты клиента. На вкладке Transfer Вы можете указать такой адрес в поле e-mail Address вместо адреса, используемого по умолчанию (рис. 7-35).

      Рис. 7-35. Вкладка Transfer окна настройки параметров утилиты Anavawe WebSnake

      Описание остальных параметров и приемов работы с утилитой Anavawe WebSnake Вы найдете в электронной справочной системе, входящей в ее дистрибутив.

      Утилита Teleport Pro

      Еще одна популярная программа, предназначенная для копирования серверов Web, называется Teleport Pro. Эта условно-бесплатная программа доступна на сервере http://www.tenmax.com.

      По своему назначению и возможностям утилита Teleport Pro аналогична только что рассмотренной утилите Anavawe WebSnake.

      Запуск мастера проектов

      Для копирования серверов Web программа Teleport Pro создает проекты. Параметры этих проектов задают методику копирования, каталог для записи результата и, конечно, адрес URL копируемого сервера.

      Удобнее всего определять параметры проектов с помощью специально предназначенного для этого мастера проектов. Чтобы запустить его, выберите из меню File, расположенном в главном окне программы, строку New Project Wizard. На экране появится первое окно мастера, показанное на рис. 7-36.

      Рис. 7-36. Первое окно мастера проектов Teleport Pro

      Здесь Вам надо указать, какие действия должна выполнять утилита Teleport Pro. Если нужна копия сервера Web для просмотра в автономном режиме, отметьте флажок Create a browsable copy of a website on my hard drive.

      Чтобы полностью скопировать файлы и каталоги сервера, установите флажок Duplicate a website, including directory structure. Если же требуются скопировать только файлы какого-нибудь одного типа (например, архивы или графические изображения), отметьте флажок Search a website for files of a certain type.

      Когда Вы установите флажок Explore every site linked from a central site, то сможете заняться коллекционированием ссылок, расположенных на указанном сервере. Файлы, хранящиеся по заданным адресам, будут извлечены, если Вы отметите флажок Retrieve one or more files at a known addresses.

      И наконец, пометив флажок Search a website for keywords, Вы загрузите на локальный диск Вашего компьютера только те файлы, которые содержат заданные ключевые слова.

      Выбрав нужные Вам операции, щелкните кнопку Next. В следующем диалоговом окне введите начальный адрес сервера URL и строку заголовка проекта (рис. 7-37).

      Рис. 7-37. Ввод начального адреса сервера Web и заголовка проекта

      Здесь Вы вправе указать либо главную страницу сервера Web, либо любую другую страницу или каталог.

      Следующее окно (рис. 7-38) позволяет определить, какую информацию нужно загружать с сервера.

      Рис. 7-38. Выбор конфигурации проекта

      Если Вас интересует только текст, отметьте флажок Just text. Такой режим позволит выполнить загрузку быстрее. Установив флажок Text and graphics, Вы вместе с текстом скопируете и графические изображения. Флажок Text, graphics, and sound задает загрузку звуковых файлов. И наконец, флажок Everything указывает программе на необходимость полной загрузки всех файлов, расположенных в каталогах сервера Web.

      При необходимости в полях Account и Password надо задать идентификатор и пароль для доступа к защищенным страницам серверов Web.

      Последнее окно мастера проектов показано на рис. 7-39.

      Рис. 7-39. Последнее окно мастера проектов

      Здесь Вам нужно сохранить проект, щелкнув кнопку Finish. В окне Save As (рис. 7-40) укажите каталог, в котором хотите сохранить проект.

      Рис. 7-40. Выбор каталога для сохранения проекта

      Каталог нужно выбрать на таком диске, где достаточно свободного места.

      Запуск загрузки материала с сервера Web

      Для выполнения этой операции выберите из меню Project строку Start или щелкните кнопку с изображением треугольника, расположенную в инструментальной линейке.

      По мере выполнения загрузки в окне программы появятся списки каталогов и расположенных в них файлов (рис. 7-41).

      Рис. 7-41. Списки загруженных каталогов и файлов в окне утилиты Teleport Pro

      Чтобы просмотреть содержимое файла, достаточно щелкнуть его дважды левой клавишей мыши.

      Настройка параметров проекта

      Прежде чем запускать проект, созданный средствами мастера, Вы можете выполнить «тонкую» настройку его параметров. В результате утилита Teleport Pro будет работать намного лучше.

      Чтобы получить доступ к окну параметров, выделите в левой части окна проект, а затем выберите из меню Project строку Project Properties. На экране появится одноименное окно, показанное на рис. 7-42. Это окно будет открыто на вкладке Summary.

      Рис. 7-42. Вкладка Summary окна настройки параметров проекта

      Здесь задают интервал времени автоматического сохранения базы данных проекта, отметив флажок Autosave the project database every X seconds. Кнопкой Clear Project Database можно стереть указанную базу, чтобы затем начать загрузку сервера Web заново.

      На вкладке Summary, кроме того, отображается статистическая информация — число прочитанных страниц и файлов, общий объем загруженной информации в байтах, количество адресов URL, записанных в базу данных утилиты Teleport Pro, а также количество стартовых адресов проекта.

      Для того чтобы задать конкретные типы и размер файлов, подлежащие загрузке, воспользуйтесь вкладкой File Retrieval (рис. 7-43).

      Рис. 7-43. Определение типов файлов, подлежащих загрузке

      Отметив флажок Retrieve only files of the types and sizes (in kilobytes) listed below, отредактируйте список расширений и размеров при помощи кнопок Add, Edit и Delete.

      На вкладке File Retrieval задают необходимость загрузки графики и звуковых файлов, встроенных в страницу (флажок Retrieve embedded files), графического фона страницы (флажок Retrieve background graphics) и аплетов Java (флажок Retrieve Java applets).

      Если отметить флажок Retrieve Only file names, утилита не будет загружать файлы, а сохранит только ссылки на них. При необходимости Вы сможете получить файлы позже, установив соединение с Интернетом.

      Вкладка Browsing/Mirroring (рис. 7-44) позволяет задать режим просмотра серверов Web и режим сохранения файлов.

      Рис. 7-44. Вкладка Browsing/Mirroring

      Отметив флажок Always save HTML pages, Вы получите возможность указать на необходимость сохранения документов HTML, даже если другие параметры проекта этого не требуют.

      Флажок Replicate the directory structure of remote servers задает необходимость точного копирования структуры каталогов сервера. Этот параметр определяется в первом окне мастера, показанном ранее на рис. 7-36.

      Иногда требуется режим, при котором расширение имени всех загруженных документов HTML изменяется на htm в соответствии со стандартами операционной системы Microsoft Windows. Этот режим устанавливает флажок Use MSIE-compatible filenames.

      Очень важен флажок Localize links for all retrieved files. Если он отмечен, утилита изменяет ссылки в загруженных документах HTML таким образом, чтобы они указывали на локальные файлы.

      Как мы уже говорили при описании утилиты Anavawe WebSnake, некоторые документы HTML загрузить не удается (например, создаваемые динамически программами CGI или серверными сценариями). Флажки в поле Links for unretrieved files позволяют указать утилите, что делать с такими файлами.

      По умолчанию отмечен флажок Link to a message that explains why the file was not retrieved. В таком режиме ссылки на незагруженные файлы будут указывать на документ HTML с объяснением причин возникновения проблем с загрузкой.

      Чтобы оставить такие ссылки без изменений, отметьте флажок Link to the Internet address for the file. Если страницу не удалось загрузить из-за того, что она создавалась сервером Web динамически, Вы все же сможете впоследствии получить к ней доступ, установив соединение с Интернетом.

      Вкладка Exploration, определяющая способ исследования серверов Web, показана на рис. 7-45.

      Рис. 7-45. Вкладка Exploration

      На многих серверах Web используются графические ссылки. Как правило, это графические изображения, фрагменты которого привязаны к тем или иным адресам URL. Такие ссылки могут быть скрытыми. Отметив флажок Explore server-side maps (by pinging the map…), Вы сделаете возможным исследование скрытых ссылок.

      Поля группы Tenacity позволят Вам определить количество потоков загрузки, работающих одновременно (поле Launch up to X retrieval threads simultaneously), время ожидания перед отменой работы зависших потоков (поле Abort threads that show no activity more than).

      Здесь также задается количество повторных попыток загрузить файлы при отказе в доступе (поле Retry denied request up to X times) или при невозможности выполнить загрузку файла полностью (поле retry incomplete files up to X times).

      Флажки группы Updating, позволяют управлять загрузкой обновленных файлов. Такое обновление выполняется после сравнения дат модификации исходных файлов, хранящихся на сервере, и файлов, загруженных на локальный диск утилитой Teleport Pro.

      На вкладке Exclusions определяют ключевые слова для фильтрования загружаемых страниц (рис. 7-46).

      Рис. 7-46. Определение ключевых слов для фильтрования загружаемых страниц

      В поле Do not save web pages указывают ключевые слова, которые должна содержать страница, чтобы началась ее загрузка.

      В поле Do not retrieve files that match any of the DOS-style filename pattern listed below перечисляют шаблоны имен файлов, которые не следует загружать. При определении шаблонов можно использовать символы * и ?, первый из которых означает любое количество любых символов, а второй — один любой символ. Если указывается несколько шаблонов, их нужно разделять точкой с запятой.

      В поле Do not follow any links or gather any files that match any of the address listed below позволяет указывают список адресов URL, не подлежащих исследованию. Здесь Вы можете задать адреса, которые Вам не интересны. Каждый адрес надо располагать на отдельной строке.

      Элементы управления, расположенные на вкладке Netiquette (рис. 7-47), определяют поведение утилиты при обращении к серверам Web.

      Рис. 7-47. Вкладка Netiquette

      Название этой вкладки можно перевести как сетевой этикет (etiquette в переводе с английского языка означает этикет, Net — сеть).

      Отметив флажок Enable Domain Dispersed Quering, Вы зададите необходимость распределения нагрузки между несколькими серверами. Это позволит исключить слишком высокую загрузку тех серверов, которые отвечают на запросы быстрее других. Флажок Enable Server Overload Protection позволяет защитить от перегрузки серверы, которые реагируют на запросы медленнее других.

      Если Вы установите флажок Obey the Robot Exclusion Standard, утилита Teleport Pro не станет обследовать каталоги сервера Web, отмеченные администратором как запрещенные для посещения автоматических утилит-роботов. Утилиты-роботы создаются для поиска информации на серверах Web или для копирования таких серверов, поэтому к данной категории программ можно отнести и Teleport Pro.

      Заметим, что недоступными для роботов каталоги объявляются, дабы уменьшить поток бесполезной информации, загружаемой на сервер. Обычно в этих каталогах нет ничего, кроме системных программ и файлов сервера Web, не представляющих интереса для поисковых программ.

      Поле Wait X seconds before requesting more than two files at once from a single server предназначено для определения времени задержки между обращениями к серверу. Такая задержка нужна для предотвращения перегрузки сервера.

      И наконец, с помощью флажков группы Agent Identity можно указать, каким образом утилита Teleport Pro идентифицирует себя при обращении к серверам Web.

      Последняя вкладка, определяющая свойства проекта, называется Advanced. Она показана на рис.  7-48.

      Рис. 7-48. Вкладка Advanced

      Если Вы отметите расположенный здесь флажок Automatically begin running this project when opened, сразу после запуска утилиты Teleport Pro на экране появится первое окно мастера проектов. Этот режим задан по умолчанию.

      Чтобы ограничить продолжительность работы утилиты, используйте флажок Run for no more than X minutes. Отметив его, Вы сможете задать интервал повторного запуска проекта. И наконец, флажок Exit program when this project stops running позволяет установить режим автоматического завершения работы утилиты по окончании загрузки сервера Web.

      Более подробную информацию о настройке утилиты Вы найдете в электронной справочной системе.

      Перевод содержимого страниц Web

      Так как «родиной» Интернета с полным правом считается Америка, большинство серверов Web англоязычные. И хотя сегодня в Сети появились и российские узлы, едва ли стоит ограничивать себя посещением только тех серверов, страницы которых написаны на русском языке.

      В продаже Вы, конечно же, найдете достаточно мощные и удобные электронные словари, которые помогут Вам не только перевести отдельные слова, фразы или текст, но и обеспечат режим «синхронного» перевода страниц серверов Web. Кроме того, в Интернете есть ресурсы, позволяющие бесплатно переводить текст на различные языки.

      В этом разделе мы расскажем о браузере WebView, утилитах WebTranSite и PROMT 99, а также электронном словаре Lingvo. Все эти программы помогут Вам преодолевать языковый барьер при посещении зарубежных серверов Web, а также при работе с другими зарубежными ресурсами Интернета.

      Браузер WebView

      Рассказывая о системах автоматизированного перевода, созданных специально для работы в Интернете, нельзя не упомянуть о браузере WebView, разработанном известной компанией ПРОект МТ (ПРОМТ). Адрес ее сервера в Интернете — http://www.promt.ru. На нем Вы узнаете, где и как можно приобрести этот браузер.

      На рис. 7-49 мы показали, как выглядит окно браузера WebView.

      Рис. 7-49. Главное окно браузера WebView

      Как видите, оно разделено на две части, причем в одной из них отображается исходный текст страницы Web, а в другой — ее перевод. Нельзя сказать, чтобы качество перевода любых текстов было идеальным (впрочем, это проблема любого автоматического переводчика). Но все же этот браузер окажет существенную услугу тем, кто не владеет иностранными языками.

      Расскажем кратко, как пользоваться браузером WebView.

      Вначале введите адрес URL в поле, расположенное под инструментальной панелью. Эта операция выполняется так же, как и в обычном браузере. После этого в верхнее окно будет загружена соответствующая страница Web.

      Через некоторое время в нижнем окне появится перевод страницы. Чтобы изменить направление перевода, воспользуйтесь строкой Направление перевода меню Перевод. Браузер WebView умеет переводить с английского, немецкого и французского языка на русский язык, а также обратно.

      Чтобы значительно улучшить качество перевода, правильно выбирайте словари (рис. 7-50), а также редактируйте списки зарезервированных и незнакомых слов.

      Рис. 7-50. Редактирование списка словарей

      В окне редактирования списка словарей можно подключать или отключать словари, а также изменять порядок их использования. Разрешается даже создать собственный словарь.

      Браузер WebView поставляется с подробной документацией, в которой Вы найдете всю необходимую информацию.

      Утилита WebTranSite

      Эта утилита автоматического перевода также создана компанией ПРОМТ. В отличие от предыдущей описанной нами программы, утилита WebTranSite не считается браузером. Она служит дополнительным средством, помогающим выполнять перевод текста в окнах браузеров Microsoft Internet Explorer и Netscape Communicator.

      После установки и запуска этой утилиты в верней части экрана появляется инструментальная панель, показанная на рис. 7-51.

      Рис. 7-51. Панель утилиты WebTranSite

      Щелкнув левую кнопку на этой панели, Вы выберите направление перевода (по умолчанию выполняется перевод с английского на русский язык). Кнопка Не переводить позволяет ввести список слов, не подлежащих переводу.

      Интересная особенность утилиты WebTranSite — возможность работы с поисковыми серверами. Для осуществления этого воспользуйтесь кнопкой Поиск. Утилита способна при необходимости выполнить перевод запроса на другой язык. Кнопкой Словари Вы сможете подключать или отключать словари.

      Как выполнить перевод страниц серверов Web с использованием утилиты WebTranSite?

      Сначала запустите браузер и загрузите в его окно нужную страницу. Затем выделите переводимый фрагмент текста мышью и в зависимости от типа браузера выполните одно из описанных ниже действий.

      Если Вы используете браузер Microsoft Internet Explorer, перетащите выделенный текст мышью на панель утилиты WebTranSite. После этого на экране появится окно с переведенным фрагментом текста, которое можно перемещать мышью (рис. 7-52).

      Рис. 7-52. Переведенный фрагмент текста

      В браузере Netscape Communicator Вы запустите перевод выделенного фрагмента текста, щелкнув его правой клавишей мыши и выбрав из меню строку Перевести.

      И наконец, есть еще один способ — скопировать выделенный фрагмент текста в универсальный буфер обмена Clipboard, а затем, щелкнув панель программы WebTranSite, выбрать строку Перевести Clipboard. Этот способ подходит для любых браузеров, а также для любых программ, умеющих копировать текст в буфер Clipboard.

      К несомненным достоинствам утилиты WebTranSite можно отнести независимость от конкретного типа браузера, а также удобство в работе.

      Утилита PROMT 99

      Более мощные возможности для перевода текста предоставляет программа PROMT 99. Она умеет переводить файлы документов в текстовом формате (с кодировкой Windows или DOS), офисные документы Microsoft Word и Microsoft Write, файлы в формате RTF, а также (что важно для посетителей серверов Web) в формате HTML.

      Если Вам нужно перевести предварительно загруженные и сохраненные на локальном диске страницы Web, запустите программу PROMT 99, а затем выберите из меню Файл строку Открыть. Выберите исходный файл HTML (с расширением имени HTML или HTM), а затем подтвердите формат файла в окне Конвертировать файл (рис. 7-53), щелкнув кнопку OK.

       

      Рис. 7-53. Конвертирование входного файла

      Исходный текст появится в верхней части окна программы PROMT 99. Для перевода текста выберите из меню Перевод строку Весь текст. В нижней части окна отобразится переведенный текст (рис. 7-54).

      Рис. 7-54. Исходный и переведенный текст в окне программа PROMT 99

      При необходимости результат перевода Вы можете сохранить во внутреннем формате программы PROMPT 99, распечатать или передать программе пакетного перевода текстов File Translator, выбрав из меню Файл строку Переслать в File Translator. В последнем случае результат перевода сохраняется в формате RTF или в формате текстового процессора Microsoft Word (рис. 7-55).

      Рис. 7-55. Сохранение перевода в формате Microsoft Word

      Программа PROMPT 99 способна работать с различными словарями, вести списки зарезервированных и незнакомых слов и выполнять другие многочисленные функции. На сегодняшний день, по нашему мнению, это одна из наилучших систем автоматизированного перевода текстов, снабженная, к тому же, подробной документацией.

      Утилита Lingvo

      Еще одна утилита, о которой, нам кажется, необходимо упомянуть, — электронный словарь Lingvo, созданный компанией ABBY Software House (http://www.abbyy.ru). Он особенно удобен тем, кто не нуждается в переводе фрагментов текста и документов, но хотел бы узнать значение отдельных иностранных слов или словосочетаний, их транскрипцию или услышать, как они произносятся.

      В главном окне утилиты, показанном на рис. 7-56, расположено поле ввода слова, список отсортированных по алфавиту слов и словосочетаний, а также кнопки подключения и отключения словарей.

      Рис. 7-56. Главное окно электронного словаря Lingvo

      Чтобы перевести слово или словосочетание, его надо выделить в окне программы (например, в окне браузера) и перетащить в окно утилиты мышью. Можно также перенести слово через буфер обмена Clipboard или набрать вручную.

      Щелкнув кнопку с изображением открытой книги, Вы увидите на экране окно с переводом введенного слова или словосочетания (рис. 7-57).

      Рис. 7-57. Перевод введенного слова

      Если переводится фрагмент текста, для каждого из слов можно открыть такое окно.

      Утилита Lingvo снабжена подробной документацией и инструкцией по применению на русском языке. Мы полагаем, что Вам понравится с ней работать.

      Переводчики на серверах Web

      В Интернете немало серверов Web со словарями и автоматическими переводчиками. В этом разделе мы расскажем о некоторых таких ресурсах.

      Прежде всего, заслуживает упоминания сервер http://www.translate.ru компании ПРОМТ, о некоторых продуктах которой мы уже рассказывали. Этот сервер предоставляет ресурсы для перевода фрагментов текста на пять языков (рис. 7-58), причем данная услуга предоставляется бесплатно.

      Рис. 7-58. Выбор направления перевода на сервере ПРОМТ

      Пользоваться системой автоматического перевода очень просто. Наберите в верхней части окна исходный текст или скопируйте его через универсальный буфер обмена Clipboard. Затем укажите направление перевода и тему, необходимую для выбора наиболее подходящего словаря. Затем щелкните кнопку Перевести.

      Через некоторое время в нижней части страницы появится перевод исходного текста (рис. 7-59).

      Рис. 7-59. Результат перевода в окне браузера

      Если Вам кажется, что пять иностранных языков — это слишком мало, загляните на страницу Web, расположенную по адресу http://www.yourdictionary.com. Здесь Вы найдете множество словарей для многих языков мира (рис. 7-60).

      Рис. 7-60. Перечень языков на http://www.yourdictionary.com

      Русскому языку здесь тоже уделено внимание. На рис. 7-61 мы показали список общих и специальных словарей, посвященных русскому языку.

      Рис. 7-61. Словари для перевода с русского языка и на русский язык

      В Интернете Вы найдете обширные ресурсы по почти любому национальному языку — словари синонимов, жаргонных выражений, ругательств (для русского языка это словарь матерных выражений) и многое другое. Так что дерзайте — расширяйте свое лингвистическое образование!

  • [Назад] [Содержание] [Дальше]


    Создание интернет-магазинов: http://www.shop2you.ru/ © Александр Фролов, Григорий Фролов, 1991-2016