Privoxy

Материал из Википедии — свободной энциклопедии

Перейти к: навигация, поиск
Privoxy
Тип Прокси-сервер
Разработчик Разработчики Privoxy
ОС Кроссплатформенное программное обеспечение
Версия 3.0.12 — 22 марта 2009
Лицензия GNU GPL
Сайт www.privoxy.org

Privoxy — это свободный веб-прокси с расширенными возможностями фильтрования интернет-контента для защиты конфиденциальности (приватности) пользователей сети Интернет, изменения содержания веб-страниц, управления «закладками» cookies, ограничения доступа к некоторым сайтам и удаления рекламы, баннеров, всплывающих («выпрыгивающих») окон, а также любого другого нежелательного контента («интернет-мусора»).


Содержание

[править] Сфера применения

Наиболее распространённые сферы применения Privoxy:

  • Для снижения расходов на поддержание IT-инфраструктуры организаций, в которых интернет-трафик и рабочее время сотрудников ощутимо дороги. Посредством установки фильтрующего прокси-сервера вводится исполнительный механизм ограничений загрузки "паразитного" дорогостоящего контента.
  • Как средство контроля и очистки трафика - индивидуальными пользователями
  • Для тестирования веб-серверов и веб-приложений, для отладки собственных реализаций протокола HTTP - разработчиками

[править] Техническая реализация

Технически возможности Privoxy реализуются посредством модификации (замены и удалении) или блокирования загрузки данных:

  • На уровне протокола передачи контента HTTP;
  • На уровне передаваемых по HTTP-данных, т.е. собственно веб-контента

На уровне передаваемых по HTTP-данных Privoxy анализирует HTTP-заголовки и подменяет их в случае необходимости согласно определяемому пользователем набору правил работы с интернет-сайтами для предотвращения передачи в заголовках какой-либо информации, позволяющей получить «отпечаток» сессии соединения с пользователем и легко идентифицировать его среди множества других клиентов веб-сервисов впоследствии, а также для блокирования загрузки чего бы то ни было по адресам URL, имеющим характерные признаки ссылок на контент рекламного характера и прочего рода мусор.

Хотя функции, ориентированные на работу с данными HTTP-протокола были реализованы в Privoxy относительно недавно. в настоящий момент они практически аналогичны возможностям преобразования веб-контента и реализуются на основе одного из механизмов обработки последнего - механизме фильтрации через регулярные выражения PCRE. Этот механизм обеспечивает возможности поточной модификации данных с использованием наиболее мощного и универсального PCRE-оператора s/// (известного в языке программирования Perl как оператор замены).

[править] Логика и терминология

Логически функциональность Privoxy реализуется на основе набора правил изменения контента. Для создания нового правила нужно определить во-первых, что будет модифицироватья (назовём это множеством объектов модификации) и каким образом эта модификация будет осуществляться (перечислить действия, влияющие на обработку контента).

Задать объекты модификации можно следующим образом:

  1. Непосредственно перечислив целевые URL-адреса, где должен быть опущен префикс http:// и могут быть пропущены доменная или путевая части)
  2. Определив некое множество URL с помощью маски наподобие традиционных регулярных выражений, содержащей подстановочные символы-шаблоны "*", "?" и диапазоны символов (в квадратных скобках).

Вырожденным случаем объекта модификации является URL без доменной и путевой части, где оставлен лишь разделитель между ними: «/» (просто один косой слэш). "/" ассоциирован со всем множеством корректных адресов сети Интернет. Он используется для формирования правил «политики по умолчанию», распространяющейся сразу на все интернет-сайты - именно поэтому действия модификации, ассоциированнные с объектом "/", задаются в самой верхней секции файла default.action.

Действия по модификации контента бывают:

  1. Простыми. Это действия, алгоритм которых задан жёстко непосредственно в исходном коде Privoxy и не может быть изменён без модификации и перекомпиляции исходного кода
  2. Параметрически простыми. Механизмы обработки контента, использующие простые форматы представления данных - одиночные строки, флаги (вида "да/нет"), числа и т.д. Эти действия предусматривают передачу опциональных или обязательных параметров непосредственно внутри своего описания
  3. Параметрически сложными. Механизмы обработки контента, использующие сложные форматы представления данных - например, регулярные выражения, и различные формы их представления - например, перечни (списки).

[править] Интерфейс

Все политики обработки контента удобно настраивать посредством развитого веб-интерфейса, который после установки и запуска Privoxy будет доступен по адресу config.privoxy.org или (сокращённо) p.p

Русифицированный веб-интерфейс Privoxy

Веб-интерфейс позволяет настраивать множество параметров работы Privoxy, переключать состояние его активности (в неактивном состоянии Privoxy работает как простейший прокси-сервер, перенаправляющий запросы на интернет-сервера, не анализирующий и не модифицирующий заголовки HTTP-протокола и не фильтрующий интернет-контент), а также получать исчерпывающую информацию о том, какие правила применяются при запросе тех или иных URL и где (в каком файле действий) эти правила были определены. В последнем случае предоставляются прямые ссылки для быстрого внесения соответствующих изменений с помощью встроенного редактора файлов действий (см. иллюстрацию).

Хотя Privoxy часто используется в качестве промежуточного звена между приложениями, использующими HTTP(S)-протокол и программой Tor — клиентом анонимной распределённой сети маршрутизаторов Onion Routers, при этом не следует забывать о том, что Privoxy является совершенно самостоятельной программой, защищающей интересы своих пользователей на уровне протокола HTTP аналогично тому, как Tor делает это на уровне базовых протоколов TCP/IP. Privoxy может с успехом применяться и без Tor, причём во многих случаях использование Tor вне связки с Privoxy или другим аналогичным фильтрующим прокси (например, Proxomitron) как минимум просто неэффективно, поскольку анализ IP-адреса является лишь одним из множества способов идентификации пользователей веб-сервисов, к тому же способов крайне ненадёжных в условиях дефицита публичных IP-адресов.

[править] Ссылки

Источник — «http://ru.wikipedia.org/wiki/Privoxy»
На других языках