Всемирная паутина (англ. World Wide Web) - распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы веб-серверов. Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются веб-страницами. Несколько веб-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же веб-сервере, называются веб-сайтом. Для загрузки и просмотра веб-страниц используются специальные программы - браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же. Для обозначения Всемирной паутины также используют слово веб (англ. web) и аббревиатуру WWW.
Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенных по всему миру. Веб-сервер является программой, запускаемой на подключённом к сети компьютере и использующей протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически распределять ресурсы в ответ на HTTP-запрос. Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов URI (англ. Uniform R source Identifier). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator). Такие URL-локаторы сочетают в себе технологию идентификации URI и систему доменных имён DNS (англ. Domain Name System) - доменное имя (или непосредственно IP-адрес в числовой записи) входит в состав URL для обозначения компьютера (точнее - одного из его сетевых интерфейсов), который исполняет код нужного веб-сервера.
Для обзора информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа - веб-браузер. Основная функция веб-браузера - отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссы́лки. Большая часть информации в Вебе представляет собой именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language), язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, ма́стера по разметке называют веб-мастером или вебмастером (без дефиса). После HTML-разметки получившийся гипертекст помещается в файл, такой HTML-файл является основным ресурсом Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть "веб-страницей". Набор веб-страниц образует веб-сайт. В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Гиперссылки веба основаны на технологии URL.
Для улучшения визуального восприятия веба стала широко применяться технология CSS, которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, - система обозначения ресурсов URN (англ. Uniform Resource Name).
Популярная концепция развития Всемирной паутины - создание семантической паутины. Семантическая паутина - это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина - это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования. Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса, в семантической паутине используется формат RDF (англ. Resource Description Framework), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области - это RDFS (англ.)русск. (англ. RDF Schema) и SPARQL (англ. Protocol And RDF Query Language) (произносится как "спа́ркл"), новый язык запросов для быстрого доступа к данным RDF.
Ещё в 1945 году Ваннавер Буш разработал концепцию Memex - вспомогательных механических средств "расширения человеческой памяти".
Memex - это устройство, в котором человек хранит все свои книги и записи (а в идеале - и все свои знания, поддающиеся формальному описанию) и которое выдаёт нужную информацию с достаточной скоростью и гибкостью. Оно является расширением и дополнением памяти человека. Бушем было также предсказано всеобъемлющее индексирование текстов и мультимедийных ресурсов с возможностью быстрого поиска необходимой информации. Следующим значительным шагом на пути ко Всемирной паутине было создание гипертекста (термин введён Тедом Нельсоном в 1965 году).
Изобретателями всемирной паутины считаются Тим Бернерс-Ли и в меньшей степени, Роберт Кайо. Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. Conseil Europйen pour la Recherche Nuclйaire, CERN) консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу "Энквайр" (англ. Enquire, можно вольно перевести как "Дознаватель"), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины.
В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина - Web. Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли (совместно с его помощниками) были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год.
В рамках проекта Бернерс-Ли написал первый в мире веб-сервер httpd и первый в мире гипертекстовый веб-браузер, называвшийся WorldWideWeb. Этот браузер был одновременно и WYSIWYG-редактором (сокр. от англ. What You See Is What You Get - что видишь, то и получишь), его разработка была начата в октябре 1990 года, а закончена в декабре того же года. Программа работала в среде NeXTStep и начала распространяться по Интернету летом 1991 года.
С 1994 года основную работу по развитию Всемирной паутины взял на себя консорциум Всемирной паутины (англ. World Wide Web Consortium, W3C), основанный и до сих пор возглавляемый Тимом Бернерсом-Ли. Данный консорциум - организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины. Миссия W3C: "Полностью раскрыть потенциал Всемирной паутины путём создания протоколов и принципов, гарантирующих долгосрочное развитие Сети". Две другие важнейшие задачи консорциума - обеспечить полную "интернационализа́цию Сети́" и сделать Сеть доступной для людей с ограниченными возможностями.
W3C разрабатывает для Интернета единые принципы и стандарты (называемые "рекомендациями", англ. W3C Recommendations), которые затем внедряются производителями программ и оборудования. Таким образом достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все рекомендации консорциума Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.
Интернет - детище, инструмент и вотчина спецслужб
Несмотря на кажущийся революционный экспоненциальный характер развития мировой информационной сети, она развивалась и развивается эволюционно, довольно мелкими шагами, определяемыми общей сложностью системы.
Экспоненциальное развитие сети обусловливается ее многоуровневым развитием, то есть одновременным развитием технологий на разных сетевых уровнях, когда инновация на одном уровне влечет инновации на других уровнях иерархии.
В таблице 1 показаны эти уровни:
N |
иерархические уровни |
WEB 0.0 “лексический” web |
WEB 1.0 “морфологический” web |
WEB 2.0 “синтаксический” web |
WEB 3.0 “семантический” web |
WEB 4.0 “прагматический” web |
|
годы (примерно) |
1980 – 1990 |
1990-2000 |
2001-2010 |
2011-2020 |
2021-2030 |
9 |
уровень общественно-информационных отношений |
научные сети, сервер выполняет команды клиента, клиента, клиент читает данные сервера |
технические сети, клиент осуществляет “серфинг” по сети, читает всю информацию сети |
бытовые сети (СМИ), клиент “разговаривает”, общается с сервером, сервер регулирует область чтения и действий клиента |
разведывательные сети, сервер собирает досье на клиента и управляет приложениями клиента. |
управляющие сети, сервер управляет всеми клиентами в режиме электронного правителя |
8 |
уровень сетевых отношений |
локальный гипертекст |
сетевой гипертекст |
интерактивная связь |
поисковая оценивающая связь |
глобальная управляющая связь |
7 |
прикладной уровень |
gopher, файловая система сервера, доинтернетовские сети: usenet, biznet, fidonet |
browser, статический HTML-сайт, HTML2.0 - HTML3.2 |
browser-framework, динамические сайты на CMS-движках, HTML4 |
идентифицирующий net-framework, сетевые прикладные сервисы, межсерверный обмен, HTML5, XML |
slave-приложение, управляющее пользователем, глобальный master -управляющий гипер-сервер |
6 |
управления данными |
локальная СУБД |
корпоративная сетевая СУБД |
поисковые гипер-серверы |
анализирующие гипер-серверы |
управляющие гипер-серверы |
5 |
топологический уровень |
линейные связи с мэйнфреймом |
иерархическая фиксированная однонаправленная структура |
сетевая многосвязная диалоговая структура |
реляционная структура |
логическая (объектно-реляционная) структура |
4 |
инструментальный уровень |
системные языки, 2GL |
серверные среды, 5GL |
языки искусственного интеллекта, 6GL |
||
3 |
однозадачные ОС |
многозадачные ОС |
сетевые ОС |
облачные вычислительные структуры |
загружаемые ОС |
|
2 |
канальный, сетевые протоколы |
telnet, kermit, FTP, 1G |
TCP/IP, 2G |
мультимедиа-протоколы, 4G, семантические протоколы |
управляющие телематические протоколы, 5G |
|
1 |
аппаратно-физический уровень |
мэйнфреймы, удаленные терминалы |
web-серверы, персональные компьютеры |
оптоволокно, графические процессоры |
гипер-серверы, нетбуки, планшеты, многоядерные ПК |
распознающие процессоры |
Этот период развития Паутины характеризуется созданием статичных сайтов с HTML-гипертекстовыми связями, пассивной передачей информации с серверов клиенту, однонаправленным характером потоков информации:
Это период возникновения и бурного развития электронных библиотек, информационных каталогов Интернет.
Это сервис-ориентированный Web, в котором развился интерактивный информационный процесс между пользователем и сервером, поисковики и электронная коммерция.
Генерация информационного потока была отдана в руки самих пользователей, а владельцы сайтов в основном ограничились созданием и поддержанием инфраструктуры.
Информационно-поисковые системы - их гипер-серверы, роботы и пользовательские интерфейсы стали ядром Паутины. Их алгоритмы поиска, сортировки, ранжирования и интерфейса были основаны на частотно-синтаксическом анализе информации. Роботы поисковых систем являются активными разведчиками и пассивными модераторами сети за счет первичного индексирования информации.
Это становится возможным благодаря внедрению семантических инструментов: от семантической разметки текста ресурсов до интеллектуальных алгоритмов, понимающих смысл человеческих фраз.
Возникли сетевые, "облачные" вычисления, забирающие управление приватными информационными ресурсами внутрь гипер-серверов Паутины.
Технологии создания веб-приложений стали настолько изощренными, что планка для пользователей и создателей информационных ресурсов снизилась почти до нуля, не требуя от них никаких знаний в области информационных технологий.
Сами сетевые технологии поднимаются до уровня автоматически функционирующих сетевых on-line приложений: интерфейсов создания ресурсов, семантических трансляторов, новостных обменников, поисковых анализаторов и автоматических формирователей целевых информационных баз.
Кроме внутренних межсерверных интерфейсов появляются нечеловеческие интерфейсы с физическим миром: автоматический сбор мультимедийной информации, робот-программный анализ информации внешнего мира, поглощение этой информации гипер-серверами Паутины. Роботы переходят в стадию активной модерации контента, цензоров, определяющих что можно публиковать в Web 3.0, а что – нельзя..
Web 3.0 превращается систему слежки за пользователями, фиксирования их интересов, предпочтений и привычек и затем использования этой информации, сведенной в единую глобальную базу данных, для навязывания каждому заточенной под него всевозможной коммерческой рекламы, навязываемых услуг и образа жизни.
Описательные механизмы семантической Паутины уже (конец 2011) разработаны (RDF, DAML, OIL, OWL), однако на этапе интеллектуальной обработки и вывода информации проблемы еще не решены.
В этот период человек потеряет контроль над развитием общества и техники. Управляющие функции переходят к гипер-серверам Интернет, которые будут играть роль глобального мозга и мирового правительства, а всесторонне развитая к этому времени сеть слежения и управления в рамках Интернет станет своеобразной нервной системой техно-человеческого симбиоза в переходный период к Технозою.