к Интернет банкам данных   к оглавлению   эволюция WEB  

Информационно-поисковые языки

Информационно-поисковые языки являются основными компонентами информационно-поисковых систем, с помощью которых, в частности, реализуются интерфейсы между пользователями и системами.

В отличие от реляционных СУБД, у систем полнотекстового поиска не существует стандартизированного языка запросов. У каждой системы этого типа существует свой способ задания критериев поиска.

Очень часто языки запросов ИПС приближенны к SQL, однако каждой из поисковых систем присущий ряд индивидуальных особенностей, связанных с такими моментами, как:

- интерпретация операций, задающих порядок расположения слов в тексте (операций контекстной близости);

- вычисление уровня релевантности найденных документов запросам для представления результатов поиска;

- применение нестандартных для реляционных СУБД функций, например, таких как нахождение документов по принципу подобия содержания, построение дайджестов из фрагментов документов, сниппетов (от англ. snippet – фрагмент, отрывок), включаемых поисковыми системами в списки найденных документов и т.п.

В различных полнотекстовых информационно-поисковых системах применяются различные архитектурные решения, охватывающие структуры данных, алгоритмы их обработки, методы организации поиска. Вместе с тем, у современных информационно-поисковых систем много общих свойств, например, все из них обеспечивают поиск хотя бы по одному слову, большинство подобных систем реализуют грамматический поиск как результат применения лингвистического анализа (например, в русскоязычных системах Апорт, Яндекс и Рамблер по терму из запроса “человек” находятся не только словоизменения “человека”, “человеку”, но и множественное число – “люди”). Большинство из современных систем способны реализовывать контекстный поиск фразы, заключенной в кавычки (Google, Alltheweb, AltaVista, Яндекс и т.п.), поиск с использованием булевых операторов AND, OR и NOT, а также возможностью указания скобок для группирования термов и операторов. Функции контекстной близости в свое время получили наибольшее развитие в системе Lycos, где были реализованы с помощью четырех операторов: ADJ, NEAR, FAR и BEFORE.

В самой популярной в мире системе Google используется достаточно лаконичный набор операторов (www.googleguide.com), основные из которых - это конъюнкция (подразумевается по умолчанию, система выдает документы, содержащие все слова запроса), дизъюнкция (OR) и отрицание (-).

Отдельно рассматривается возможность поиска по параметрам документов, которая чаще всего позволяет ограничивать диапазон поиска значениями URL, дат, заголовков. В большей части систем выйти на возможность поиска по параметрам можно из режима расширенного поиска.

В Google, например, обеспечивается поиск по сайту ("site:"), определение ссылок на сайт ("admission site:"), поиск по ценам, например "DVD player $150..250", странам, датам, доменам и т.п. Во многих системах обеспечивается поиск не только по данным в формате HTML, но и в форматах PDF, RTF, DOC (MsWord), PS.

В последнее время получили распространение адаптивные интерфейсы уточнения запросов, чаще всего реализованные путем применения методов кластерного анализа к результатам первичного поиска. Появилось такое понятие, как метод "папок поиска" (Custom Search Folders), объединяющее множество подходов, общее в которых - попытка сгруппировать результаты поиска и представить группы наиболее связанных документов (кластеры) в удобном для пользователей виде.

Например, в поисковых серверах Vivisimo (www.vivisimo.com), Mooter (www.mooter.com) или Nigma (www.nigma.ru) применяется визуальный подход к представлению результатов поиска путем группирования релевантных документов по категориям. В другом поисковом сервере iBoogie (www.iboogie.com) результаты поиска отображаются в виде, близком к экрану проводника Windows. Слова и словосочетания в так называемых “информационных портретах”, применяемых, например, в корпоративных информационно-аналитических системах Галактика Zoom и InfoStream, также позволяют адаптивно уточнять первичные запросы.

к Интернет банкам данных   к оглавлению   эволюция WEB  

Знаете ли Вы, как разрешается парадокс Ольберса?
(Фотометрический парадокс, парадокс Ольберса - это один из парадоксов космологии, заключающийся в том, что во Вселенной, равномерно заполненной звёздами, яркость неба (в том числе ночного) должна быть примерно равна яркости солнечного диска. Это должно иметь место потому, что по любому направлению неба луч зрения рано или поздно упрется в поверхность звезды.
Иными словами парадос Ольберса заключается в том, что если Вселенная бесконечна, то черного неба мы не увидим, так как излучение дальних звезд будет суммироваться с излучением ближних, и небо должно иметь среднюю температуру фотосфер звезд. При поглощении света межзвездным веществом, оно будет разогреваться до температуры звездных фотосфер и излучать также ярко, как звезды. Однако в дело вступает явление "усталости света", открытое Эдвином Хабблом, который показал, что чем дальше от нас расположена галактика, тем больше становится красным свет ее излучения, то есть фотоны как бы "устают", отдают свою энергию межзвездной среде. На очень больших расстояниях галактики видны только в радиодиапазоне, так как их свет вовсе потерял энергию идя через бескрайние просторы Вселенной. Подробнее читайте в FAQ по эфирной физике.

НОВОСТИ ФОРУМА

Форум Рыцари теории эфира


Рыцари теории эфира
 10.11.2021 - 12:37: ПЕРСОНАЛИИ - Personalias -> WHO IS WHO - КТО ЕСТЬ КТО - Карим_Хайдаров.
10.11.2021 - 12:36: СОВЕСТЬ - Conscience -> РАСЧЕЛОВЕЧИВАНИЕ ЧЕЛОВЕКА. КОМУ ЭТО НАДО? - Карим_Хайдаров.
10.11.2021 - 12:36: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от д.м.н. Александра Алексеевича Редько - Карим_Хайдаров.
10.11.2021 - 12:35: ЭКОЛОГИЯ - Ecology -> Биологическая безопасность населения - Карим_Хайдаров.
10.11.2021 - 12:34: ВОЙНА, ПОЛИТИКА И НАУКА - War, Politics and Science -> Проблема государственного терроризма - Карим_Хайдаров.
10.11.2021 - 12:34: ВОЙНА, ПОЛИТИКА И НАУКА - War, Politics and Science -> ПРАВОСУДИЯ.НЕТ - Карим_Хайдаров.
10.11.2021 - 12:34: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Вадима Глогера, США - Карим_Хайдаров.
10.11.2021 - 09:18: НОВЫЕ ТЕХНОЛОГИИ - New Technologies -> Волновая генетика Петра Гаряева, 5G-контроль и управление - Карим_Хайдаров.
10.11.2021 - 09:18: ЭКОЛОГИЯ - Ecology -> ЭКОЛОГИЯ ДЛЯ ВСЕХ - Карим_Хайдаров.
10.11.2021 - 09:16: ЭКОЛОГИЯ - Ecology -> ПРОБЛЕМЫ МЕДИЦИНЫ - Карим_Хайдаров.
10.11.2021 - 09:15: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Екатерины Коваленко - Карим_Хайдаров.
10.11.2021 - 09:13: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Вильгельма Варкентина - Карим_Хайдаров.
Bourabai Research - Технологии XXI века Bourabai Research Institution