МИНИСТЕРСТВО ВНУТРЕННИХ ДЕЛ РОССИЙСКОЙ ФЕДЕРАЦИИ  
  ИНФОРМАЦИОННЫЙ ЦЕНТР ПРИ УВД
ХАНТЫ-МАНСИЙСКОГО АВТОНОМНОГО ОКРУГА
 
УПРАВЛЕНИЕ ВНУТРЕННИХ ДЕЛ ХАНТЫ-МАНСИЙСКОГО АО

ГЛАВНАЯ

ИСТОРИЯ
ИСТОРИЧЕСКАЯ СПРАВКА

СВЕДЕНИЯ
О НАРУШЕНИИ ЗАКОНА С ПРИМЕНЕНИЕМ ЭВМ
СВЕДЕНИЯ О ПОИСКОВЫХ СЕРВЕРАХ И СИСТЕМАХ
ЮНЫЕ ХАКЕРЫ В СЕТЯХ INTERNET

ФОТОАЛЬБОМ
ТВОРЧЕСКИЕ ПОРЫВЫ
СПОРТИВНЫЕ ДОСТИЖЕНИЯ
ТРУДОВЫЕ БУДНИ

НАШ ЮБИЛЕЙ
НАС ПОЗДРАВЛЯЮТ
К ЮБИЛЕЮ

ПУБЛИКАЦИИ В СМИ
НОВАЯ СЛУЖБА - В ПОМОЩЬ ОВД
КОМПЬЮТЕР ВСЕГДА В ФОРМЕ
ЮНЫЕ ХАКЕРЫ В СЕТЯХ INTERNET

ПРОЧЕЕ
ВЦ ИЦ УВД ОКРУГА ПРИГЛАШАЕТ НА РАБОТУ
СВЕДЕНИЯ О ПОИСКОВЫХ СИСТЕМАХ. РЕКОМЕНДАЦИИ ПО ПОИСКУ ИНФОРМАЦИИ В ИНТЕРНЕТ

Известно, что поиск информации в Internet является непростым делом. При всей своей гипертекстовой организации, когда вы следуете от ссылки к ссылке, приближаясь (или чаще всего удаляясь) к цели, Internet не решает самой простой проблемы как найти именно ту "точку входа", с которой можно начинать путешествие по просторам Internet? Собственно говоря, винить в этом Internet не имеет никакого смысла - эта сеть предназначена именно для публикации информации и гипертекстовой связи отдельных информационных элементов. Все остальное проблемы самих пользователей.

Для решения этой проблемы существуют средства поиска ресурсов Internet, которые можно разделить на несколько категорий. К ним относятся:

  • поисковые системы и надстройки над ними;
  • страницы с поиском по нескольким системам;
  • каталоги (как с возможностью поиска, так и без таковой);
  • тематические поисковые системы и каталоги;
  • коллекции ссылок.

Принцип действия поисковых систем напоминает работу обычных баз данных вы вводите какой-то запрос, например набор ключевых слов, и в результате получаете список документов, содержащих заданные слова. Отличие заключается в способе наполнения такой "базы". Для этого в поисковых системах используется периодическое сканирование содержимого серверов с помощью специальных программ-роботов. На основе деятельности этих специальных программ составляются файлы-индексы, которые имеют огромные размеры и используются для поиска задаваемых вами ключевых слов. Помимо простого запроса обычно существует возможность указания различных логических операций, логических групп, использования шаблонов, поиска в названиях, заголовках, задания расстояний между словами и т.п.

Также существуют надстройки над поисковыми системами - метапоисковые системы, позволяющие вести поиск сразу по нескольким поисковым системам, и страницы, обеспечивающие интерфейс к различным поисковым системам.

Помимо поисковых систем существуют различные каталоги, составляемые как самими создателями, таки пользователями, посещающими их. Такие каталоги представляют собой аннотированные списки ссылок, сгруппированные по каким-либо темам: "Бизнес и финансы", "Государство и политика" и т.п. Число ссылок в каждой группе может быть разным. Каталоги подразделяются на две категории - с возможностью поиска и без таковой.

В отдельную группу мы выделили тематические поисковые системы и каталоги, имеющие в основном региональную направленность, и коллекции ссылок различные аннотированные списки русскоязычных и иностранных ресурсов, обычно располагаемые в соответствии с какой-либо классификацией.

Поисковые системы и надстройки над ними


Поисковая система Яndex (http://yandex.ru) позволяет искать информацию по более 29 тыс. серверов(29769). В настоящее время объем индекса составляет 5,41 Гбайт, а число проиндексированной информации 16,91 Гбайт. Система позволяет задавать достаточно сложные запросы, поддерживает возможность выделения одного документа в различных кодировках. Отметим также возможность нахождения заданных слов независимо от формы.

Поддерживаются логические операторы "И", "ИЛИ", "НЕ", логические группы, поиск по фразам, по всем формам заданных слов либо по конкретно указанной. Также есть возможность определения расстояния между словами с учетом их порядка, указание различной значимости ключевых слов и использование уточняющих слов. Специальный поиск можно вести по заголовкам документов и находящимся в них ссылкам.

Когда документ найден, можно воспользоваться возможностью нахождения документов, схожих с данным, а также выполнить поиск среди уже найденных. Если вы не нашли требуемых документов, можно продолжить поиск через поисковую систему AltaVista запрос в нее будет передан автоматически.

При формировании запросов можно использовать естественный язык: просто написать по-русски фразу, описывающую то, что вы хотите найти. Система самостоятельно проанализирует и обработает ваш запрос, а затем постарается найти все, что относится к заданной теме.

Поисковая система Rambler (http://www-windows-1251.rambier.ru/search.shtml.ru) является первой российской профессиональной поисковой системой. В настоящее время она охватывает более 2 млн. страниц на более чем 13 тыс. уникальных серверов в пределах бывшего СССР. При вводе запросов поддерживаются логические операторы "И", "ИЛИ", "НЕ", логические группы, метасимволы "?" и "*", используемые для замены одного или группы символов, возможность уменьшения или увеличения значимости вводимых слов.

Также поддерживается поиск в URL-адресах, названиях документов, заголовках, только среди слов вначале документа и в адресах, оформленных специальным тэгом.

Средства расширенного запроса к Rambler позволяют указать временные интервалы создания документа и искать информацию в группах новостей.

Поисковая система Апорт (http://www.aport.ru/win/) индексирует более 11 тыс. российских серверов 11 и более 2 млн. URL-адресов, обеспечивая поиск почти по 1,5 млн. документов. Она поддерживает богатые возможности формирования запросов, включая поиск по различным словоформам введенных слов, исправление ошибок во введенных словах, поддерживает логические операторы "И", "ИЛИ", "НЕ", логические группы, поиск по фразам, ограничение в расстоянии между словами, заданное количеством слов или фраз.

Система способна также переводить запрос с русского языка на английский и с английского на русский, а также поддерживать перевод полученной в результате запроса информации.

Помимо этого возможен поиск по URL-адресам, заголовкам, ключевым словам, подписям к графическим изображениям, ссылкам и комментариям, а также указание диапазона времени создания документов.

Поисковая система TELA (http://tela.dux.ru/), созданная компанией DUX, позволяет производить поиск по ключевым словам русскоязычных страниц в Internet, а также англоязычных страниц на российских серверах. Также есть возможность поиска по текущему содержанию русскоязычных телеконференций иерархий relcom, relcom.commerce, fido7, medlux (http://tela.dux.ru/news.html).

Помимо собственно поисковых систем, в основном справляющихся с возложенными на них обязанностями, существуют так называемые надстройки (метапоисковые системы, позволяющие вести поиск сразу по нескольким поисковым системам.

Метапоисковый "Следопыт" (http://www.medialingua.ru/www/Wwwsearc.htm) служит для того, чтобы направлять "правильные" запросы индексно поисковым машинам третьих фирм, не предназначенным для работы с русским языком.

"Следопыт" позволяет задать для поиска русские (и английские) слова в их естественном виде и формирует запрос к "внешней" поисковой машине в виде логической формы из нескольких поисковых шаблонов квазиоснов с отсеченными окончаниями, вместо которых вписаны * (обычное обозначение нескольких произвольных символов). Такой запрос позволяет найти по "плоскому индексу" все формы искомых слов, причем не возникает коллизий совпадения с грамматическими формами других слов, что очень часто бывает при простановке "звездочек" пользователем вручную.

"Следопыт" содержит машинный морфологический словарь русского (100 тыс. основ) и английского языка (100 тыс. основ) и механизм, позволяющий выбрать оптимальное отсечение окончаний, не дающее коллизий. Буквы окончания известного слова отсекаются до тех пор, пока не возникает совпадение возможных реализаций полученного шаблона с формой какого-либо известного слова. Для неизвестных слов гарантируется невозможность совпадения с формами известных слов. Скорость работы алгоритма достаточно высока (сотни слов в секунду).

Метапоиск Яndех-Rambler (http://www.comptek.ru/ramb.html) осуществляет поиск через расширенный запрос к Rambler. При этом введенные ключевые слова могут быть дополнены всеми возможными формами или (указывается отдельно) может быть сформирован запрос на основе морфолого-синтаксической обработки введенной фразы. Такую обработку осуществляет Яndex.

Метапоиск Яndех-AltaVista (http://www.comptek.ru/alta.html) осуществляет поиск через расширенный запрос к AltaVista.

Страницы с поиском по нескольким системам

В этой категории мы собрали страницы, позволяющие задавать критерии поиска для нескольких систем. Например, Аll in One (http://www.tpi.ac.ru/~mike/search/index.htm), где расположены формы запроса практически ко всем известным российским поисковым системам, реализована возможность поиска сразу в Rambler, Яndex, Apоrt, AltaVista или в Russia on the Net, "Ay!", "Созвездие Internet", Se@rch. Помимо поисковых форм здесь есть возможность поиска отдельных файлов, книг, рефератов, поиск в сетевых базах данных и среди зарубежных ресурсов (WWW, General, Special, People, News, Publications & Docs, Music &Video, Misc). Поиск производится одновременно в четырех системах, запрос возможен только по одномуслову.

Есть также и "Универсальная поисковая форма" (http://www.i-connect.ru/~sanders/usf_rus.htm), с помощью которой можно осуществлять поиск в одной из нескольких десятков поисковых систем. Поддерживается возможность ввода слов в одной из пяти кодировок Windows, KOI-8 R, MS-DOS, ISO, Маc, использования поисковой системы "Следопыт" (поиск на AltaVista, HotBot, EuroSeek, Excite, Aport, WebCrawler), поиск файлов, фильмов, поиск в текстах Библии и т.п.

Еще одна подобная страница Search - (http://www.informika.ru/windows/intern/poisk/main.html). Здесь можно выполнять одновременный поиск в нескольких поисковых системах: Russian Internet Search, Русская машина поиска, OpenWEB, Rambler, "Апорт", "Созвездие Internet", Яndex, AltaVista, eXcite, InfoSeek, Lycos, MetaCraweler, HotBot, Yahoo, a также искать файлы на серверах С-net Shareware.com, Download.com, Search.com.

Упомянем еще и страницу Double Search! (http://www.machaon.ru/links/double.html) группы "Махаон". Она обеспечивает одновременный поиск в любых двух из следующих 12 поисковых систем: AltaVista, eXcite, Inktomi, InfoSeek, Lycos, Magellan, MetaCraweler, Open Text Index, WebCrawler, Yahoo, поиск файлов в Shareware.com и поиск в базе данных Who Where?

Каталоги


К категории каталогов мы отнесем тематические подборки ссылок с аннотациями, с возможностью поиска, часто с рейтингом сайтов и, возможно, с отдельно публикуемыми сборниками "ссылки дня/недели/месяца". Начнем с каталогов, в которых присутствуют механизмы поиска.

Каталог Russia on the Net (http://www.ru/index_r.htm) исторически является первым подобным каталогом российских ресурсов Internet. Есть возможность поиска как в русской, так и в английской версии каталога.

Каталог "Желтые страницы Internet" (http://www.piter-press.ru/yp/) является российским аналогом популярного американского издания и развивается и поддерживается Издательским домом "Питер". Данный каталог представляет собой сокращенный электронный вариант одноименного издания, которое в виде "Желтые страницы Internet '98" содержит описание около 4000 ресурсов.

Каталог "Созвездие Internet" (http://www.stars.ru/) безусловно, один из лучших на сегодняшний день. В нем представлены только самые интересные сетевые ресурсы. Отметим, что данный каталог содержит ссылки не только на русскоязычные ресурсы; при этом для каждого ресурса указывается язык и кодировка (для русскоязычных). Есть несколько рейтинговых систем "Рейтинг ресурсов", "1000 Stars", "Пятерка часа", "Десятка дня", "Взлеты и падения". "Рулетка ресурсов" дает ссылки на ресурсы, выбранные случайным образом.

Каталог "Ау!" (http://win.www.au.ru/) существует полтора года, но за это время он успел собрать достаточно много ресурсов на момент написания данного обзора в его базе находилось 23 232 записи, а число посетителей достигло 1 304 121 человека. Каталог "Ау!" организован по следующим разделам (в скобках приведено число записей): "Семья, дом, досуг" (2339), "Справочное бюро" (775), "Образование"(778), "Средства массовой информации" (1196), "Производство и торговля" (1957), "Наука и техника" (979), "Общество и политика" (885), "Интернет" (1140), "Компьютеры" (1128), "Культура и искусство" (1185), "Финансы, бизнес, экономика" (829), "Страны и города" (499) и "Медицина и здоровье" (417). Поддерживается

Каталог WebList.RU (http://www.weblist.ru/russian/real_index.html/) еще один объемный каталог российских ресурсов Internet. Помимо довольно стандартных категорий "Искусство", "Средства массовой информации", "Бизнес и экономика", "Отдых и спорт", "Компьютеры и Интернет" и т.п., здесь можно найти обозрения "Литература", "Фильмы", "Оружие", "Программы". Поддерживается поиск по ресурсам сайта.

На сервере фирмы Diamond Team расположен каталог "Весь Русский Internet" (http://www.diamond-team.ru/catalog/). Данный каталог имеет следующие разделы: "Бизнес и финансы", "Здоровье, отдых, спорт", "Интернет", "Компьютеры и сети", "Культура и искусство", "Народное хозяйство", "Наука и образование", "Общество, политика, регионы", "Персональные страницы", "Развлекательные страницы", "Справочно-информационные страницы", "Средства массовой информации", "Товары", "Транспорт и услуги". Дважды в год каталог "Весь Русский Internet" издается на компакт-диске.

Компания "ЭлвисТелеком" создала собственный вариант каталога ресурсов Internet LinkMaker (http://www.ipclub.ru/linkmaker/). Поддерживается возможность поиска с учетом регистра и ставшая уже практически стандартной система разбиения ресурсов на категории и подкатегории, возможно, чуть более детальная, чем в других каталогах. Доступ к любой категории и подкатегории возможен с главной страницы каталога. Обещается, что в данном каталоге будут располагаться только полезные и работающие ссылки.

Каталог под названием Se@rch (http://search.sites.ru/) поддерживает стандартный набор категорий, а также такие возможности, как "Поиск работы", "Поиск людей", "Погода", "Свежий анекдот", "Фото недели", и т.п.

Каталог List.Ru (http://www.iist.ru/) содержит 8516записей, разделенных на следующие основные категории: "Финансы, бизнес, экономика" (1702 записи), "Общество" (978 записей), "Государство, политика и право" (495 записей), "Культура и искусство" (2085 записей), "Компьютеры' (1461 запись), "Наука и образование" (1348 записей), "Справочная информация" (10261 записей), "Средства массовой информации" (470 записей), "Интернет и глобальные сети" (1987 записей), "Хобби, отдых, развлечения" (1999 записей), "Автомобили" (113 записей), "Производство и торговля" (1125 записей), "Страны и города" (230 записей) и "Эротика и секс" (904 записи). Ряд рубрик каталога имеет ведущих - так называемых Гидов. Эти рубрики вынесены в отдельный список. Имеется рейтинг List 100. Поддерживается поиск по ресурсам, собранный в каталоге.

Выше мы рассмотрели каталоги ссылок, поддерживающие поиск по ресурсам. На очереди каталоги без возможности поиска, хотя есть вероятность, что таковая будет реализована.

Каталог"Сокровища Интернет" (http://www.relcom.ru/lnternet/Treasures/) представляет собой проект Relcom, посвященный Internet-ресурсам бывшего СССР - путеводитель по наиболее интересным ресурсам России и ближнего зарубежья. Создатели говорят, что они не ставят себе целью создать полный список ресурсов, а стараются отобрать только самое интересное.

Каталог под названием "Свободный каталог" (http://catalog.mbt.ru/free/) расположен на сервере Международного бюро информации и телекоммуникации, и его "свобода" заключается в том, что любой желающий может заявить о своей странице, сервере и т.п. Нет никаких ограничений на тематику сайтов, за исключением того, что они должны быть на русском языке. Создатели данного каталога, правда, говорят, что администратор может удалить неинтересные ссылки. Так что свобода в "Свободном каталоге" все-таки относительна.

Каталог "Улитка" (http://www.mbt.ru/ulitka/) еще один проект на сервере Международного бюро информации и телекоммуникации. Это путеводитель по самым интересным местам в Internet. Каталог не претендует на "дикую глобальность и объемность".

Здесь подобраны только "интересные, красивые и качественные места в Internet". Адреса берутся из "Свободного каталога" и, если они понравятся создателям "Улитки", публикуются.

© 2000 ВЦ ИЦ УВД ХМАО [ ] Rambler's Top100