| |
Апорт!
Адрес:
http://www.aport.ru/
Поисковая система «Апорт!» компании «Агама» разрабатывается при
поддержке Intel (эти компании принимают участие также в создании русскоязычного
каталога «Ау»!). Поиск в «Апорт!» ведется по базе данных, содержащей свыше 2
млн. документов (по данным на 01.01.2005 г.). Система может искать необходимую
информацию по различным словоформам введенных слов, исправлять в них ошибки,
поддерживает поиск по фразам, в ней легко ограничить расстояние между
фрагментами текста, заданное нужным количеством слов или фраз, а также указать
допустимый временной период создания документов. Возможен поиск по адресам URL,
заголовкам документов, подписям к картинкам, ссылкам и комментариям. Более того,
система может осуществлять автоматический перевод с русского на английский и с
английского на русский, причем не только ключевой фразы при запросе, но и
полученной в результате информации. Итоги поиска упорядочиваются по частоте
использования искомых терминов в документе. Вместе со ссылкой отображается
фрагмент текста, где встречаются ключевые слова, а также дата и время последней
модификации файла. Это позволяет определить, насколько документ по смыслу
соответствует заданной ключевой фразе. Среди других возможностей этого сайта
можно отметить индикатор загрузки, рейтинги самых употребимых ключевых слов и
наиболее популярных серверов. Rambler
Адрес:
http://www.rambler.ru/
Сервер Rambler компании Stack является одной из самых больших и
наиболее известных поисковых систем в русской части Интернета. Ее база данных
содержат миллионы документов, а над поддержкой всего этого проекта трудятся
более сотни специалистов.
Недостатком данной поисковой системы является то, что спайдер
индексирует главным образом сайты, расположенные в доменах СНГ, и если даже ваша
страница русскоязычная, но ее доменное имя заканчивается не на .ru, а на .com,
то ее индексирование в базе данных Rambler весьма проблематично (для этого надо
по меньшей мере уведомить разработчиков). На многих российских сайтах можно
встретить характерную пиктограмму счетчика Rambler. Рейтинг Rambler Top 100
весьма популярен в русской части Интернета и часто используется многими
компаниями как показатель авторитетности тех или иных ресурсов.
Кроме того, Rambler предоставляет посетителям множество услуг:
позволяет, например, увеличивать или уменьшать значимость отдельных слов в
ключевой фразе с помощью символов "+" и "‑", облегчает поиск в адресах URL,
заголовках страниц и даже в нескольких абзацах в начале документа. С помощью
данной системы можно легко находить «похожие» по тематике страницы и
осуществлять повторный поиск адресов среди уже найденных. В ответ на запрос
Rambler выдает пользователям список ссылок, снабжая каждую из них небольшой
аннотацией, из которой можно узнать кодировку документа, его размер, дату
создания/обновления, а также увидеть фрагмент предложения с искомой ключевой
фразой.
Яndex
Адрес:
http://www.yandex.ru/
Сайт Яndex, принадлежащий компании CompNet, является одним из
самых динамично развивающихся порталов в русской части Интернета. В нем
проиндексировано более двух миллионов документов, и этот показатель постоянно
растет. Основным достоинством системы Яndex является способность находить
заданные слова независимо от формы, в которой они употребляются в документах.
Интересно, что система способна «склонять» или «спрягать» даже те слова, которых
нет в словаре, причем поиск может вестись как по всем формам ключевых слов, так
и по конкретно заданной словоформе. Поисковая машина Яndex позволяет
устанавливать расстояние между фрагментами ключевой фразы с учетом их порядка,
усиливать значимость того или иного слова, использовать уточняющие слова. Поиск
можно также вести по заголовкам документов и по встречающимся на страницах
ссылкам. Кроме того, в Яndex легко найти документы, похожие по смыслу на те, что
заинтересовали вас по предыдущему запросу. К тому же можно ограничивать поиск
уже в найденных документах, то есть производить своеобразную «чистку»
результатов запроса. При упорядочивании списка ссылок, получаемого
пользователем, учитывается число встретившихся в документе ключевых слов, их
положение и расстояние между ними, кроме того, каждый из адресов URL содержит
краткую аннотацию найденного документа.
Russian FTP Search Адрес:
Система Filez осуществляет поиск файлов на российских
FTP-серверах. Русский FTP Search содержит информацию о 2 тыс. серверов в России,
где представлено свыше 7 млн. файлов (по данным на 01.01.2005 г.).
Nigma.ru Адрес:
http://www.nigma.ru/
В настоящее время запущенна интересная поисковая система -
Научный проект "Интеллектуальная поисковая система
Nigma.ru"
МГУ
им.М.В.Ломоносова, факультеты
ВМиК и
психологии. В этой поисковой системе реализован алгоритм - на основе
введенного пользовательского запроса формируется список документов, разделенных
на несколько классов с аннотацией каждого класса и самого документа.
|