Каталоги
Объем информации Интернет переживает стремительный рост: по оценкам экспертов, количество Web-страниц увеличилось от нескольких десятков тысяч в 1996 г. до нескольких сотен тысяч к концу 1998 г. В этих условиях ни одно отдельно взятое средство поиска информации не сможет охватить всех ресурсов Сети. Поэтому для эффективного решения задачи поиска пользователю необходимо свободно ориентироваться в сложном и многообразном мире поисковых инструментов. Правильный выбор средства поиска информации в каждом конкретном случае является существенным, если не определяющим, фактором успешного выполнения задачи.
Каталоги представляют собой систематизированные группы адресов, объединенные, как правило, по тематике. К удобству их применения можно отнести то, что, если пользователю известна тема искомого документа, он будет исследовать соответствующую ветвь каталога, не отвлекаясь на посторонние, не относящиеся к делу документы. Однако, объем каталога ограничен физическими возможностями редакторской группы и ее субъективностью в выборе материала. В них отсутствует информация на узкие, специальные темы, да и саму тематику искомого документа не всегда можно сформулировать в пределах классификации каталога.
Название
|
Описание
|
Yahoo!
|
Самый популярный каталог, содержащий обширную информацию о десятках тысяч Web-узлов. Первый уровень иерархии содержит 14 тематических категорий, которые разветвляются еще на 4 - 5 подуровней. Имеет собственную машину поиска, позволяющую: 1) искать по базе Yahoo!, по Usenet или по адресам электронной почты; 2) ограничить поиск материалами, размещенными за последний день, неделю, месяц, год или 3 года; 3) выдать статьи, содержащие хотя бы одно ключевое слово или все ключевые слова; 4) искать по однокоренным словам или только по указанным ключевым; 5) выдать результаты по 10, 25, 50 или 100 на одной странице.
|
Excite Reviews
|
Содержит обзоры 60 тыс. узлов Интернет, систематизированные в иерархический каталог.
|
City.Net
|
Каталог сведений о разных странах и городах.
|
Galaxy
|
Иерархический каталог с подробным описанием тематических категорий на первой странице. Осуществляет поиск по категории поиска, по одному или нескольким ключевым словам, краткий и подробный вывод результатов поиска, переход на страницы Gopher и Telnet.
|
Yellow Pages
|
Поиск информации о 16 млн. американских компаниях в различных областях деятельности, а также персональные данные и электронные адреса частных лиц.
|
Поисковые машины
В разделе курса "Поиск информации в Интернет" мы рассмотрели принцип работы поисковых машин: часть машины, называемая «пауком» (или «спайдером»), постоянно путешествует по узлам сети, собирая и обновляя информацию, кодирует ее (индексация) и записывает в специализированную базу данных. При поступлении от пользователя запроса в виде набора ключевых слов машина исследует свою базу данных и выдает список документов, содержащих ключевые слова, как правило, ранжированный в зависимости от частоты вхождения ключевых слов и других характеристик.
К достоинствам применения поисковых машин можно отнести огромный объем информации, исследуемой ими, и ее периодическую актуализацию. Однако, при этом не учитываются документы, не содержащие ключевых слов, а, с другой стороны, в списке содержится много шумовой, не относящейся к делу информации, отсеивание которой занимает немалое время.
Название
|
Описание
|
Lycos
|
Охватывает 68 млн. страниц. Можно выбрать параметры поиска: одно, несколько ключевых слов или фраза; усечение терминов; ограничения на число совпадений; степень соответствия результатов поиска ключевым словам; форму вывода результатов ( краткую или подробную ); количество найденных терминов на каждой странице. Невысокие быстродействие и оперативность обновления информации.
|
Alta Vista
|
Охватывает более 30 млн. страниц на 225000 серверах, обеспечивает доступ к 3 млн. статей в 14000 телеконференциях Usenet. Имеет два режима: Simple query и Advanced query. В режиме Simple можно вводить шаблоны для поиска не менее, чем с тремя указанными символами в начале слова. Если слово содержит хотя бы одну заглавную букву, ведется поиск с учетом регистра. Ниже строки ввода выдаются советы по поиску. В режиме Advanced можно создавать сложные запросы, основанные на логических операторах AND, OR, NOT, NEAR и указывать критерии сортировки полученных результатов. Можно указывать диапазон дат опубликования. Предоставляет возможность поиска изображений. Удобный интерфейс. Высокое быстродействие, многовариантное поисковое предписание, возможность поиска на русском языке с учетом морфологии. Система не упорядочивает результаты поиска, поэтому ее целесообразно применять для специфического или исчерпывающего поиска.
|
Infoseek Guide
|
Охватывает 1,5 млн. страниц. Язык запросов позволяет использовать все возможные варианты логических выражений. Менее полные, чем на других серверах, результаты поиска, неудобный интерфейс.
|
Infoseek Ultra
|
50 млн. страниц WWW, возможен поиск на русском языке, поиск изображений.
|
WebCrawler
|
Охватывает WWW, Usenet, Gopher, FTP, Telnet. Возможен поиск на русском языке. Простота в обращении, быстрота. Менее обширная база узлов, чем на других серверах.
|
HotBot
|
Охватывает 54 млн. страниц. Многовариантное поисковое предписание. Возможен поиск на русском языке.
|
Мета-средства поиска
Мета-средства поиска позволяют усовершенствовать процесс путем запуска одновременно нескольких средств поиска. Этот способ значительно повышает качество поиска, объединяя достоинства и возможности всех используемых средств.
Однако, иногда поиск с применением мета-средств может оказаться очень медленным, так как им приходиться координировать во времени поступления результатов обработки запроса от нескольких серверов и проблемы, возникшие у одного из них, могут приостановить работу всей системы. Еще одним недостатком мета-средств является то, что они не позволяют использовать возможности языка запроса каждого из применяемых поисковых средств и не дают возможности заглянуть в их справочные руководства.
Название
|
Описание
|
MetaCrawler
|
Подключает 9 поисковых систем одновременно. Проверяется возможность доступа к найденной информации, соответствие содержимого заданному критерию. Можно сортировать информацию по территориальной близости, по близости к определенному узлу, по отношению к компании и т.д. Возможен поиск на русском языке. Есть возможность персональной настройки интерфейса.
|
SavvySearch
|
Запускает одну из 4 групп, состоящих из трех поисковых систем:
|
-
|
WebCrawler, Yahoo!, Lycos
|
|
-
|
Galaxy, Excite, DejaNews
|
|
-
|
FTPSearch95, Yellow Pages, Infoseek
|
|
-
|
Magellan, NlightN, PointSearch
|
Поисковое предписание с использованием операторов AND и OR. Возможен поиск на многих языках, в том числе на русском.
|
All-in-One
|
Хорошо структурированная мета-машина, имеющая древовидную классификационную структуру, на верхнем уровне которой размещены группы: , весь Internet, личные интересы, ПО, странички частных лиц, новости и погода, литература и прочее. Уточняя содержание каждой группы, можно попасть на следующий уровень.
Использует около 200 поисковых средств.
|
Internet Sleuth
|
Охватывает 1500 баз данных. Можно запустить одновременно до 10 поисковых систем из 24, имеющихся в меню. Использует операторы AND, OR, NOT, усечение терминов. Для каждой поисковой машины можно задать свой критерий и свое ограничение времени поиска.
Возможен поиск на русском языке. Тематический поиск ведется по большому количеству периодических изданий и информационных служб многих стран. Для группы "НОВОСТИ" используется 39 источников.
|
Русскоязычные средства поиска
Каталоги
Название
|
Описание
|
ПАУК
|
Широкий охват русскоязычного WWW. Глубина поиска: название, первые строки, электронный адрес документов. Поддерживает все русские кодировки, возможность усечения терминов. Большой объем, разветвленная иерархическая структура. Слабая оперативность обновления информации.
|
Созвездие Интернет
|
Охватывает около 400 серверов. Возможность усечения терминов. Содержит названия и краткие характеристики серверов. Привлекательная графика. Небольшая зона поиска, слабая иерархия.
|
Желтые страницы Интернет
|
Около 1200 Web-серверов. Большой объем информации, хорошо продуманная структура.
|
Russia on the Net
|
Первый каталог русских ресурсов.
|
АУ!
|
Молодой, быстроразвивающийся каталог.
|
Сокровища Интернет
|
Каталог Web-ресурсов на сервере Relcom.
|
Поисковые машины
Название
|
1. Зона поиска
|
2. Глубина поиска
|
3. Язык запроса
|
4. Вывод результата
|
5. Достоинства и недостатки
|
Rambler
|
1. Около 4000 Web-узлов, недельный архив телеконференций Relcom.
|
2. Все слова в документе.
|
3. Операторы AND, OR, NOT. Возможность усечения терминов. Ограничения по дате. Простой запрос - 30 ссылок, углубленный - 1000.
|
4. Название документа, резюме, размер файла, адрес, дата последнего обновления, степень соответствия, кодировка.
|
5. Удобный интерфейс, высокое быстродействие, полная информация на выходе. Слабая оперативность обновления информации.
|
Апорт!
|
1. 16 серверов.
|
2. Все слова в документе.
|
3. AND и OR. Поиск по фразе (в двойных кавычках). Возможность усечения терминов. Чувствительность к строчным и прописным буквам.
|
4. Название документа, резюме, размер файла, адрес, дата последнего обновления, степень соответствия запросу, кодировка.
|
5. Удобство для пользователя, высокое быстродействие.
|
Русская Машина Поиска
|
1. Более 900 русскоязычных узлов.
|
2. Все слова в документе.
|
3. AND и OR. Поиск по отдельной фразе. Ограничения поиска определенными элементами Web-страниц (название, ключевые слова, автор и т.д.). пользователь может установить или отменить чувствительность к строчным и прописным буквам и указать количество возможных ошибок в искомом слове, если нет уверенности в его написании.
|
4. Название документа, резюме, адрес, степень соответствия запросу.
|
5. Многовариантность поискового предписания. Непривычная форма выдачи результата.
|
Яndex-Web
|
1. 5000 серверов - вся русская часть Интернет, включая домены "RU", "SU", а также русскоязычные ресурсы в других доменах.
|
2. Все слова в документе.
|
3. AND, OR, NOT. Позволяет осуществлять поиск внутри абзаца, документа, в заголовках и других полях, а также с указанием расстояния между словами. Поиск по фразе. Учет морфологии русского языка. Чувствительность к строчным и прописным буквам. Возможность простого и сложного запроса. Поиск в найденном.
|
4. Заголовок, начало текста документа, размер файла, дата и адрес, степень соответствия запросу, кодировка. Возможность "подсвечивания" слов в тексте, соответствующих поисковому предписанию.
|
5. Индексация обеспечивает нормализацию слов и уникальность документа. Широкий охват, удобный интерфейс, высокое быстродействие, высокая оперативность обновления информации (раз в неделю).
|
Данное описание не претендует на исчерпывающий охват средств поиска. Более подробную информацию можно получить, изучая иные варианты списков поисковых средств, доступные в Интернет.
|