Сравнение качества поиска


перейти к полному списку дипломных проектов

Ссылка на скачивания файла в формате .doc находится в конце странички

Сравнение качества поиска

Поисковая машина характеризуется двумя важнейшими параметрами: точностью и полнотой (полнота есть отношение количества найденных релевантных документов к полному количеству релевантных документов в базе данных).

Пример. Пусть по запросу найдено 50 документов. После просмотра их всех пользователь принимает решение, что 30 документов релевантны запросу, а 20 нерелевантны. Сплошной просмотр всей базы данных показывает, что в ней содержится 100 документов, релевантных запросу. Отсюда получаем, что полнота 30/100 = 0,3; точность 30/50 = 0,6. Как правило, улучшая один из названных параметров, ухудшаешь другой.

Используется также такая обобщенная характеристика, как техническая эффективность поисковых машин, включающая скорость поиска по запросу, объем базы, удобство представления результатов, скорость индексирования информации и так далее. Но особое место среди этих параметров занимают показатели качества поиска - в этом сходятся мнения всех создателей поисковых машин.

Отечественная компьютерная пресса, которая так любит устраивать тестирование лингвистических программ (например, систем оптического распознавания), пока ни разу не организовала ни одного тестирования отечественных поисковиков (в отличие от ZDnet). Научные тестирования поисковиков также представляются недостаточно объективными, так как используют, к примеру, всего четыре типа запросов (без учета реальной частоты этих запросов на некоторую поисковую машину). Поэтому остановимся на исследованиях для оценки точности по методике Н. Харина. Она используется во время периодических внутрифирменных тестирований поисковых машин в "Рамблере" группой приглашенных экспертов-лингвистов (обычно, в течение двух недель каждое). Можно считать это тестирование независимым, так как его результат не используется заказчиком в маркетинговых целях. Исследования проводились путем оценки результатов поиска различных поисковиков по одним и тем же 100 популярным запросам, состоящим из одного, двух, трех и четырех слов. Важным условием всех исследований были четкие формулировки, какие именно документы считать релевантными смыслу каждого из запросов (без этого были бы получены сильно завышенные оценки технической эффективности). Часто встречающиеся запросы, содержащие ненормативную лексику, не учитывались.

Результаты иследований представлены ниже. Значения годичной давности оставлены, чтобы показать изменения эффективности при переходе "Яндекса" на более совершенную версию поисковой машины в июне 2000 года и изменение точности "Рамблера", вследствие того, что с ноября 2000 года некоторые нововведения стали последовательно внедряться в старый движок.

Результаты для "Апорта", по словам его создателя Евгения Киреева, качественно похожи на правду, потому что за прошедший год ничего в технологиях повышения релевантности в этой системе не менялось, так как, по его мнению, ничего уже и невозможно принципиально изменить. По его словам, команда "Апорта" спокойно ждет, пока "Яндекс" и "Рамблер" подтянутся до такого же уровня, и это будет уровнем развития отрасли. Фактически, результаты последнего исследования от 24 мая 2001 года, проведенные на следующий день после представления новой версии "Яндекса", показывают, что с нынешнего лета уровень отрасли определяется им.

Хотя данные советы даны в качестве "советов по поиску в Яндексе", тем не менее они применимы к подавляющему большинству поисковых систем, так как все современные поисковые системы, в своих функциях и возможностях для поиска, очень похожи.

Проверяйте орфографию

Если поиск не нашел ни одного документа, то вы, возможно, допустили орфографическую ошибку в написании слова. Проверьте правильность написания. Если вы использовали при поиске несколько слов, то посмотрите на количество каждого из слов в найденных документах (перед их списком после фразы "Результат поиска"). Какое-то из слов не встречается ни разу? Скорее всего, его вы и написали неверно.

скачать бесплатно Анализ ресурсов Интернета по вопросу Формирование имиджа фирмы и компании

Содержание дипломной работы

Анализ ресурсов Интернета по вопросу: Формирование имиджа фирмы и компании
Введение
1.История сети INTERNET
2. Что такое Интернет
3.1 Электронная почта
3.2 Передача файлов
3.3 Удаленный доступ
3.4 Как движутся данные – среда передачи
3.5 Коммутируемые линии
3.6 Арендуемые линии
4. Услуги предоставляемые сетью
5. Глобальные гипертекстовые структуры: WWW
6. Доступ в Интернет
7. Поиск информации в Интернете
8.Словарь терминов
Анализ поисковых систем Интернет
Русскоязычные поисковые механизмы в Интернет
Нынешняя позиция Рамблера в российском Интернет и на рынке интернет-рекламы
Поисковая система Yandex.
Сравнение качества поиска
Используйте синонимы
Попробуйте использовать язык запросов
Поисковая система TELA
Поисковая система Googlе
Поисковая система AltaVista
Поисковый каталог Yahoo
Или вот некоторые характеристики узла InfoSeek
Краткая характеристика языка запросов системы InfoSeek .
Анализ ресурсов Интернета по вопросу:
Основные клиенты в Интернет
Сайт содержит в себе
Блок новостей и новинок фирмы
1. Аудитория
6. Обратная связь
8. Поиск клиентов
10. Имидж компании
Список посещенных сайтов

заработать

Закачай файл и получай деньги