Поиск информации
Информацио́нный по́иск (англ. information retrieval) — процесс поиска неструктурированной документальной информации, удовлетворяющей информационные потребности, и наука об этом поиске.
История
Термин «информационный поиск» был впервые введён Кельвином Муэрсом в 1948 в его докторской диссертации, опубликован и употребляется в литературе с 1950.
Сначала системы автоматизированного ИП, или информационно-поисковые системы (ИПС), использовались лишь для поиска научной информации и литературы. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет и развитием Всемирной паутины. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Яндекс, Google.
Информационный поиск как процесс
Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех тех, которые посвящены указанной теме (предмету), удовлетворяют заранее определённому условию поиска () или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.
Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление информации.
В общем случае поиск информации состоит из четырёх этапов:
- определение (уточнение) информационной потребности и формулировка информационного запроса;
- определение совокупности возможных держателей информационных массивов (источников);
- извлечение информации из выявленных информационных массивов;
- ознакомление с полученной информацией и оценка результатов поиска.
Виды поиска
Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространённой технологией для индексов полнотекстового поиска являются инвертированные индексы.
Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).
Поиск изображений — поиск по содержанию изображения. Поисковая система распознаёт содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы: Polar Rose, Picollator и др.
Методы поиска
Адресный поиск
Процесс поиска документов по чисто формальным признакам, указанным в запросе.
Для осуществления нужны следующие условия:
- Наличие у документа точного адреса
- Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.
Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.
Семантический поиск
Процесс поиска документов по их содержанию.
Условия:
- Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление и запроса.
- Составление поискового описания, в котором указывается дополнительное условие поиска.
Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске — с точки зрения содержания.
При семантическом поиске находится множество документов без указания адресов.
В этом принципиальное отличие каталогов и картотек.
Библиотека — собрание библиографических записей без указания адресов.
Документальный поиск
В разделе не хватает ссылок на источники (см. рекомендации по поиску). |
Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.
Два вида документального поиска:
- Библиотечный, направленный на нахождение первичных документов.
- Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.
Фактографический поиск
Процесс поиска фактов, соответствующих информационному запросу.
К фактографическим данным относятся сведения, извлечённые из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.
Различают два вида:
- Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
- Фактологический (описание фактов), предполагающий создание новых фактографических описаний в процессе поиска путём логической переработки найденной фактографической информации.
Информационный поиск как наука
Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.
Поиск информации — процесс выявления в массиве информации записей, удовлетворяющих заранее определённому условию поиска или запросу.
ИП рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.
Существует некоторая путаница, связанная с понятиями поиска данных, поиска документов, информационного поиска и текстового поиска. Тем не менее, каждое из этих направлений исследования обладает собственными методиками, практическими наработками и литературой.
В настоящее время ИП — это бурно развивающаяся область науки, популярность которой обусловлена экспоненциальным ростом объёмов информации, в частности в сети Интернет. ИП посвящена обширная литература и множество конференций. Одной из наиболее известных является TREC, организованной в 1992 Министерством обороны США совместно с Институтом Стандартов и Технологий (NIST) с целью консолидации исследовательского сообщества и развития методик оценки качества ИП.
Запрос и объект запроса
Говоря о системах ИП, употребляют термины запрос и объект запроса.
Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.
Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространённым объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в ИПС называется индексацией. Далеко не всегда ИПС хранит точную копию объекта, нередко вместо неё хранится .
Задачи информационного поиска
Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий собой набор ключевых слов, характеризующий то, что ищет пользователь.
Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:
- Вопросы моделирования;
- Классификация документов;
- ;
- Кластеризация документов;
- и пользовательских интерфейсов;
- Извлечение информации, в частности аннотирования и документов;
- Языки запросов и др.
Также, перед движками ИП ставятся некоторые задачи по обработке естественных языков, что включает в себя морфологический анализ, разрешение лексической многозначности и так далее.
Оценки эффективности
Существует много способов оценить насколько хорошо документы, найденные ИПС, соответствуют запросу. К сожалению, понятие степени соответствия запроса, или другими словами релевантности, является субъективным понятием, а степень соответствия зависит от конкретного человека, оценивающего результаты выполнения запроса.
Точность (precision)

Определяется как отношение числа релевантных документов, найденных ИПС, к общему числу найденных документов:
,
где — это множество релевантных документов в базе, а
— множество документов, найденных системой.
Полнота (recall)
Отношение числа найденных релевантных документов, к общему числу релевантных документов в базе:
,
где — это множество релевантных документов в базе, а
— множество документов, найденных системой.
Выпадение (fall-out)
Выпадение характеризует вероятность нахождения нерелевантного ресурса и определяется, как отношение числа найденных нерелевантных документов к общему числу нерелевантных документов в базе:
,
где — это множество нерелевантных документов в базе, а
— множество документов, найденных системой.
F-мера (F-measure, мера Ван Ризбергена)
Иногда бывает полезно объединить точность и полноту в одной усреднённой величине. Для этой цели среднее арифметическое не подходит, так как, например, поисковой системе достаточно вернуть вообще все документы, чтобы обеспечить равную единице полноту при близкой к нулю точности, и среднее арифметическое точности и полноты будет не меньше 1/2. Среднее гармоническое не обладает этим недостатком, поскольку при большом отличии усредняемых значений приближается к минимальному из них.
Поэтому хорошей мерой для совместной оценки точности и полноты является F-мера, которая определяется как взвешенное гармоническое среднее точности P и полноты R:
Обычно F-меру записывают в виде
При либо
F-мера придаёт одинаковый вес точности и полноте и называется сбалансированной или
-мерой (в нижнем индексе принято указывать величину
), выражение для неё упрощается
Использование сбалансированной F-меры не является обязательным: при предпочтение отдаётся точности, а при
больший вес приобретает полнота.
См. также
- Электронные библиотеки
- Полнотекстовый поиск
- Поисковые системы
- Российский семинар по оценке методов информационного поиска (РОМИП)
Примечания
- Manning et al, 2011, pp. 23.
- Переходы — ANALYZETHIS.RU. Дата обращения: 12 октября 2013. Архивировано 14 октября 2013 года.
Литература
- Baeza-Yates R., Ribeiro-Neto B. Modern Information Retrieval. — Addison-Wesley, 1999. — ISBN 0-201-39829-X.
- Manning C., Raghavan P., Schütze H. Introduction to Information Retrieval. — Cambridge University Press, 2008. — ISBN 0-521-86571-9.
- Перевод: Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. — Вильямс, 2011. — ISBN 978-5-8459-1623-5.
- Ландэ Д. В., Снарский А. А., Безсуднов И. В. Интернетика: Навигация в сложных сетях: модели и алгоритмы. — M.: Либроком (Editorial URSS), 2009. — 264 с. — ISBN 978-5-397-00497-8.
Ссылки
- ru_ir — сообщество «Информационный поиск» в «Живом Журнале»
- Юрий Лифшиц. Курс лекций «Алгоритмы для Интернета»
- Кураленок И. Е., Некрестьянов И. С. Обзор «Оценка систем текстового поиска»
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Поиск информации, Что такое Поиск информации? Что означает Поиск информации?
Informacio nnyj po isk angl information retrieval process poiska nestrukturirovannoj dokumentalnoj informacii udovletvoryayushej informacionnye potrebnosti i nauka ob etom poiske IstoriyaTermin informacionnyj poisk byl vpervye vvedyon Kelvinom Muersom v 1948 v ego doktorskoj dissertacii opublikovan i upotreblyaetsya v literature s 1950 Snachala sistemy avtomatizirovannogo IP ili informacionno poiskovye sistemy IPS ispolzovalis lish dlya poiska nauchnoj informacii i literatury Mnogie universitety i publichnye biblioteki stali ispolzovat IPS dlya obespecheniya dostupa k knigam zhurnalam i drugim dokumentam Shirokoe rasprostranenie IPS poluchili s poyavleniem seti Internet i razvitiem Vsemirnoj pautiny U russkoyazychnyh polzovatelej naibolshej populyarnostyu polzuyutsya poiskovye sistemy Yandeks Google Informacionnyj poisk kak processPoisk informacii predstavlyaet soboj process vyyavleniya v nekotorom mnozhestve dokumentov tekstov vseh teh kotorye posvyasheny ukazannoj teme predmetu udovletvoryayut zaranee opredelyonnomu usloviyu poiska ili soderzhat neobhodimye sootvetstvuyushie informacionnoj potrebnosti fakty svedeniya dannye Process poiska vklyuchaet posledovatelnost operacij napravlennyh na sbor obrabotku i predostavlenie informacii V obshem sluchae poisk informacii sostoit iz chetyryoh etapov opredelenie utochnenie informacionnoj potrebnosti i formulirovka informacionnogo zaprosa opredelenie sovokupnosti vozmozhnyh derzhatelej informacionnyh massivov istochnikov izvlechenie informacii iz vyyavlennyh informacionnyh massivov oznakomlenie s poluchennoj informaciej i ocenka rezultatov poiska Vidy poiskaPolnotekstovyj poisk poisk po vsemu soderzhimomu dokumenta Primer polnotekstovogo poiska lyuboj internet poiskovik naprimer www yandex ru www google com Kak pravilo polnotekstovyj poisk dlya uskoreniya poiska ispolzuet predvaritelno postroennye indeksy Naibolee rasprostranyonnoj tehnologiej dlya indeksov polnotekstovogo poiska yavlyayutsya invertirovannye indeksy Poisk po metadannym eto poisk po nekim atributam dokumenta podderzhivaemym sistemoj nazvanie dokumenta data sozdaniya razmer avtor i t d Primer poiska po rekvizitam dialog poiska v fajlovoj sisteme naprimer MS Windows Poisk izobrazhenij poisk po soderzhaniyu izobrazheniya Poiskovaya sistema raspoznayot soderzhanie fotografii zagruzhena polzovatelem ili dobavlen URL izobrazheniya V rezultatah poiska polzovatel poluchaet pohozhie izobrazheniya Tak rabotayut poiskovye sistemy Polar Rose Picollator i dr Metody poiskaAdresnyj poisk Process poiska dokumentov po chisto formalnym priznakam ukazannym v zaprose Dlya osushestvleniya nuzhny sleduyushie usloviya Nalichie u dokumenta tochnogo adresa Obespechenie strogogo poryadka raspolozheniya dokumentov v zapominayushem ustrojstve ili v hranilishe sistemy Adresami dokumentov mogut vystupat adresa veb serverov i veb stranic i elementy bibliograficheskoj zapisi i adresa hraneniya dokumentov v hranilishe Semanticheskij poisk Process poiska dokumentov po ih soderzhaniyu Usloviya Perevod soderzhaniya dokumentov i zaprosov s estestvennogo yazyka na informacionno poiskovyj yazyk i sostavlenie i zaprosa Sostavlenie poiskovogo opisaniya v kotorom ukazyvaetsya dopolnitelnoe uslovie poiska Principialnaya raznica mezhdu adresnym i semanticheskim poiskami sostoit v tom chto pri adresnom poiske dokument rassmatrivaetsya kak obekt s tochki zreniya formy a pri semanticheskom poiske s tochki zreniya soderzhaniya Pri semanticheskom poiske nahoditsya mnozhestvo dokumentov bez ukazaniya adresov V etom principialnoe otlichie katalogov i kartotek Biblioteka sobranie bibliograficheskih zapisej bez ukazaniya adresov Dokumentalnyj poisk V razdele ne hvataet ssylok na istochniki sm rekomendacii po poisku Informaciya dolzhna byt proveryaema inache ona mozhet byt udalena Vy mozhete otredaktirovat statyu dobaviv ssylki na avtoritetnye istochniki v vide snosok 13 marta 2024 Process poiska v hranilishe informacionno poiskovoj sistemy pervichnyh dokumentov ili v baze dannyh vtorichnyh dokumentov sootvetstvuyushih zaprosu polzovatelya Dva vida dokumentalnogo poiska Bibliotechnyj napravlennyj na nahozhdenie pervichnyh dokumentov Bibliograficheskij napravlennyj na nahozhdenie svedenij o dokumentah predstavlennyh v vide bibliograficheskih zapisej Faktograficheskij poisk Process poiska faktov sootvetstvuyushih informacionnomu zaprosu K faktograficheskim dannym otnosyatsya svedeniya izvlechyonnye iz dokumentov kak pervichnyh tak i vtorichnyh i poluchaemye neposredstvenno iz istochnikov ih vozniknoveniya Razlichayut dva vida Dokumentalno faktograficheskij zaklyuchaetsya v poiske v dokumentah fragmentov teksta soderzhashih fakty Faktologicheskij opisanie faktov predpolagayushij sozdanie novyh faktograficheskih opisanij v processe poiska putyom logicheskoj pererabotki najdennoj faktograficheskoj informacii Informacionnyj poisk kak naukaInformacionnyj poisk bolshaya mezhdisciplinarnaya oblast nauki stoyashaya na peresechenii kognitivnoj psihologii informatiki informacionnogo dizajna lingvistiki semiotiki i bibliotechnogo dela Poisk informacii process vyyavleniya v massive informacii zapisej udovletvoryayushih zaranee opredelyonnomu usloviyu poiska ili zaprosu IP rassmatrivaet poisk informacii v dokumentah poisk samih dokumentov izvlechenie metadannyh iz dokumentov poisk teksta izobrazhenij video i zvuka v lokalnyh relyacionnyh bazah dannyh v gipertekstovyh bazah dannyh takih kak Internet i lokalnye intranet sistemy Sushestvuet nekotoraya putanica svyazannaya s ponyatiyami poiska dannyh poiska dokumentov informacionnogo poiska i tekstovogo poiska Tem ne menee kazhdoe iz etih napravlenij issledovaniya obladaet sobstvennymi metodikami prakticheskimi narabotkami i literaturoj V nastoyashee vremya IP eto burno razvivayushayasya oblast nauki populyarnost kotoroj obuslovlena eksponencialnym rostom obyomov informacii v chastnosti v seti Internet IP posvyashena obshirnaya literatura i mnozhestvo konferencij Odnoj iz naibolee izvestnyh yavlyaetsya TREC organizovannoj v 1992 Ministerstvom oborony SShA sovmestno s Institutom Standartov i Tehnologij NIST s celyu konsolidacii issledovatelskogo soobshestva i razvitiya metodik ocenki kachestva IP Zapros i obekt zaprosaGovorya o sistemah IP upotreblyayut terminy zapros i obekt zaprosa Zapros eto formalizovannyj sposob vyrazheniya informacionnyh potrebnostej polzovatelem sistemy Dlya vyrazheniya informacionnoj potrebnosti ispolzuetsya yazyk poiskovyh zaprosov sintaksis variruetsya ot sistemy k sisteme Krome specialnogo yazyka zaprosov sovremennye poiskovye sistemy pozvolyayut vvodit zapros na estestvennom yazyke Obekt zaprosa eto informacionnaya sushnost kotoraya hranitsya v baze avtomatizirovannoj sistemy poiska Nesmotrya na to chto naibolee rasprostranyonnym obektom zaprosa yavlyaetsya tekstovyj dokument ne sushestvuet nikakih principialnyh ogranichenij V chastnosti vozmozhen poisk izobrazhenij muzyki i drugoj multimedia informacii Process zaneseniya obektov poiska v IPS nazyvaetsya indeksaciej Daleko ne vsegda IPS hranit tochnuyu kopiyu obekta neredko vmesto neyo hranitsya Zadachi informacionnogo poiskaCentralnaya zadacha IP pomoch polzovatelyu udovletvorit ego informacionnuyu potrebnost Tak kak opisat informacionnye potrebnosti polzovatelya tehnicheski neprosto oni formuliruyutsya kak nekotoryj zapros predstavlyayushij soboj nabor klyuchevyh slov harakterizuyushij to chto ishet polzovatel Klassicheskaya zadacha IP s kotoroj nachalos razvitie etoj oblasti eto poisk dokumentov udovletvoryayushih zaprosu v ramkah nekotoroj staticheskoj kollekcii dokumentov No spisok zadach IP postoyanno rasshiryaetsya i teper vklyuchaet Voprosy modelirovaniya Klassifikaciya dokumentov Klasterizaciya dokumentov i polzovatelskih interfejsov Izvlechenie informacii v chastnosti annotirovaniya i dokumentov Yazyki zaprosov i dr Takzhe pered dvizhkami IP stavyatsya nekotorye zadachi po obrabotke estestvennyh yazykov chto vklyuchaet v sebya morfologicheskij analiz razreshenie leksicheskoj mnogoznachnosti i tak dalee Ocenki effektivnostiSushestvuet mnogo sposobov ocenit naskolko horosho dokumenty najdennye IPS sootvetstvuyut zaprosu K sozhaleniyu ponyatie stepeni sootvetstviya zaprosa ili drugimi slovami relevantnosti yavlyaetsya subektivnym ponyatiem a stepen sootvetstviya zavisit ot konkretnogo cheloveka ocenivayushego rezultaty vypolneniya zaprosa Tochnost precision Na etom risunke relevantnye tochki rel nahodyatsya sleva ot pryamoj a tochki najdennye poiskovoj sistemoj retr nahodyatsya v ovale Oblasti krasnogo cveta predstavlyayut oshibki poiskovoj sistemy Krasnaya oblast sleva eto relevantnye tochki ne najdennye sistemoj propusk sobytiya krasnaya oblast sprava najdennye no nerelevantnye tochki lozhnaya trevoga Tochnost eto proporciya levoj zelyonoj oblasti po otnosheniyu k ovalu gorizontalnaya strelka Polnota eto proporciya levoj zelyonoj oblasti k oblasti sleva ot pryamoj diagonalnaya strelka Opredelyaetsya kak otnoshenie chisla relevantnyh dokumentov najdennyh IPS k obshemu chislu najdennyh dokumentov Precision Drel Dretr Dretr displaystyle mbox Precision frac D rel cap D retr D retr gde Drel displaystyle D rel eto mnozhestvo relevantnyh dokumentov v baze a Dretr displaystyle D retr mnozhestvo dokumentov najdennyh sistemoj Polnota recall Otnoshenie chisla najdennyh relevantnyh dokumentov k obshemu chislu relevantnyh dokumentov v baze Recall Drel Dretr Drel displaystyle mbox Recall frac D rel cap D retr D rel gde Drel displaystyle D rel eto mnozhestvo relevantnyh dokumentov v baze a Dretr displaystyle D retr mnozhestvo dokumentov najdennyh sistemoj Vypadenie fall out Vypadenie harakterizuet veroyatnost nahozhdeniya nerelevantnogo resursa i opredelyaetsya kak otnoshenie chisla najdennyh nerelevantnyh dokumentov k obshemu chislu nerelevantnyh dokumentov v baze Fall out Dnrel Dretr Dnrel displaystyle mbox Fall out frac D nrel cap D retr D nrel gde Dnrel displaystyle D nrel eto mnozhestvo nerelevantnyh dokumentov v baze a Dretr displaystyle D retr mnozhestvo dokumentov najdennyh sistemoj F mera F measure mera Van Rizbergena Inogda byvaet polezno obedinit tochnost i polnotu v odnoj usrednyonnoj velichine Dlya etoj celi srednee arifmeticheskoe ne podhodit tak kak naprimer poiskovoj sisteme dostatochno vernut voobshe vse dokumenty chtoby obespechit ravnuyu edinice polnotu pri blizkoj k nulyu tochnosti i srednee arifmeticheskoe tochnosti i polnoty budet ne menshe 1 2 Srednee garmonicheskoe ne obladaet etim nedostatkom poskolku pri bolshom otlichii usrednyaemyh znachenij priblizhaetsya k minimalnomu iz nih Poetomu horoshej meroj dlya sovmestnoj ocenki tochnosti i polnoty yavlyaetsya F mera kotoraya opredelyaetsya kak vzveshennoe garmonicheskoe srednee tochnosti P i polnoty R F 1a1P 1 a 1R a 0 1 displaystyle F frac 1 alpha frac 1 P 1 alpha frac 1 R qquad alpha in 0 1 Obychno F meru zapisyvayut v vide F b2 1 PRb2P R b2 1 a a b2 0 displaystyle F frac beta 2 1 PR beta 2 P R qquad beta 2 frac 1 alpha alpha quad beta 2 in 0 infty Pri a 1 2 displaystyle alpha 1 2 libo b 1 displaystyle beta 1 F mera pridayot odinakovyj ves tochnosti i polnote i nazyvaetsya sbalansirovannoj ili F1 displaystyle F 1 meroj v nizhnem indekse prinyato ukazyvat velichinu b displaystyle beta vyrazhenie dlya neyo uproshaetsya F1 2PRP R displaystyle F 1 frac 2PR P R Ispolzovanie sbalansirovannoj F mery ne yavlyaetsya obyazatelnym pri 0 lt b lt 1 displaystyle 0 lt beta lt 1 predpochtenie otdayotsya tochnosti a pri b gt 1 displaystyle beta gt 1 bolshij ves priobretaet polnota Sm takzheElektronnye biblioteki Polnotekstovyj poisk Poiskovye sistemy Rossijskij seminar po ocenke metodov informacionnogo poiska ROMIP PrimechaniyaManning et al 2011 pp 23 Perehody ANALYZETHIS RU neopr Data obrasheniya 12 oktyabrya 2013 Arhivirovano 14 oktyabrya 2013 goda LiteraturaBaeza Yates R Ribeiro Neto B Modern Information Retrieval Addison Wesley 1999 ISBN 0 201 39829 X Manning C Raghavan P Schutze H Introduction to Information Retrieval Cambridge University Press 2008 ISBN 0 521 86571 9 Perevod Manning K Raghavan P Shyutce H Vvedenie v informacionnyj poisk Vilyams 2011 ISBN 978 5 8459 1623 5 Lande D V Snarskij A A Bezsudnov I V Internetika Navigaciya v slozhnyh setyah modeli i algoritmy M Librokom Editorial URSS 2009 264 s ISBN 978 5 397 00497 8 Ssylkiru ir soobshestvo Informacionnyj poisk v Zhivom Zhurnale Yurij Lifshic Kurs lekcij Algoritmy dlya Interneta Kuralenok I E Nekrestyanov I S Obzor Ocenka sistem tekstovogo poiska
