Википедия

Полнотекстовый поиск

Полнотекстовый поиск (англ. Full text searching, фр. Recherche en texte integral) — автоматизированный поиск документов, при котором поиск ведётся не по именам документов, а по их содержимому, всему или существенной части. Многие веб-сайты и прикладные программы (например, программы для обработки текстов) предоставляют возможности полнотекстового поиска. Некоторые системы веб-поиска, такие как AltaVista, используют методы полнотекстового поиска, в то время как другие индексируют только часть веб-страниц, проверенных их системами индексации.

Полнотекстовый индекс

Первые версии программ полнотекстового поиска предполагали сканирование всего содержимого всех документов в поиске заданного слова или фразы. При использовании такой технологии поиск занимал очень много времени (в зависимости от размера базы), а в интернете был бы невыполним. Современные алгоритмы заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. При наличии такого индекса достаточно осуществить поиск нужных слов в нём и тогда сразу же будет получен список документов, в которых они встречаются.

Реализации

MySQL

Полнотекстовые индексы в MySQL обозначаются как типом «FULLTEXT», который может применяться для столбцов типов «VARCHAR» и «TEXT». При массовом добавлении данных в таблицу с полями «FULLTEXT» индекс будет создаваться сразу, что замедлит работу, для избежания эффекта рекомендуется модернизировать поля уже после добавления.

Поиск выполняется с помощью функций MATCH() и AGAINST():

 SELECT * FROM articles WHERE MATCH (title, body) AGAINST ('поиск'); 

При этом поисковая фраза должна быть написана слово в слово (то есть «поиска», «поисковик» — невалидные варианты для примера выше)

Результат (жирным выделены найденные соответствия):

id title body
5 Регулярные выражения В большинстве реализаций регулярных выражений есть способ производить поиск фрагмента текста …
1 Полнотекстовой поиск Полнотекстовой поиск

См. также

Ссылки

  • Бартунов О., Сигаев, Ф. Введение в полнотекстовый поиск в PostgreSQL. Архивировано 8 октября 2015 года.
  • Лебедев, Д., Юсов, О. Полнотекстовый поиск в MySQL на PHP. Архивировано 1 января 2016 года.
  • Петрухин, А. Н., Дворецкий, А. Ю. Цифровой поиск как основа реализации словаря полнотекстовой базы данных // Вопросы радиоэлектроники. — Москва: Центральный научно-исследовательский институт экономики, систем управления и информации «Электроника. — ISSN 0233-9950.
  • Симанкина, Н. И., Шипулина, К. В., Костарев, А. А., Окунев, А. Ф. Разработка подсистемы полнотекстовой индексации и полнотекстового поиска для платформы облачного контент-репозитория. — 2014. — № 4 (27). — С. 92—96.
  • Филатов, В. О., Кравцов, И. В., Варфоломеев, А. Г. Информационная система для работы с полнотекстовыми базами данных исторических документов на основе технологии XML. Архивировано 18 августа 2019 года.
  • Зайцев, А. В. Методика создания индексных файлов для осуществления полнотекстового поиска в сети Интернет. Архивировано 23 декабря 2015 года.
  • Колосов, А. П., Богатырев, М. Ю. Система полнотекстового поиска по длинным запросам. Архивировано 4 марта 2016 года.

Примечания

  1. Скачать ГОСТ 7.73-96 СИБИД. Поиск и распространение информации. Термины и определения. Дата обращения: 9 июля 2011. Архивировано 31 мая 2011 года.

Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Полнотекстовый поиск, Что такое Полнотекстовый поиск? Что означает Полнотекстовый поиск?

Polnotekstovyj poisk angl Full text searching fr Recherche en texte integral avtomatizirovannyj poisk dokumentov pri kotorom poisk vedyotsya ne po imenam dokumentov a po ih soderzhimomu vsemu ili sushestvennoj chasti Mnogie veb sajty i prikladnye programmy naprimer programmy dlya obrabotki tekstov predostavlyayut vozmozhnosti polnotekstovogo poiska Nekotorye sistemy veb poiska takie kak AltaVista ispolzuyut metody polnotekstovogo poiska v to vremya kak drugie indeksiruyut tolko chast veb stranic proverennyh ih sistemami indeksacii Polnotekstovyj indeksPervye versii programm polnotekstovogo poiska predpolagali skanirovanie vsego soderzhimogo vseh dokumentov v poiske zadannogo slova ili frazy Pri ispolzovanii takoj tehnologii poisk zanimal ochen mnogo vremeni v zavisimosti ot razmera bazy a v internete byl by nevypolnim Sovremennye algoritmy zaranee formiruyut dlya poiska tak nazyvaemyj polnotekstovyj indeks slovar v kotorom perechisleny vse slova i ukazano v kakih mestah oni vstrechayutsya Pri nalichii takogo indeksa dostatochno osushestvit poisk nuzhnyh slov v nyom i togda srazu zhe budet poluchen spisok dokumentov v kotoryh oni vstrechayutsya RealizaciiEtot razdel nuzhno dopolnit Pozhalujsta uluchshite i dopolnite razdel 9 sentyabrya 2015 MySQL Polnotekstovye indeksy v MySQL oboznachayutsya kak tipom FULLTEXT kotoryj mozhet primenyatsya dlya stolbcov tipov VARCHAR i TEXT Pri massovom dobavlenii dannyh v tablicu s polyami FULLTEXT indeks budet sozdavatsya srazu chto zamedlit rabotu dlya izbezhaniya effekta rekomenduetsya modernizirovat polya uzhe posle dobavleniya Poisk vypolnyaetsya s pomoshyu funkcij MATCH i AGAINST SELECT FROM articles WHERE MATCH title body AGAINST poisk Pri etom poiskovaya fraza dolzhna byt napisana slovo v slovo to est poiska poiskovik nevalidnye varianty dlya primera vyshe Rezultat zhirnym vydeleny najdennye sootvetstviya id title body5 Regulyarnye vyrazheniya V bolshinstve realizacij regulyarnyh vyrazhenij est sposob proizvodit poisk fragmenta teksta 1 Polnotekstovoj poisk Polnotekstovoj poisk Sm takzhePoiskovyj robot Poiskovyj indeks Indeksaciya v poiskovyh sistemahSsylkiBartunov O Sigaev F Vvedenie v polnotekstovyj poisk v PostgreSQL Arhivirovano 8 oktyabrya 2015 goda Lebedev D Yusov O Polnotekstovyj poisk v MySQL na PHP Arhivirovano 1 yanvarya 2016 goda Petruhin A N Dvoreckij A Yu Cifrovoj poisk kak osnova realizacii slovarya polnotekstovoj bazy dannyh Voprosy radioelektroniki Moskva Centralnyj nauchno issledovatelskij institut ekonomiki sistem upravleniya i informacii Elektronika ISSN 0233 9950 Simankina N I Shipulina K V Kostarev A A Okunev A F Razrabotka podsistemy polnotekstovoj indeksacii i polnotekstovogo poiska dlya platformy oblachnogo kontent repozitoriya 2014 4 27 S 92 96 Filatov V O Kravcov I V Varfolomeev A G Informacionnaya sistema dlya raboty s polnotekstovymi bazami dannyh istoricheskih dokumentov na osnove tehnologii XML Arhivirovano 18 avgusta 2019 goda Zajcev A V Metodika sozdaniya indeksnyh fajlov dlya osushestvleniya polnotekstovogo poiska v seti Internet Arhivirovano 23 dekabrya 2015 goda Kolosov A P Bogatyrev M Yu Sistema polnotekstovogo poiska po dlinnym zaprosam Arhivirovano 4 marta 2016 goda PrimechaniyaSkachat GOST 7 73 96 SIBID Poisk i rasprostranenie informacii Terminy i opredeleniya neopr Data obrasheniya 9 iyulya 2011 Arhivirovano 31 maya 2011 goda Eto zagotovka stati o programmnom obespechenii Pomogite Vikipedii dopolniv eyo V state ne hvataet ssylok na istochniki sm rekomendacii po poisku Informaciya dolzhna byt proveryaema inache ona mozhet byt udalena Vy mozhete otredaktirovat statyu dobaviv ssylki na avtoritetnye istochniki v vide snosok 9 iyulya 2011

NiNa.Az

NiNa.Az - Абсолютно бесплатная система, которая делится для вас информацией и контентом 24 часа в сутки.
Взгляните
Закрыто