Navicat 博客

在 MySQL 中执行全文搜索(第 3 部分) 2019 年 12 月 19 日,由 Robert Gravelle 撰写

欢迎阅读本系列的第3部分有关MySQL中的全文索引和搜索。 在第1部分中,我们了解了MySQL如何通过全文索引以及以下三种不同的全文搜索类型提供全文搜索功能:

  • 自然语言全文搜索
  • Boolean 全文搜索
  • 查询扩展搜索

第2部分中,我描述了如何在Navicat for MySQL中执行自然语言全文搜索。 今天的博客紧随其后,第2部分已结束,涵盖了下一类全文搜索:Boolean全文搜索。

Boolean模式描述

Boolean模式比自然语言搜索更受单词驱动。 这样,Boolean全文搜索支持非常复杂的查询,其中包括Boolean运算符。 对于有经验的用户,Boolean全文搜索提供了一种执行一些非常高级的搜索的方法。

运作方式如下:

要在Boolean模式下执行全文搜索,请在AGAINST表达式中包含IN BOOLEAN MODE修饰符。 回想一下,在上一期文章中,我们向Sakila示例数据库的电影表中添加了全文索引,以便可以在description字段中执行全文搜索。 这是一个示例,该示例返回所有描述中包含“Butler”一词的电影:

MySQL - Boolean Mode - 1

一些更复杂的例子

上面的搜索非常简单,不需要全文本搜索。 一旦开始执行诸如排除包含某些关键字的匹配之类的操作,它将变得更加有趣。 例如,通过在单词“Documentary”之前加上排除Boolean运算符(-),我们可以找到描述中包含“Butler”一词而不是纪录片的电影:

MySQL - Boolean Mode Exclude

这将返回61行,而之前的查询为73行。

多词匹配

我们还可以使用(+)包含运算符搜索描述与多个单词匹配的行。 给单词加上前缀会告诉搜索引擎只匹配包含该单词的行。 当存在多个单词(例如“+ Butler Hunter Waitress”)时,这将成为重要的区别。 在这种情况下,将返回其描述包含单词“Butler”以及所有其他两个单词之一的所有行:

MySQL - Boolean Mode Multi

将上面的结果与由带有“(+)”前缀的单词“Butler”和“Hunter”的查询所产生的结果进行比较:

MySQL - Boolean Mode Multi - 2

现在,匹配的行必须同时包含“Butler”和“Hunter”,但不一定包含“Waitress”。

相关性排名快速说明

InnoDB的全文搜索排名与MyISAM的排名不同,因为InnoDB全文搜索是基于Sphinx全文搜索引擎建模的,并且所使用的算法基于BM25和TF-IDF排名算法。

一些运算符会影响排名,因此我们可以进一步调整结果。 例如,我们可以搜索包含单词“Butler”的行,但是如果包含单词“Hunter”或“Waitress”的行则排在下面:

MySQL - Boolean mode rank lower

总结

在今天的博客中,我们学习了如何使用Navicat for MySQL执行Boolean全文搜索。 有兴趣进一步了解Navicat for MySQL吗? 您可以免费试用14天,以进行评估!

有关Boolean全文运算符的完整列表,请查看官方的MySQL文档

Navicat 文章
频道条目
分享
文章归档