1. 前言1

pg_search是一个用于PostgreSQL全文检索的gem,它使用起来简单,功能也很强大。

以本站为例,文章都是放在articles这张表中,文章有标题和内容,即title和body,现在要对这两个做全文检索。

2. 安装和使用

安装gem

gem 'pg_search'

查看pg_search的readme文档就可以知道。它主要有两种使用方式,分别是Multi-search和search scopes。Multi-search是适合于网站比较复杂,例如多张表,要把多张表揉在一起,放到一张表来做查找。现在我们的网站简单,不需要这个功能,所以我们来看看search scopes的用法。

class Article < ActiveRecord::Base
  include PgSearch
  pg_search_scope :search_by_title_or_body, :against => [:title, :body]
end

rails console创建一些文档,之后就能用Article.search_by_title_or_body来搜索了。

这样再结合表单就能实现一个搜索系统的。

3. 其他功能

pg_search还有其他强大的功能。我们来介绍一下。

3.1 关联(Searching through associations)

我们现在是在articles这张上做查询,那是因为我们的网站简单,但有时候是要跨表的,那也很简单。比如,article是has_many :tags的,就可以这样。

class Article < ActiveRecord::Base
  include PgSearch
  pg_search_scope :search_by_title_or_body,
                  :against => [:title, :body],
                  :associated_against => {
                    :tags => [:name],
                  }
end

可以查看log看具体做了什么操作。其实就是joins之类。

3.2 字典和中文支持(dictionary)

这篇文章PostgreSQL的全文检索系统之中文支持(三)有介绍PostgreSQL中文支持。

安装好那个中文插件,和pg_search结合那太简单了,指定dictionary就好了。

class Article < ActiveRecord::Base
  include PgSearch
  pg_search_scope :search_by_title_or_body,
                  :against => [:title, :body],
                  :associated_against => {
                    :tags => [:name],
                  },
                  :using => {
                    :tsearch => {:dictionary => "testzhcfg"}
                  }
end
3.3 权重(Weighting)

可以给需要搜索的项加上优先级,比如,标题要优先于内容。

class Article < ActiveRecord::Base
  include PgSearch
  pg_search_scope :search_by_title_or_body,
                  :against => {
                    :title => 'A',
                    :body => 'B'
                  },
                  :associated_against => {
                    :tags => [:name],
                  },
                  :using => {
                    :tsearch => {:dictionary => "testzhcfg"}
                  }
end

可以看看日志,如果有类似于"setweight"的输出,说明成功了。

3.4 前缀(prefix)

假如要搜索一个词,例如rails,但是忘了怎么拼写,只记得前两个单词,那就是ra,但输入ra时也能找到关于rails的文章,这就是前缀的作用。使用也很简单。

class Article < ActiveRecord::Base
  include PgSearch
  pg_search_scope :search_by_title_or_body,
                  :against => {
                    :title => 'A',
                    :body => 'B'
                  },
                  :associated_against => {
                    :tags => [:name],
                  },
                  :using => {
                    :tsearch => {:dictionary => "testzhcfg", :prefix => true}
                  }
end
3.5 否定(negation)

否定就是可以搜索不包含的内容,比如!ruby,就是不搜索ruby,其他的都搜索,一个相反过程啦。

class Article < ActiveRecord::Base
  include PgSearch
  pg_search_scope :search_by_title_or_body,
                  :against => {
                    :title => 'A',
                    :body => 'B'
                  },
                  :associated_against => {
                    :tags => [:name],
                  },
                  :using => {
                    :tsearch => {:dictionary => "testzhcfg", :prefix => true, :negation => true}
                  }

还有其他各种用法,normalization用于排序,any_word是否匹配任何一个,dmetaphone模糊匹配等。

完结。


书籍推荐