位置:首页 > 数据库 > MongoDB在线教程 > MongoDB文本搜索

MongoDB文本搜索

从2.4版本开始,MongoDB开始支持在内容里使用文本索引搜索字符串。文本搜索使用词干技术通过降低所产生停止词语,来查找在字符串字段中指定词语如, a, an, the等等,到目前为止,MongoDB支持15种语言。

启用文本搜索:

最初文本搜索是一个实验性功能,但2.6版本开始,配置是默认启用的。但是,如果使用的是以前 MongoDB 的版本,那么必须启用文本搜索,使用下面的代码:

>db.adminCommand({setParameter:true,textSearchEnabled:true})

创建文本索引:

考虑下文字后其标签的帖子集合,包含以下文件:

{
   "post_text": "enjoy the mongodb articles on yiibai",
   "tags": [
      "mongodb",
      "yiibai"
   ]
}

我们将创建post_text字段的文本索引,以便我们能够在我们的帖子中搜索文本:

>db.posts.ensureIndex({post_text:"text"})

使用文本索引:

现在,我们已经创建文本post_text字段的索引,我们将搜索所有含有 gitbook.net 一词的帖子。

>db.posts.find({$text:{$search:"gitbook.net"}})

上面的命令返回在文本中含有yiibai单词的帖子,如以下结果文档:

{ 
   "_id" : ObjectId("53493d14d852429c10000002"), 
   "post_text" : "enjoy the mongodb articles on gitbook.net", 
   "tags" : [ "mongodb", "gitbook.net" ]
}
{
   "_id" : ObjectId("53493d1fd852429c10000003"), 
   "post_text" : "writing tutorials on mongodb",
   "tags" : [ "mongodb", "tutorial" ] 
}

如果使用的是旧版本的MongoDB,必须使用下面命令:

>db.posts.runCommand("text",{search:" gitbook.net "})

使用文本搜索比普通搜索的搜索效率有极大的提高。

删除文本索引:

要删除现有的文本索引,使用下面的查询首先找到索引的名称:

>db.posts.getIndexes()

从上面查询得到索引的名称后,运行以下命令。这里,post_text_text是索引的名称。

>db.posts.dropIndex("post_text_text")