MongoDB学习笔记(六) MongoDB索引用法和效率分析

http://www.cnblogs.com/lipan/archive/2011/03/28/1997202.html

MongoDB中的索引其实类似于关系型数据库，都是为了提高查询和排序的效率的，并且实现原理也基本一致。由于集合中的键(字段)可以是普通数据类型，也可以是子文档。MongoDB可以在各种类型的键上创建索引。下面分别讲解各种类型的索引的创建，查询，以及索引的维护等。

一、创建索引

　　 1. 默认索引

　　MongoDB有个默认的“_id”的键，他相当于“主键”的角色。集合创建后系统会自动创建一个索引在“_id”键上，它是默认索引，索引名叫“_id_”，是无法被删除的。我们可以通过以下方式查看：

 
         1 
         var _idIndex = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_id_"); 
        
         2 
         Console.WriteLine(_idIndex);

　　 2. 单列索引

　　在单个键上创建的索引就是单列索引，例如我们要在“UserInfo”集合上给“UserName”键创建一个单列索引，语法如下：（1表示正序，-1逆序）

 
         1 
         mongoCollection.Metadata.CreateIndex(new Document { { "UserName", 1 } }, false);

　　接着，我们用同样方法查找名为“_UserName_”的索引

 
         1 
         var _UserName_Index = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_UserName_"); 
        
         2 
         Console.WriteLine(_UserName_Index);

　　 3.组合索引

　　另外，我们还可以同时对多个键创建组合索引。如下代码创建了按照“UserId”正序，“UserName”逆序的组合索引:

 
         1 
         mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 }, { "UserName", -1 } }, false);

　　 4.子文档索引

　　我们可以对文档类型的键创建各种索引，例如单列索引，如下创建用户详细信息“Detail”的单列索引：

 
         1 
         mongoCollection.Metadata.CreateIndex(new Document { { "Detail", 1 } }, false);

　　对子文档的键创建组合索引：例如在“Detail.Address”和“Detail.Age”上创建组合索引：

 
         1 
         mongoCollection.Metadata.CreateIndex(new Document { { "Detail.Address", 1 }, { "Detail.Age", -1 } }, false);

　　 5.唯一索引

　　唯一索引限制了对当前键添加值时，不能添加重复的信息。值得注意的是，当文档不存在指定键时，会被认为键值是“null”，所以“null”也会被认为是重复的，所以一般被作为唯一索引的键，最好都要有键值对。

　　对“UserId”创建唯一索引(这时候最后一个参数为“true”)：

 
         1 
         mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 } }, true);

二、维护索引

　　 1. 查询索引

　　通过索引名查询的方式已有介绍。但有时候，我们可能忘记了索引名，怎么查询呢？

　　下面提供一个遍历全部索引的方法，打印全部索引信息：

 
         1 
         foreach (var index in mongoCollection.Metadata.Indexes) 
        
         2 
          { 
        
         3 
              Console.WriteLine(index.Value); 
        
         4 
         }

　　输出结果示例：

 
         1 
         { "name": "_id_", "ns": "myDatabase.UserInfo", "key": { "_id": 1 } } 
        
         2 
         { "name": "_UserId_unique_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1 }, "unique": true, "_id": "4d8f406ab8a4730b78000005" } 
        
         3 
         { "name": "_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserName": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000006" } 
        
         4 
         { "name": "_Detail.Address_Detail.Age_", "ns": "myDatabase.UserInfo", "key": { "Detail.Address": 1, "Detail.Age": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000007" } 
        
         5 
         { "name": "_UserId_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1, "UserName": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000008" } 
        
         6 
         { "name": "_Detail_", "ns": "myDatabase.UserInfo", "key": { "Detail": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000009" }

　　可见，集合的索引也是通过一个集合来维护的。name表示索引名，ns表示索引属于哪个库哪个集合，key表示索引在哪个键上，正序还是逆序，unique表示是否为唯一索引，等等...

　　 2. 删除索引

　　新手常陷入的误区是，认为集合被删除，索引就不存在了。关系型数据库中，表被删除了，索引也不会存在。在MongoDB中不存在删除集合的说法，就算集合数据清空，索引都是还在的，要移除索引还需要手工删除。

　　例如，删除名为“_UserName_”的索引：

 
         1 
         mongoCollection.Metadata.DropIndex("_UserName_");

　　　　下面提供删除除默认索引外其他全部索引的方法:

 
          01 
          public void DropAllIndex() 
         
          02 
          { 
         
          03 
              var listIndexes = mongoCollection.Metadata.Indexes.ToList(); 
         
          04 
              for (int i = 0; i < listIndexes.Count; i++) 
         
          05 
              { 
         
          06 
                  if (listIndexes[i].Key != "_id_") 
         
          07 
                  { 
         
          08 
                      mongoCollection.Metadata.DropIndex(listIndexes[i].Key); 
         
          09 
                  } 
         
          10 
              } 
         
          11 
          }

三、索引的效率

　　MongoDB的索引到底能不能提高查询效率呢？我们在这里通过一个例子来测试。比较同样的数据在无索引和有索引的情况下的查询速度。

　　首先，我们通过这样一个方法插入10W条数据:

 
         01 
         public void InsertBigData() 
        
         02 
         { 
        
         03 
             var random = new Random(); 
        
         04 
             for (int i = 1; i < 100000; i++) 
        
         05 
             { 
        
         06 
                 Document doc = new Document(); 
        
         07 
           
         08 
                 doc["ID"] = i; 
        
         09 
                 doc["Data"] = "data" + random.Next(100000); 
        
         10 
           
         11 
                 mongoCollection.Save(doc); 
        
         12 
             } 
        
         13 
           
         14 
             Console.WriteLine("当前有" + mongoCollection.FindAll().Documents.Count() + "条数据"); 
        
         15 
         }

　　然后，实现一个方法用来创建索引:

 
         1 
         public void CreateIndexForData() 
        
         2 
         { 
        
         3 
             mongoCollection.Metadata.CreateIndex(new Document { { "Data", 1 } }, false); 
        
         4 
         }

　还有排序的方法：

 
         1 
         public void SortForData() 
        
         2 
         { 
        
         3 
             mongoCollection.FindAll().Sort(new Document { { "Data", 1 } }); 
        
         4 
         }

　运行测试代码如下:

 
         01 
         static void Main(string[] args) 
        
         02 
         { 
        
         03 
             IndexBLL indexBll = new IndexBLL(); 
        
         04 
             indexBll.DropAllIndex(); 
        
         05 
             indexBll.DeleteAll(); 
        
         06 
             indexBll.InsertBigData(); 
        
         07 
           
         08 
             Stopwatch watch1 = new Stopwatch(); 
        
         09 
             watch1.Start(); 
        
         10 
             for (int i = 0; i < 1; i++) indexBll.SortForData(); 
        
         11 
             Console.WriteLine("无索引排序执行时间：" + watch1.Elapsed); 
        
         12 
           
         13 
             indexBll.CreateIndexForData(); 
        
         14 
           
         15 
             Stopwatch watch2 = new Stopwatch(); 
        
         16 
             watch2.Start(); 
        
         17 
             for (int i = 0; i < 1; i++) indexBll.SortForData(); 
        
         18 
             Console.WriteLine("有索引排序执行时间：" + watch2.Elapsed); 
        
         19 
           
         20 
         }

　　最后执行程序查看结果：

　　多次测试表明在有索引的情况下，查询效率要高于无索引的效率。

转载于:https://www.cnblogs.com/licheng/archive/2011/11/09/2241881.html