MongoDB

1. 核心概念与概述

MongoDB是一个开源的、面向文档的NoSQL数据库管理系统，由MongoDB Inc.开发，使用C++编写。MongoDB以其灵活的数据模型、高性能、高可用性和易扩展性而闻名，广泛应用于各种Web应用、大数据处理和实时分析场景。

1.1 MongoDB的基本概念

MongoDB与传统关系型数据库的概念对应关系如下：

关系型数据库	MongoDB	说明
数据库（Database）	数据库（Database）	存储相关集合的物理容器
表（Table）	集合（Collection）	存储文档的逻辑容器，相当于关系型数据库中的表
行（Row）	文档（Document）	数据的基本单元，以BSON格式存储
列（Column）	字段（Field）	文档中的键值对
索引（Index）	索引（Index）	用于加速查询的特殊数据结构
主键（Primary Key）	_id字段	文档的唯一标识符，默认自动生成

1.2 MongoDB的特点

面向文档的存储：MongoDB存储的是BSON（Binary JSON）格式的文档，数据结构灵活，不需要预定义表结构
高性能：支持内存映射存储、索引、分片等特性，提供高性能的数据读写能力
高可用性：通过副本集（Replica Set）机制，提供自动故障转移和数据冗余
易扩展性：支持水平扩展，可以通过分片（Sharding）将数据分布到多个服务器
丰富的查询语言：支持复杂的查询操作，包括范围查询、正则表达式查询、聚合查询等
多种数据类型支持：支持字符串、数值、日期、数组、内嵌文档等多种数据类型
灵活的索引支持：支持单字段索引、复合索引、地理空间索引、全文索引等多种索引类型

1.3 MongoDB的应用场景

内容管理系统：存储文章、评论等内容，结构灵活多变
实时分析系统：支持实时数据处理和分析
移动应用后端：为移动应用提供数据存储服务
社交应用：存储用户关系、消息、动态等数据
物联网应用：存储传感器数据，支持高写入吞吐量
游戏后端：存储玩家数据、游戏状态等信息
大数据处理：与Hadoop等大数据框架集成，进行数据处理和分析

2. MongoDB架构

2.1 整体架构

MongoDB的整体架构分为以下几层：

存储层：负责数据的持久化存储，包括WiredTiger存储引擎、MMAPv1存储引擎等
查询层：负责处理客户端的查询请求，包括查询解析、优化和执行
复制层：负责数据的复制和同步，提供高可用性
分片层：负责数据的分片和分布，提供水平扩展性
网络层：负责客户端连接管理和数据传输

2.2 存储引擎

MongoDB支持多种存储引擎，不同的存储引擎有不同的特点和适用场景。

2.2.1 WiredTiger存储引擎

WiredTiger是MongoDB 3.2及以上版本的默认存储引擎，具有以下特点：

文档级并发控制：支持多文档的并发读写操作，提高并发性能
压缩：支持数据压缩，包括Snappy、Zlib和Zstd压缩算法，可以减少存储空间
内存使用优化：使用B树索引结构，优化内存使用
事务支持：MongoDB 4.0及以上版本，WiredTiger存储引擎支持多文档事务

2.2.2 MMAPv1存储引擎

MMAPv1是MongoDB早期版本的默认存储引擎，现在已不推荐使用，具有以下特点：

集合级锁：对整个集合加锁，并发性能较低
内存映射文件：使用操作系统的内存映射文件机制进行数据存储
表空间：使用表空间来管理数据文件

2.2.3 In-Memory存储引擎

In-Memory存储引擎是一个将数据存储在内存中的存储引擎，具有以下特点：

高性能：数据存储在内存中，读写性能极高
持久性选项：可以配置数据的持久化方式，如定期快照、WAL日志等
适用场景：适用于需要极高读写性能、数据可以丢失或可以从其他数据源恢复的场景

2.3 副本集（Replica Set）

副本集是MongoDB提供高可用性的核心机制，由一组MongoDB服务器组成，其中包含一个主节点（Primary）和多个从节点（Secondary）。

2.3.1 副本集的工作原理

主节点：负责处理客户端的所有写操作，并记录操作日志（oplog）
从节点：从主节点复制oplog，并应用oplog中的操作，保持数据与主节点一致
选举机制：当主节点不可用时，副本集会自动选举新的主节点
读偏好：客户端可以设置读偏好，决定从哪个节点读取数据

2.3.2 副本集的配置

一个典型的副本集配置包括：

1个主节点：接收所有写操作
2个或更多从节点：复制主节点的数据，提供数据冗余和读取能力
可选的仲裁者（Arbiter）：不存储数据，只参与选举投票

副本集配置示例：

javascript

// 初始化副本集
rs.initiate({
  _id: "myReplicaSet",
  members: [
    { _id: 0, host: "mongodb1.example.net:27017" },
    { _id: 1, host: "mongodb2.example.net:27017" },
    { _id: 2, host: "mongodb3.example.net:27017" }
  ]
})

2.4 分片集群（Sharded Cluster）

分片集群是MongoDB提供水平扩展性的核心机制，将数据分布到多个分片（Shard）上。

2.4.1 分片集群的组件

一个完整的分片集群包含以下组件：

分片（Shard）：存储实际的数据，通常是一个副本集，提供数据的高可用性
配置服务器（Config Server）：存储集群的元数据和配置信息，通常是一个副本集
路由服务器（Mongos）：作为客户端和分片之间的中间层，负责路由请求、合并查询结果
分片键（Shard Key）：用于确定数据分布在哪个分片上的字段

2.4.2 分片策略

MongoDB支持以下分片策略：

范围分片（Range Based Sharding）：根据分片键的值范围将数据分布到不同的分片
哈希分片（Hash Based Sharding）：根据分片键的哈希值将数据分布到不同的分片
区域分片（Zoned Sharding）：根据分片键的值和预定义的区域规则将数据分布到特定的分片

分片集群配置示例：

javascript

// 启用分片
sh.enableSharding("myDatabase")

// 对集合进行分片
sh.shardCollection("myDatabase.myCollection", { "userId": 1 })

3. 数据模型

3.1 文档（Document）

文档是MongoDB中数据的基本单元，以BSON（Binary JSON）格式存储。BSON是一种二进制序列化格式，支持比JSON更多的数据类型。

文档示例：

javascript

{
  _id: ObjectId("5f8d0d55b547641c687805a3"),
  name: "张三",
  age: 30,
  email: "zhangsan@example.com",
  address: {
    city: "北京",
    district: "朝阳区",
    street: "建国路88号"
  },
  hobbies: ["阅读", "游泳", "旅行"],
  createdAt: ISODate("2020-10-19T08:23:49.123Z")
}

3.2 集合（Collection）

集合是MongoDB中存储文档的逻辑容器，相当于关系型数据库中的表。与关系型数据库的表不同，集合不需要预定义结构，不同结构的文档可以存储在同一个集合中。

创建集合示例：

javascript

// 显式创建集合
db.createCollection("users")

// 隐式创建集合（插入文档时自动创建）
db.users.insertOne({ name: "李四", age: 25 })

3.3 数据库（Database）

数据库是MongoDB中存储集合的物理容器，一个MongoDB服务器可以包含多个数据库。

常用系统数据库：

admin：存储管理用户和角色的信息
local：存储副本集相关的本地数据，不参与复制
config：存储分片集群的配置信息

创建数据库示例：

javascript

// 切换到指定数据库，如果不存在则创建
use myDatabase

// 插入文档，真正创建数据库
 db.myCollection.insertOne({ name: "测试" })

3.4 数据类型

MongoDB支持多种数据类型，包括：

String：字符串类型，UTF-8编码
Number：数值类型，包括32位整数（NumberInt）、64位整数（NumberLong）和双精度浮点数（NumberDouble）
Boolean：布尔类型，值为true或false
ObjectId：文档的唯一标识符，12字节的BSON类型
Date：日期类型，存储自Unix纪元以来的毫秒数
Array：数组类型，可以包含多个值
Object：内嵌文档类型
Null：空值类型
Binary Data：二进制数据类型
Regular Expression：正则表达式类型
JavaScript：JavaScript代码类型
Symbol：符号类型（不推荐使用）
Min/Max Keys：比较时分别对应最小值和最大值的特殊类型
Timestamp：时间戳类型，存储操作时间
Decimal128：高精度小数类型（MongoDB 3.4+）

3.5 数据模型设计最佳实践

嵌入式数据模型：对于一对一或一对多的关系，优先使用嵌入式数据模型，减少查询次数
引用数据模型：对于多对多的关系或数据量较大的一对多关系，使用引用数据模型
合适的文档大小：MongoDB文档大小限制为16MB，设计时应考虑这一点
避免深层次嵌套：嵌套层次过深会增加查询和更新的复杂度
合理使用索引：根据查询需求设计合适的索引
考虑分片策略：如果数据量较大，提前考虑分片策略和分片键设计

4. 基本操作

4.1 数据库操作

javascript

// 查看所有数据库
show dbs

// 切换数据库
use myDatabase

// 查看当前数据库
db

// 删除当前数据库
db.dropDatabase()

4.2 集合操作

javascript

// 查看当前数据库的所有集合
show collections

// 创建集合
db.createCollection("myCollection")

// 查看集合统计信息
db.myCollection.stats()

// 删除集合
db.myCollection.drop()

4.3 文档插入操作

javascript

// 插入单个文档
db.users.insertOne({
  name: "张三",
  age: 30,
  email: "zhangsan@example.com"
})

// 插入多个文档
db.users.insertMany([
  {
    name: "李四",
    age: 25,
    email: "lisi@example.com"
  },
  {
    name: "王五",
    age: 35,
    email: "wangwu@example.com"
  }
])

// 旧版本的插入方法（仍然可用）
db.users.insert({
  name: "赵六",
  age: 28,
  email: "zhaoliu@example.com"
})

4.4 文档查询操作

javascript

// 查询所有文档
db.users.find()

// 查询单个文档
db.users.findOne({ name: "张三" })

// 条件查询（等于）
db.users.find({ age: 30 })

// 条件查询（大于）
db.users.find({ age: { $gt: 25 } })

// 条件查询（小于等于）
db.users.find({ age: { $lte: 30 } })

// 条件查询（包含）
db.users.find({ hobbies: "阅读" })

// 条件查询（或）
db.users.find({ $or: [{ age: 25 }, { age: 30 }] })

// 条件查询（正则表达式）
db.users.find({ name: /^张/ })

// 投影查询（只返回指定字段）
db.users.find({ age: { $gt: 25 } }, { name: 1, age: 1, _id: 0 })

// 排序查询（升序）
db.users.find().sort({ age: 1 })

// 排序查询（降序）
db.users.find().sort({ age: -1 })

// 限制查询结果数量
db.users.find().limit(10)

// 跳过指定数量的文档
db.users.find().skip(20)

// 计数查询
db.users.countDocuments({ age: { $gt: 25 } })

4.5 文档更新操作

javascript

// 更新单个文档
db.users.updateOne(
  { name: "张三" },
  { $set: { age: 31, email: "zhangsan_new@example.com" } }
)

// 更新多个文档
db.users.updateMany(
  { age: { $lt: 30 } },
  { $inc: { age: 1 } }
)

// 替换文档（旧版本方法）
db.users.update(
  { name: "李四" },
  { name: "李四_new", age: 26, email: "lisi_new@example.com" }
)

// upsert操作（如果不存在则插入）
db.users.updateOne(
  { name: "孙七" },
  { $set: { age: 29, email: "sunqi@example.com" } },
  { upsert: true }
)

// 常用更新操作符
// $set: 设置字段值
// $unset: 删除字段
// $inc: 增加字段值
// $push: 向数组添加元素
// $pull: 从数组移除元素
// $addToSet: 向数组添加元素（如果不存在）
// $rename: 重命名字段
// $mul: 乘法操作
// $min: 最小值操作
// $max: 最大值操作

4.6 文档删除操作

javascript

// 删除单个文档
db.users.deleteOne({ name: "张三" })

// 删除多个文档
db.users.deleteMany({ age: { $gt: 35 } })

// 删除所有文档
db.users.deleteMany({})

// 旧版本的删除方法（仍然可用）
db.users.remove({ name: "李四" })
// 注意：remove()方法如果不指定条件，会删除所有文档

5. 索引

5.1 索引概述

索引是一种特殊的数据结构，用于提高查询性能。MongoDB使用B树索引结构，可以快速定位和访问数据。

索引的优点：

提高查询性能
加速排序操作
优化聚合查询

索引的缺点：

增加存储空间
降低写入性能（需要维护索引）

5.2 索引类型

MongoDB支持多种索引类型，适用于不同的查询场景：

5.2.1 单字段索引（Single Field Index）

最基本的索引类型，基于单个字段创建。

javascript

// 创建单字段索引
db.users.createIndex({ age: 1 })

5.2.2 复合索引（Compound Index）

基于多个字段创建的索引，字段的顺序对索引性能有影响。

javascript

// 创建复合索引
db.users.createIndex({ age: 1, name: -1 })

5.2.3 多键索引（Multikey Index）

自动为数组字段创建的索引，MongoDB会为数组中的每个元素创建索引项。

javascript

// 创建多键索引（自动）
db.users.createIndex({ hobbies: 1 })

5.2.4 地理空间索引（Geospatial Index）

用于地理空间查询的索引，支持2d索引和2dsphere索引。

javascript

// 创建2dsphere索引
db.places.createIndex({ location: "2dsphere" })

5.2.5 全文索引（Text Index）

用于文本搜索的索引，支持对字符串内容进行全文搜索。

javascript

// 创建全文索引
db.articles.createIndex({ content: "text" })

5.2.6 哈希索引（Hashed Index）

基于字段值的哈希值创建的索引，主要用于分片集群的哈希分片。

javascript

// 创建哈希索引
db.users.createIndex({ userId: "hashed" })

5.2.7 稀疏索引（Sparse Index）

只包含有索引字段的文档的索引，不包含索引字段不存在的文档。

javascript

// 创建稀疏索引
db.users.createIndex({ email: 1 }, { sparse: true })

5.2.8 唯一索引（Unique Index）

确保索引字段的值在集合中是唯一的。

javascript

// 创建唯一索引
db.users.createIndex({ email: 1 }, { unique: true })

5.3 索引管理

javascript

// 查看集合的所有索引
db.users.getIndexes()

// 查看索引的大小
db.users.totalIndexSize()

// 删除索引
db.users.dropIndex({ age: 1 })

// 删除所有索引（除了_id索引）
db.users.dropIndexes()

// 重建索引
db.users.reIndex()

5.4 索引设计最佳实践

根据查询需求创建索引：分析查询模式，为经常用于查询条件、排序、投影的字段创建索引
合理选择索引字段顺序：在复合索引中，将选择性高的字段放在前面
避免过多索引：索引会增加存储空间和写入开销，避免创建不必要的索引
考虑索引的大小：索引的大小会影响内存使用和查询性能
使用覆盖索引：如果查询只需要返回索引字段，可以使用覆盖索引提高性能
监控索引使用情况：使用explain()分析查询执行计划，检查索引是否被有效使用
定期维护索引：定期重建索引，优化索引性能

6. 聚合查询

6.1 聚合概述

MongoDB的聚合框架（Aggregation Framework）是一个强大的工具，用于对数据进行复杂的查询、分析和转换。聚合操作可以对多个文档进行分组、筛选、排序、计算等操作，返回汇总结果。

6.2 聚合管道（Aggregation Pipeline）

MongoDB的聚合操作主要通过聚合管道实现，聚合管道由多个阶段（Stage）组成，每个阶段对文档进行特定的处理，然后将结果传递给下一个阶段。

常用聚合阶段：

$match：筛选文档，类似于find()方法的查询条件
$project：投影文档，选择或重命名字段
$group：分组文档，进行聚合计算
$sort：排序文档
$limit：限制结果数量
$skip：跳過指定数量的文档
$unwind：展开数组字段
$lookup：执行左外连接，类似于SQL的JOIN操作
$out：将结果输出到指定集合
$merge：将结果合并到指定集合
$addFields：添加新字段到文档
$replaceRoot：替换文档的根节点
$facet：在同一组输入文档上执行多个聚合管道

6.3 聚合操作示例

6.3.1 基本聚合示例

javascript

// 计算每个年龄段的用户数量
db.users.aggregate([
  { $group: { _id: "$age", count: { $sum: 1 } } },
  { $sort: { count: -1 } }
])

// 计算用户的平均年龄
db.users.aggregate([
  { $group: { _id: null, averageAge: { $avg: "$age" } } }
])

// 按城市分组，计算每个城市的用户数量和平均年龄
db.users.aggregate([
  { $group: { 
      _id: "$address.city", 
      count: { $sum: 1 }, 
      averageAge: { $avg: "$age" } 
  } },
  { $sort: { count: -1 } }
])

6.3.2 复杂聚合示例

javascript

// 展开hobbies数组，统计每个爱好的用户数量
db.users.aggregate([
  { $unwind: "$hobbies" },
  { $group: { _id: "$hobbies", count: { $sum: 1 } } },
  { $sort: { count: -1 } }
])

// 查找每个城市年龄最大的用户
db.users.aggregate([
  { $sort: { age: -1 } },
  { $group: { 
      _id: "$address.city", 
      maxAge: { $first: "$age" },
      name: { $first: "$name" }
  } }
])

// 执行左外连接，关联用户和订单数据
db.users.aggregate([
  { $lookup: {
      from: "orders",
      localField: "_id",
      foreignField: "userId",
      as: "userOrders"
    }
  },
  { $project: {
      name: 1,
      email: 1,
      orderCount: { $size: "$userOrders" },
      totalAmount: { $sum: "$userOrders.amount" }
    }
  }
])

6.3.3 Map-Reduce

除了聚合管道，MongoDB还支持Map-Reduce操作，用于更复杂的数据处理。Map-Reduce使用JavaScript函数进行数据处理，灵活性更高，但性能较低。

javascript

// 使用Map-Reduce计算每个城市的用户数量
db.users.mapReduce(
  // Map函数
  function() {
    emit(this.address.city, 1);
  },
  // Reduce函数
  function(key, values) {
    return Array.sum(values);
  },
  // 输出选项
  {
    out: "cityUserCount"
  }
)

// 查询Map-Reduce的结果
db.cityUserCount.find()

6.4 聚合查询最佳实践

使用聚合管道代替Map-Reduce：聚合管道的性能通常比Map-Reduce高
优先使用$match和$project阶段：在管道的早期阶段使用$match和$project可以减少后续阶段处理的文档数量
使用索引优化聚合查询：为$match和$sort阶段的字段创建索引
避免在大型集合上使用$unwind：$unwind可能会产生大量的中间文档
考虑使用$out或$merge阶段：将聚合结果输出到集合，以便后续查询使用
监控聚合查询性能：使用explain()分析聚合管道的执行计划

7. 安全与认证

7.1 安全概述

MongoDB提供了多种安全特性，用于保护数据的安全性和完整性。

7.2 认证机制

MongoDB支持多种认证机制，包括：

SCRAM（Salted Challenge Response Authentication Mechanism）：MongoDB 3.0及以上版本的默认认证机制
x.509证书认证：使用SSL/TLS证书进行认证
LDAP认证：通过LDAP服务器进行认证（企业版功能）
Kerberos认证：通过Kerberos进行认证（企业版功能）

7.2.1 启用认证

javascript

// 1. 启动MongoDB时不启用认证
mongod --port 27017 --dbpath /data/db

// 2. 连接MongoDB，创建管理员用户
mongo --port 27017
use admin
db.createUser({
  user: "adminUser",
  pwd: "adminPassword",
  roles: [{ role: "root", db: "admin" }]
})

// 3. 重启MongoDB，启用认证
mongod --port 27017 --dbpath /data/db --auth

// 4. 使用管理员用户连接
mongo --port 27017 -u "adminUser" -p "adminPassword" --authenticationDatabase "admin"

7.2.2 创建用户

javascript

// 创建数据库用户
use myDatabase
db.createUser({
  user: "myUser",
  pwd: "myPassword",
  roles: [
    { role: "readWrite", db: "myDatabase" },
    { role: "read", db: "anotherDatabase" }
  ]
})

// 创建只读用户
use myDatabase
db.createUser({
  user: "readUser",
  pwd: "readPassword",
  roles: [{ role: "read", db: "myDatabase" }]
})

// 创建读写用户
use myDatabase
db.createUser({
  user: "readWriteUser",
  pwd: "readWritePassword",
  roles: [{ role: "readWrite", db: "myDatabase" }]
})

7.3 角色与权限

MongoDB提供了多种内置角色，用于控制用户的操作权限：

数据库用户角色：read、readWrite
数据库管理角色：dbAdmin、dbOwner、userAdmin
集群管理角色：clusterAdmin、clusterManager、clusterMonitor、hostManager
备份恢复角色：backup、restore
所有数据库角色：readAnyDatabase、readWriteAnyDatabase、userAdminAnyDatabase、dbAdminAnyDatabase
超级用户角色：root
内部角色：__system

javascript

// 查看用户的角色
db.getUser("myUser")

// 修改用户的角色
db.updateUser(
  "myUser",
  {
    roles: [
      { role: "readWrite", db: "myDatabase" },
      { role: "read", db: "anotherDatabase" }
    ]
  }
)

// 修改用户密码
db.changeUserPassword("myUser", "newPassword")

7.4 网络安全

启用SSL/TLS：加密客户端和服务器之间的通信
绑定IP地址：限制MongoDB监听的IP地址
配置防火墙：限制对MongoDB端口的访问
使用VPC或专用网络：将MongoDB部署在专用网络中

javascript

// 启用SSL/TLS
mongod --sslMode requireSSL --sslPEMKeyFile /path/to/server.pem --sslCAFile /path/to/ca.pem

7.5 安全最佳实践

始终启用认证：生产环境中必须启用认证机制
使用强密码：为用户设置强密码，定期更换
最小权限原则：为用户分配最小必要的权限
启用审计日志：记录所有操作，便于审计和问题排查
定期备份数据：确保数据可以恢复
保持MongoDB版本更新：及时应用安全补丁
限制物理访问：限制对MongoDB服务器的物理访问
使用加密存储：对敏感数据进行加密存储

8. 监控与运维

8.1 监控概述

MongoDB提供了多种监控工具和方法，用于监控数据库的运行状态、性能和健康状况。

8.2 内置监控工具

8.2.1 MongoDB Shell方法

javascript

// 查看服务器状态
db.serverStatus()

// 查看数据库统计信息
db.stats()

// 查看集合统计信息
db.myCollection.stats()

// 查看锁信息
db.currentOp()

// 查看慢查询日志
db.getProfilingStatus()
db.system.profile.find().sort({ ts: -1 })

8.2.2 MongoDB Compass

MongoDB Compass是官方提供的图形化管理工具，提供了直观的监控界面，可以监控数据库的性能指标、连接数、操作执行情况等。

8.2.3 MongoDB Cloud Manager/Atlas

MongoDB Cloud Manager（本地部署）和MongoDB Atlas（云服务）提供了全面的监控和管理功能，包括性能监控、告警、自动备份等。

8.3 第三方监控工具

Prometheus + Grafana：开源的监控和可视化解决方案，可以通过MongoDB的Exporter采集监控数据
Datadog：商业监控工具，提供MongoDB的集成监控
New Relic：商业监控工具，提供MongoDB的集成监控
Zabbix：开源监控工具，可以通过自定义脚本或模板监控MongoDB

8.4 性能优化

8.4.1 查询优化

使用索引：为查询条件、排序、投影的字段创建合适的索引
分析查询执行计划：使用explain()分析查询性能，找出瓶颈
优化查询条件：避免全表扫描，使用选择性高的查询条件
限制返回字段：只返回必要的字段，减少数据传输量
合理设置批量大小：对于批量操作，设置合适的批量大小

javascript

// 分析查询执行计划
db.users.find({ age: { $gt: 25 } }).explain("executionStats")

8.4.2 写入优化

使用批量写入：使用insertMany()、bulkWrite()等方法进行批量写入
调整写入关注级别：根据需求设置合适的写入关注级别（w选项）
优化文档结构：避免过大的文档，合理设计数据模型
使用WiredTiger存储引擎：WiredTiger支持文档级并发控制，写入性能更好

8.4.3 内存优化

合理设置缓存大小：根据服务器内存大小，设置合适的WiredTiger缓存大小
监控页面错误率：避免频繁的页面交换
使用索引覆盖查询：减少磁盘IO
限制结果集大小：避免返回过多的文档

8.4.4 存储优化

启用数据压缩：WiredTiger存储引擎支持数据压缩，可以减少存储空间
合理设置数据文件大小：调整数据文件的预分配大小
定期执行compact操作：回收空闲空间（注意：需要停机维护）
使用分片集群：对于大数据量，使用分片集群分散存储压力

8.5 备份与恢复

8.5.1 备份方法

mongodump工具：创建数据库的逻辑备份
文件系统备份：直接复制数据文件（需要停止MongoDB服务或使用LVM快照）
MongoDB Cloud Manager/Atlas：提供自动备份服务
第三方备份工具：如Percona XtraBackup等

javascript

// 使用mongodump备份数据库
mongodump --host localhost --port 27017 --username myUser --password myPassword --authenticationDatabase admin --db myDatabase --out /backup/mongodump-$(date +%Y-%m-%d)

8.5.2 恢复方法

mongorestore工具：恢复逻辑备份
文件系统恢复：直接恢复数据文件
MongoDB Cloud Manager/Atlas：提供备份恢复服务

javascript

// 使用mongorestore恢复数据库
mongorestore --host localhost --port 27017 --username myUser --password myPassword --authenticationDatabase admin --db myDatabase /backup/mongodump-2023-05-01/myDatabase

8.5.3 增量备份与点时间恢复

MongoDB企业版支持增量备份和点时间恢复功能，可以更灵活地进行数据恢复。

8.6 运维最佳实践

监控关键指标：定期监控数据库的性能指标、存储空间、连接数等
设置合理的告警：为关键指标设置告警阈值，及时发现问题
定期备份数据：制定备份策略，定期备份数据，并测试备份的可用性
规划容量：根据业务增长，提前规划存储容量和服务器资源
制定应急方案：制定数据库故障的应急处理方案
保持文档化：记录数据库的配置、架构、操作流程等信息
培训团队成员：确保团队成员熟悉MongoDB的管理和运维

9. 高可用与扩展性

9.1 副本集高可用

MongoDB通过副本集提供高可用性，副本集确保即使在部分节点故障的情况下，数据库仍然可用。

9.1.1 副本集配置最佳实践

至少包含3个数据节点：确保数据的冗余和可用性
避免单一故障点：将节点部署在不同的物理机器、机架或数据中心
合理配置写关注：根据业务需求设置合适的写关注级别（w选项）
配置仲裁者：在节点数量为偶数时，配置仲裁者避免选举僵局
监控副本集状态：定期检查副本集的健康状态

javascript

// 查看副本集状态
rs.status()

// 查看副本集配置
rs.conf()

// 强制重新选举主节点
rs.stepDown()

9.1.2 副本集故障处理

主节点故障：副本集会自动选举新的主节点，通常需要10-30秒
从节点故障：从节点恢复后会自动同步数据，不影响服务可用性
网络分区：可能导致脑裂，需要合理配置副本集的投票规则和仲裁者

9.2 分片集群扩展性

MongoDB通过分片集群提供水平扩展性，分片集群可以将数据分布到多个分片，支持海量数据存储和高并发访问。

9.2.1 分片策略设计

选择合适的分片键：分片键应具有良好的基数、均匀的数据分布和局部性
范围分片 vs 哈希分片：根据查询模式选择合适的分片策略
预分割数据：在导入大量数据前，预分割数据块，避免热点问题
配置区域分片：根据地理位置或其他规则，将数据分布到特定的分片

9.2.2 分片集群配置最佳实践

使用副本集作为分片：每个分片使用副本集，提供高可用性
配置多个路由服务器：增加路由服务器数量，提高并发处理能力
使用多个配置服务器：配置服务器使用副本集，提高可用性
监控分片状态：定期检查分片集群的健康状态和数据分布情况
合理配置块大小：根据业务需求调整块大小（默认64MB）

javascript

// 查看分片集群状态
sh.status()

// 查看分片键分布情况
sh.status({ verbose: 1 })

// 添加新分片
sh.addShard("replicaSetName/shardHost1:27017,shardHost2:27017,shardHost3:27017")

9.2.3 分片集群扩容

垂直扩容：增加单个服务器的资源（CPU、内存、存储）
水平扩容：添加新的分片，分散数据存储压力
在线扩容：MongoDB支持在线扩容，不影响服务可用性
数据重平衡：添加新分片后，MongoDB会自动进行数据重平衡

9.3 读写分离

MongoDB支持读写分离，可以将读操作分发到从节点，提高系统的并发处理能力。

9.3.1 读偏好设置

MongoDB支持多种读偏好设置，可以根据业务需求选择合适的读偏好：

primary：只从主节点读取数据（默认）
primaryPreferred：优先从主节点读取，如果主节点不可用则从从节点读取
secondary：只从从节点读取数据
secondaryPreferred：优先从从节点读取，如果从节点不可用则从主节点读取
nearest：从网络延迟最低的节点读取数据

javascript

// 在MongoDB Shell中设置读偏好
Mongo.setReadPref("secondaryPreferred")

// 在驱动程序中设置读偏好（以Node.js为例）
const MongoClient = require('mongodb').MongoClient;
const uri = "mongodb://localhost:27017,localhost:27018,localhost:27019/?replicaSet=myReplicaSet&readPreference=secondaryPreferred";
const client = new MongoClient(uri);

9.3.2 读写分离最佳实践

合理设置读偏好：根据业务的一致性要求选择合适的读偏好
监控从节点延迟：避免从延迟过大的从节点读取数据
考虑数据一致性：从节点可能存在数据延迟，不适合强一致性要求的场景
结合连接池使用：配置连接池，提高并发处理能力

10. MongoDB与应用集成

10.1 MongoDB驱动

MongoDB提供了多种编程语言的官方驱动，用于与应用程序集成。

10.1.1 常用驱动

MongoDB Node.js Driver：Node.js应用程序的官方驱动
MongoDB Python Driver (PyMongo)：Python应用程序的官方驱动
MongoDB Java Driver：Java应用程序的官方驱动
MongoDB PHP Driver：PHP应用程序的官方驱动
MongoDB Ruby Driver：Ruby应用程序的官方驱动
MongoDB .NET Driver：.NET应用程序的官方驱动
MongoDB C/C++ Driver：C/C++应用程序的官方驱动

10.1.2 驱动使用示例（Node.js）

javascript

const { MongoClient } = require('mongodb');

async function main() {
    // 连接字符串
    const uri = "mongodb://localhost:27017";
    
    // 创建MongoClient实例
    const client = new MongoClient(uri);
    
    try {
        // 连接到MongoDB服务器
        await client.connect();
        
        // 选择数据库和集合
        const database = client.db('myDatabase');
        const users = database.collection('users');
        
        // 插入文档
        const insertResult = await users.insertOne({
            name: "张三",
            age: 30,
            email: "zhangsan@example.com"
        });
        console.log('插入的文档ID:', insertResult.insertedId);
        
        // 查询文档
        const findResult = await users.find({ age: { $gt: 25 } }).toArray();
        console.log('查询结果:', findResult);
        
        // 更新文档
        const updateResult = await users.updateOne(
            { name: "张三" },
            { $set: { age: 31 } }
        );
        console.log('更新的文档数量:', updateResult.modifiedCount);
        
        // 删除文档
        const deleteResult = await users.deleteOne({ name: "张三" });
        console.log('删除的文档数量:', deleteResult.deletedCount);
        
    } finally {
        // 关闭连接
        await client.close();
    }
}

main().catch(console.error);

10.2 ODM/ORM框架

为了简化MongoDB的使用，许多编程语言提供了ODM（Object-Document Mapper）或ORM（Object-Relational Mapper）框架。

10.2.1 常用ODM/ORM框架

Mongoose：Node.js的MongoDB ODM框架
MongoEngine：Python的MongoDB ODM框架
Spring Data MongoDB：Java Spring框架的MongoDB集成
Doctrine MongoDB ODM：PHP的MongoDB ODM框架
MongoMapper：Ruby的MongoDB ODM框架
MongoDB.Entities：.NET的MongoDB ORM框架

10.2.2 Mongoose使用示例

javascript

const mongoose = require('mongoose');

// 连接MongoDB
mongoose.connect('mongodb://localhost:27017/myDatabase', {
    useNewUrlParser: true,
    useUnifiedTopology: true
});

// 定义Schema
const userSchema = new mongoose.Schema({
    name: String,
    age: Number,
    email: String,
    createdAt: { type: Date, default: Date.now }
});

// 定义Model
const User = mongoose.model('User', userSchema);

// 创建文档
async function createUser() {
    const user = new User({
        name: "张三",
        age: 30,
        email: "zhangsan@example.com"
    });
    
    try {
        const savedUser = await user.save();
        console.log('保存的用户:', savedUser);
    } catch (error) {
        console.error('保存用户失败:', error.message);
    }
}

// 查询文档
async function findUsers() {
    try {
        const users = await User.find({ age: { $gt: 25 } });
        console.log('查询的用户:', users);
    } catch (error) {
        console.error('查询用户失败:', error.message);
    }
}

// 调用函数
createUser();
findUsers();

10.3 与Web框架集成

MongoDB可以与各种Web框架轻松集成，如Node.js的Express、Python的Flask/Django、Java的Spring Boot等。

10.3.1 Express + MongoDB集成示例

javascript

const express = require('express');
const { MongoClient } = require('mongodb');
const app = express();
const port = 3000;

// 中间件
app.use(express.json());

// MongoDB连接信息
const uri = 'mongodb://localhost:27017';
const client = new MongoClient(uri);
let db;

// 连接MongoDB
async function connectDB() {
    try {
        await client.connect();
        db = client.db('myDatabase');
        console.log('Connected to MongoDB');
    } catch (error) {
        console.error('Failed to connect to MongoDB', error);
    }
}

// API路由
app.get('/api/users', async (req, res) => {
    try {
        const users = await db.collection('users').find().toArray();
        res.json(users);
    } catch (error) {
        res.status(500).json({ error: error.message });
    }
});

app.post('/api/users', async (req, res) => {
    try {
        const user = req.body;
        const result = await db.collection('users').insertOne(user);
        res.status(201).json({ id: result.insertedId, ...user });
    } catch (error) {
        res.status(500).json({ error: error.message });
    }
});

// 启动服务器
connectDB().then(() => {
    app.listen(port, () => {
        console.log(`Server running on port ${port}`);
    });
});

10.4 最佳实践

使用连接池：配置合理的连接池大小，提高性能和资源利用率
错误处理：实现完善的错误处理机制，确保应用程序的稳定性
连接重试：实现连接重试机制，处理临时的网络故障
监控连接状态：监控数据库连接状态，及时发现问题
使用事务：对于需要原子性操作的场景，使用MongoDB的事务功能
避免阻塞操作：使用异步操作，避免阻塞应用程序主线程
合理设置超时：为数据库操作设置合理的超时时间

11. 实践案例

11.1 电商系统商品管理案例

场景描述：某电商系统需要存储和管理大量的商品信息，商品信息包括基本信息、价格、库存、图片、分类等。

挑战：

商品数据量巨大，需要高效的存储和查询方案
商品信息结构复杂，包含多个维度的属性
需要支持多维度的商品检索和筛选
商品数据需要高可用和可扩展

解决方案：

使用MongoDB存储商品数据，利用其灵活的文档模型存储复杂的商品信息
设计合理的索引，支持多维度的商品检索
使用副本集确保商品数据的高可用性
采用分片集群应对海量商品数据的存储需求
实现商品数据的缓存机制，提高查询性能

数据模型设计：

javascript

{
  _id: ObjectId("5f8d0d55b547641c687805a3"),
  name: "iPhone 13 Pro",
  description: "全新的iPhone 13 Pro，配备A15仿生芯片...",
  price: 8999,
  originalPrice: 9999,
  stock: 1000,
  sales: 5000,
  category: ["手机", "苹果"],
  tags: ["新品", "热销", "旗舰"],
  images: [
    "https://example.com/iphone13pro/1.jpg",
    "https://example.com/iphone13pro/2.jpg",
    "https://example.com/iphone13pro/3.jpg"
  ],
  attributes: {
    color: ["远峰蓝色", "银色", "金色", "石墨色"],
    storage: ["128GB", "256GB", "512GB", "1TB"],
    screenSize: "6.1英寸",
    processor: "A15仿生芯片"
  },
  ratings: {
    average: 4.8,
    count: 1256
  },
  createdAt: ISODate("2021-09-24T00:00:00Z"),
  updatedAt: ISODate("2021-10-15T10:30:00Z")
}

索引设计：

javascript

// 商品名称索引，支持模糊搜索
db.products.createIndex({ name: "text" })

// 价格和库存索引，支持范围查询
db.products.createIndex({ price: 1, stock: 1 })

// 分类和标签索引，支持多维度筛选
db.products.createIndex({ category: 1, tags: 1 })

// 销量和评分索引，支持排序
db.products.createIndex({ sales: -1, "ratings.average": -1 })

查询示例：

javascript

// 搜索名称包含"iPhone"的商品
db.products.find({ $text: { $search: "iPhone" } })

// 筛选价格在5000-10000之间且有库存的商品
db.products.find({ price: { $gte: 5000, $lte: 10000 }, stock: { $gt: 0 } })

// 查询分类为"手机"且标签包含"热销"的商品，并按销量降序排序
db.products.find({ category: "手机", tags: "热销" }).sort({ sales: -1 })

效果：系统成功实现了商品的高效存储和查询，支持多维度的商品检索和筛选，查询性能良好，数据高可用得到保障。

11.2 社交媒体用户动态案例

场景描述：某社交媒体平台需要存储和管理用户发布的动态信息，包括文字、图片、视频、点赞、评论等。

挑战：

用户动态数据量巨大，每天产生大量的新动态
动态数据结构复杂，包含多种类型的内容和互动信息
需要支持按时间线、用户、话题等多种方式查询动态
动态数据需要高写入性能和实时查询能力

解决方案：

使用MongoDB存储用户动态数据，利用其灵活的文档模型存储复杂的动态信息
设计合理的索引，支持按时间线、用户、话题等多种方式查询
使用副本集确保动态数据的高可用性
采用分片集群应对海量动态数据的存储需求
实现动态数据的缓存机制，提高查询性能

数据模型设计：

javascript

{
  _id: ObjectId("615d1a5fb547641c687805b7"),
  userId: ObjectId("5f8d0d55b547641c687805a3"),
  content: "今天去了故宫博物院，太震撼了！#旅行 #北京",
  media: [
    { type: "image", url: "https://example.com/posts/1/1.jpg" },
    { type: "image", url: "https://example.com/posts/1/2.jpg" }
  ],
  tags: ["旅行", "北京"],
  location: {
    name: "故宫博物院",
    coordinates: { type: "Point", coordinates: [116.403414, 39.924091] }
  },
  stats: {
    likes: 128,
    comments: 36,
    shares: 12
  },
  likedBy: [
    ObjectId("5f8d0d55b547641c687805a4"),
    ObjectId("5f8d0d55b547641c687805a5")
    // ...
  ],
  createdAt: ISODate("2021-10-06T14:30:00Z"),
  updatedAt: ISODate("2021-10-06T14:30:00Z")
}

索引设计：

javascript

// 用户ID和创建时间索引，支持按时间线查询
db.posts.createIndex({ userId: 1, createdAt: -1 })

// 标签和创建时间索引，支持按话题查询
db.posts.createIndex({ tags: 1, createdAt: -1 })

// 地理位置索引，支持附近动态查询
db.posts.createIndex({ "location.coordinates": "2dsphere" })

// 点赞数和创建时间索引，支持热门动态查询
db.posts.createIndex({ "stats.likes": -1, createdAt: -1 })

查询示例：

javascript

// 查询某个用户发布的动态，按时间倒序排列
db.posts.find({ userId: ObjectId("5f8d0d55b547641c687805a3") }).sort({ createdAt: -1 }).limit(20)

// 查询包含特定话题的动态，按时间倒序排列
db.posts.find({ tags: "旅行" }).sort({ createdAt: -1 }).limit(20)

// 查询附近的动态
db.posts.find({
  "location.coordinates": {
    $near: {
      $geometry: { type: "Point", coordinates: [116.403414, 39.924091] },
      $maxDistance: 5000 // 5公里内
    }
  }
}).sort({ createdAt: -1 }).limit(20)

// 查询热门动态（点赞数大于100）
db.posts.find({ "stats.likes": { $gt: 100 } }).sort({ "stats.likes": -1, createdAt: -1 }).limit(20)

效果：系统成功实现了用户动态的高效存储和查询，支持按时间线、用户、话题、地理位置等多种方式查询动态，写入性能和查询性能良好，满足了业务需求。

11.3 IoT设备数据存储案例

场景描述：某IoT平台需要存储和管理大量设备产生的实时数据，包括传感器读数、设备状态、事件记录等。

挑战：

设备数据量巨大，每秒产生大量的数据点
数据结构多样，不同类型的设备产生不同格式的数据
需要支持按设备、时间范围、数据类型等多种方式查询数据
数据写入性能要求极高，同时需要支持实时分析

解决方案：

使用MongoDB存储IoT设备数据，利用其灵活的文档模型存储不同格式的设备数据
设计合理的索引，支持按设备、时间范围、数据类型等多种方式查询
使用副本集确保设备数据的高可用性
采用分片集群应对海量设备数据的存储需求
利用MongoDB的聚合框架进行实时数据分析

数据模型设计：

javascript

{
  _id: ObjectId("615d1a5fb547641c687805c8"),
  deviceId: "device-123456",
  deviceType: "temperature-sensor",
  timestamp: ISODate("2021-10-06T14:30:00Z"),
  data: {
    temperature: 25.6,
    humidity: 45.2,
    pressure: 1013.25,
    batteryLevel: 85
  },
  location: {
    name: "车间A",
    coordinates: { type: "Point", coordinates: [116.403414, 39.924091] }
  },
  status: "normal",
  firmwareVersion: "1.2.3"
}

索引设计：

javascript

// 设备ID和时间戳索引，支持按设备和时间范围查询
db.deviceData.createIndex({ deviceId: 1, timestamp: -1 })

// 设备类型和时间戳索引，支持按设备类型和时间范围查询
db.deviceData.createIndex({ deviceType: 1, timestamp: -1 })

// 状态和时间戳索引，支持按状态查询
db.deviceData.createIndex({ status: 1, timestamp: -1 })

// 地理位置索引，支持按地理位置查询
db.deviceData.createIndex({ "location.coordinates": "2dsphere" })

查询和分析示例：

javascript

// 查询某个设备在特定时间范围内的数据
db.deviceData.find({
  deviceId: "device-123456",
  timestamp: {
    $gte: ISODate("2021-10-06T00:00:00Z"),
    $lte: ISODate("2021-10-06T23:59:59Z")
  }
}).sort({ timestamp: 1 })

// 查询某个设备类型的所有设备最新数据
db.deviceData.aggregate([
  { $match: { deviceType: "temperature-sensor" } },
  { $sort: { deviceId: 1, timestamp: -1 } },
  { $group: { _id: "$deviceId", latestData: { $first: "$$ROOT" } } },
  { $replaceRoot: { newRoot: "$latestData" } }
])

// 计算某个设备的温度平均值
db.deviceData.aggregate([
  { $match: {
      deviceId: "device-123456",
      timestamp: {
        $gte: ISODate("2021-10-06T00:00:00Z"),
        $lte: ISODate("2021-10-06T23:59:59Z")
      }
    }
  },
  { $group: {
      _id: null,
      averageTemperature: { $avg: "$data.temperature" },
      minTemperature: { $min: "$data.temperature" },
      maxTemperature: { $max: "$data.temperature" }
    }
  }
])

效果：系统成功实现了IoT设备数据的高效存储和查询，支持按设备、时间范围、数据类型等多种方式查询数据，写入性能和查询性能良好，满足了实时数据分析的需求。

12. 发展趋势

12.1 云原生发展

随着云计算的普及，MongoDB正在加强云原生支持：

MongoDB Atlas：MongoDB官方的云数据库服务，提供全托管的MongoDB服务
多云支持：MongoDB Atlas支持AWS、Azure、Google Cloud等多个云平台
Serverless架构：MongoDB Atlas提供Serverless选项，根据需求自动扩展
集成云服务：与云平台的其他服务（如AWS Lambda、Azure Functions等）集成

12.2 性能与可扩展性提升

MongoDB持续提升性能和可扩展性：

存储引擎优化：WiredTiger存储引擎不断优化，提供更高的读写性能
分片功能增强：分片集群的功能不断增强，支持更复杂的分片策略
内存管理优化：优化内存使用，减少内存占用
查询优化器改进：改进查询优化器，提供更高效的查询执行计划

12.3 多模型支持

MongoDB正在向多模型数据库发展：

文档模型：继续增强文档模型的功能
时序数据支持：增强对时序数据的支持，适用于IoT、监控等场景
图数据支持：通过MongoDB GraphLookup等功能，支持图数据查询
搜索功能增强：集成Elasticsearch的功能，提供更强大的全文搜索能力

12.4 安全性增强

随着数据安全越来越受到重视，MongoDB不断加强安全特性：

增强的认证机制：支持更多的认证方式，如LDAP、Kerberos等
细粒度访问控制：提供更细粒度的权限控制
数据加密：支持数据加密存储和传输
审计日志增强：增强审计日志功能，提供更详细的操作记录
合规性认证：获得更多行业的合规性认证，如GDPR、HIPAA等

12.5 AI与ML集成

MongoDB正在加强与人工智能和机器学习的集成：

MongoDB Charts：提供数据可视化功能，便于数据分析
MongoDB Realm：提供移动和边缘计算的支持，便于收集和处理数据
集成ML框架：与TensorFlow、PyTorch等机器学习框架集成
实时分析功能：增强实时分析功能，支持实时决策

12.6 开源社区发展

MongoDB拥有活跃的开源社区，社区贡献不断增加：

开源工具生态：涌现出大量的开源工具和库，丰富MongoDB的生态系统
社区驱动开发：社区反馈影响MongoDB的功能开发方向
全球用户大会：MongoDB World等全球用户大会，促进技术交流和分享
教育培训资源：提供丰富的教育培训资源，降低学习门槛

MongoDB ​

1. 核心概念与概述 ​

1.1 MongoDB的基本概念 ​

1.2 MongoDB的特点 ​

1.3 MongoDB的应用场景 ​

2. MongoDB架构 ​

2.1 整体架构 ​

2.2 存储引擎 ​

2.2.1 WiredTiger存储引擎 ​

2.2.2 MMAPv1存储引擎 ​

2.2.3 In-Memory存储引擎 ​

2.3 副本集（Replica Set） ​

2.3.1 副本集的工作原理 ​

2.3.2 副本集的配置 ​

2.4 分片集群（Sharded Cluster） ​

2.4.1 分片集群的组件 ​

2.4.2 分片策略 ​

3. 数据模型 ​

3.1 文档（Document） ​

3.2 集合（Collection） ​

3.3 数据库（Database） ​

3.4 数据类型 ​

3.5 数据模型设计最佳实践 ​

4. 基本操作 ​

4.1 数据库操作 ​

4.2 集合操作 ​

4.3 文档插入操作 ​

4.4 文档查询操作 ​

4.5 文档更新操作 ​

4.6 文档删除操作 ​

5. 索引 ​

5.1 索引概述 ​

5.2 索引类型 ​

5.2.1 单字段索引（Single Field Index） ​

5.2.2 复合索引（Compound Index） ​

5.2.3 多键索引（Multikey Index） ​

5.2.4 地理空间索引（Geospatial Index） ​

5.2.5 全文索引（Text Index） ​

5.2.6 哈希索引（Hashed Index） ​

5.2.7 稀疏索引（Sparse Index） ​

5.2.8 唯一索引（Unique Index） ​

5.3 索引管理 ​

5.4 索引设计最佳实践 ​

6. 聚合查询 ​

6.1 聚合概述 ​

6.2 聚合管道（Aggregation Pipeline） ​

6.3 聚合操作示例 ​

6.3.1 基本聚合示例 ​

6.3.2 复杂聚合示例 ​

6.3.3 Map-Reduce ​

6.4 聚合查询最佳实践 ​

7. 安全与认证 ​

7.1 安全概述 ​

7.2 认证机制 ​

7.2.1 启用认证 ​

7.2.2 创建用户 ​

7.3 角色与权限 ​

7.4 网络安全 ​

7.5 安全最佳实践 ​

8. 监控与运维 ​

8.1 监控概述 ​

8.2 内置监控工具 ​

8.2.1 MongoDB Shell方法 ​

8.2.2 MongoDB Compass ​

8.2.3 MongoDB Cloud Manager/Atlas ​

8.3 第三方监控工具 ​

8.4 性能优化 ​

8.4.1 查询优化 ​

8.4.2 写入优化 ​

8.4.3 内存优化 ​

8.4.4 存储优化 ​

8.5 备份与恢复 ​

8.5.1 备份方法 ​

8.5.2 恢复方法 ​

8.5.3 增量备份与点时间恢复 ​

8.6 运维最佳实践 ​

9. 高可用与扩展性 ​

9.1 副本集高可用 ​

9.1.1 副本集配置最佳实践 ​

9.1.2 副本集故障处理 ​

MongoDB

1. 核心概念与概述

1.1 MongoDB的基本概念

1.2 MongoDB的特点

1.3 MongoDB的应用场景

2. MongoDB架构

2.1 整体架构

2.2 存储引擎

2.2.1 WiredTiger存储引擎

2.2.2 MMAPv1存储引擎

2.2.3 In-Memory存储引擎

2.3 副本集（Replica Set）

2.3.1 副本集的工作原理

2.3.2 副本集的配置

2.4 分片集群（Sharded Cluster）

2.4.1 分片集群的组件

2.4.2 分片策略

3. 数据模型

3.1 文档（Document）

3.2 集合（Collection）

3.3 数据库（Database）

3.4 数据类型

3.5 数据模型设计最佳实践

4. 基本操作

4.1 数据库操作

4.2 集合操作

4.3 文档插入操作

4.4 文档查询操作

4.5 文档更新操作

4.6 文档删除操作

5. 索引

5.1 索引概述

5.2 索引类型

5.2.1 单字段索引（Single Field Index）

5.2.2 复合索引（Compound Index）

5.2.3 多键索引（Multikey Index）

5.2.4 地理空间索引（Geospatial Index）

5.2.5 全文索引（Text Index）

5.2.6 哈希索引（Hashed Index）

5.2.7 稀疏索引（Sparse Index）

5.2.8 唯一索引（Unique Index）

5.3 索引管理

5.4 索引设计最佳实践

6. 聚合查询

6.1 聚合概述

6.2 聚合管道（Aggregation Pipeline）

6.3 聚合操作示例

6.3.1 基本聚合示例

6.3.2 复杂聚合示例

6.3.3 Map-Reduce

6.4 聚合查询最佳实践

7. 安全与认证

7.1 安全概述

7.2 认证机制

7.2.1 启用认证

7.2.2 创建用户

7.3 角色与权限

7.4 网络安全

7.5 安全最佳实践

8. 监控与运维

8.1 监控概述

8.2 内置监控工具

8.2.1 MongoDB Shell方法

8.2.2 MongoDB Compass

8.2.3 MongoDB Cloud Manager/Atlas

8.3 第三方监控工具

8.4 性能优化

8.4.1 查询优化

8.4.2 写入优化

8.4.3 内存优化

8.4.4 存储优化

8.5 备份与恢复

8.5.1 备份方法

8.5.2 恢复方法

8.5.3 增量备份与点时间恢复

8.6 运维最佳实践

9. 高可用与扩展性

9.1 副本集高可用

9.1.1 副本集配置最佳实践

9.1.2 副本集故障处理