一、2025真题

1.在分布式数据库架构中，（）最适合处理高并发且可以动态扩展。

A. 分布中间件 是代理，负责路由和协调，所有请求都要经过

B. 主从架构 主节点处理所有写入，多个从节点复制数据并处理只读查询

C. 多主架构 多个节点都可接受写入，彼此之间同步数据，性能不佳且难以保证ACID 特性

D. 分片架构

分片架构指的是将数据横向切片分散存储在多个节点上，能将高并发的读写请求均匀分摊到不同分片，通过增加新分片节点（水平扩展）来实现近似线性的动态扩展

2.在分布式系统中，（）通常用于保证多个节点之间数据的可靠性和容错性。

A. 数据复制

B. 数据索引提高查询速度

C. 数据加密提高安全性

D. 数据压缩节省空间

3.使用树形结构组织数据的数据库模型为（）。

A网状模型

B.关系模型

C.层次模型

D.文档模型

层次模型树形结构
网状模型图结构
关系模型二维表 MySQL, Oracle, PostgreSQL
文档模型 JSON/BSON 文档

4.在图数据库中，用什么来表示“数据与数据之间的联系”。

A、表和行：这是关系型数据库（如 MySQL）的概念，不符合图数据库。

B、链接和值：这不是图数据库的标准术语。

C、文本和字段：这更接近文档数据库（如 MongoDB）或一般数据结构的描述。

D、节点和边：这正是图数据库的核心模型。其中，节点用于表示实体（即题目中的“数”），边用于表示实体之间的联系。

三、按知识点分类的往年题：

数据库应用系统体系结构

1.在C/S 体系结构中，客户端执行的操作是（）。

A触发器

B嵌入式SQL

C存储过程

D扩展存储过程

触发器、存储过程、扩展存储过程都是在后台数据库中执行的操作，属于数据库对象。
运行在客户端的程序通常由高级语言编写，可以使用接口技术或嵌入式SQL等方式访问数据库。

7.C/S（客户机/服务器）与B/S（浏览器/服务器）体系结构的区别是：（）。

A B/S建立在局域网上，C/S建立在广域网上

在考试情景下，B/S才是建立在广域网，C/S在局域网

B B/S客户相对固定集中，C/S客户分散

恰恰相反

C B/S软件重用性弱于C/S

重用性就是字面意思代码可复用性，客户端针对特定操作系统和平台开发，重用性弱

D B/S较C/S易于维护

程序逻辑都在服务器端，更新时只需升级服务器端，不用维护客户端

16-18.在数据库应用系统的体系结构中，常用的是C/S（客户机/服务器）结构和B/S（浏览器/服务器）结构。无论哪种结构，服务器都由（ 16 ）负责数据库的运行和维护。在C/S结构中，应用程序安装运行在（ 客户机 ）端，负责用户与数据库的交互；在B/S结构中，应用程序安装运行在（ Web服务器 ）端，负责构建用户界面与数据库的交互，客户端使用浏览器展示用户界面并获取用户输入。

请作答：第 16 题

A DBMS

B DBA

C DataBase

D DBS

请作答：第 17 、18题

A 客户机

B DB服务器

C Web服务器

D 数据库

分布式数据库

2.在分布式数据库系统中，应用程序直接使用本结点数据的性质称为（）。

A共享性数据在多个节点之间可以被共同访问和使用，强调的是全局数据的统一访问

B自治性

指每个节点对自己的数据具有独立的控制权和处理能力，本地应用程序可以不依赖其他节点直接访问本地数据。

C可用性系统在面对故障时仍能提供服务的能力

D分布性数据物理上分散存储在不同节点上

8.银行系统采用分布式数据库系统，对本地储户的存储业务能够在本地正常进行，而不依赖于其他场地数据库，称为分布式数据库的（自治性）。

4.关于分布式数据库，下列描述正确的是（）。

A客户机是分布在不同场地的

分布式指的是数据和服务器的分布，不是客户机的分布。客户机可以是集中，也可以是分散的。

B多个数据库服务器间的数据交互通过客户端程序来实现

多个数据库服务器间的数据交互由分布式DBMS自身协调

C数据的物理存储分布在不同的服务器上，而用户只关心访问的逻辑结构

D每个服务器上必须运行相同的DBMS

各场地可以使用不同的DBMS

5.分布式数据库允许部分数据存在多个复本，而用户不必知道这些复本的存在，称为（）。

A分片透明用户不必知道数据被水平或垂直切分后存在哪些节点上

B复制透明

C位置透明用户不必知道数据具体存储在哪个节点上

D全局共享

补充：局部映射透明，用户不必知道底层数据的具体存储结构

14.分布式数据库系统除了包含集中式数据库系统的模式结构之外，还增加了几个模式级别，其中（）定义分布式数据库中数据的整体逻辑结构，使得数据如同没有分布一样。

A全局外模式用户视图，某个用户或应用看到的局部逻辑结构

B全局概念模式

C分片数据如何被水平或垂直切分成片段

D分布片段分配在哪个站点上，以及副本策略

21.全局概念层是分布式数据库的整体抽象，包含了系统中全都数据的特性和逻辑结构，从其分布透明特性来说，包含的三种模式描述信息中不包括（）模式。

A全局概念

B分片

C分配

D访问

分布式数据库系统的模式结构一般包括以下几个级别（自上而下）：

全局外模式用户看到的局部逻辑视图

全局概念模式 ✅ 整体数据的逻辑结构，屏蔽分布细节

分片模式 ✅ 定义数据如何被水平或垂直切分成片段

分配模式 ✅ 定义各片段存储的具体站点，包含副本策略

局部概念模式各站点本地的逻辑视图

25.（）不是分布式数据库管理系统应该遵循的准则。

A本地自治

B依赖中心结点：一旦依赖中心点，单点故障全瘫痪

C分片透明

D位置透明

30.下列描述中，（）不是分布式数据库数据透明性的表现形式。

A代码透明性

B分片透明性用户无需知道数据是如何被水平或垂直切分的

C位置透明性用户无需知道数据实际存储在哪个物理节点上

D模型透明性用户无需知道底层各局部数据库使用的具体数据模型

33.下列选项中，（）不属于分布式数据库的优点。

A可拓展性好

B具有数据分布透明性

C体系结构灵活

D存取结构简单

34.分布式数据库的设计主要考虑数据分布的设计，数据分布主要目的是提高访问的（），即通过数据的合理分布，尽可能地使更多的数据能够就地存放，以减少远距离的数据访问。

A局部性：“就地存放，减少远距离的数据访问”是局部性原则的定义

B全局性分布式系统追求全局统一视图

C重构性数据库重构（修改逻辑结构）

D完整性数据的正确性和相容性，与数据的物理位置无关

题库2.2.相比于集中式数据库，分布式数据库具有（）的优点。

A成本低

B结构简单

C拓展性强

D数据冗余低

数据冗余指的是相同的数据在多个地方重复存储，分布式把数据复制到多个节点，于是冗余变高

两阶段提交协议（2PC）

3.根据分布式数据库系统中的两阶段提交协议（2PC），有如下操作指令：

① 协调器向参与者发prepare消息；

② 参与者向协调器发回ready消息；

③ 参与者向协调器发回abort消息；

④ 协调器向参与者发commit消息；

⑤ 协调器向参与者发rollback消息；

满足2PC 的序列是（）。

两阶段提交协议（2PC）的目的是保证分布式事务的原子性，即所有参与者要么全部提交（commit），要么全部回滚（rollback）。

第一阶段：准备阶段

协调器向所有参与者发送 prepare 消息（操作①），询问是否可以提交事务。
每个参与者执行事务操作，但不真正提交，然后根据自身情况向协调器回复：
- 如果执行成功，回复 ready 消息（操作②），表示“准备好提交”。
- 如果执行失败，回复 abort 消息（操作③），表示“无法提交”。

第二阶段：提交阶段

如果所有参与者都回复了 ready：协调器决定全局提交，向所有参与者发送 commit 消息（操作④）。
如果任意一个参与者回复了 abort（或超时无响应）：协调器决定全局回滚，向所有参与者发送 rollback 消息（操作⑤）。

A. ①②⑤：这个序列是 prepare → ready → rollback。在所有参与者都回复 ready 的情况下，协调器正确的决定应该是 commit 而不是 rollback，因此该序列不符合2PC的正确逻辑。

B. ①②④：这个序列是 prepare → ready → commit。这正是2PC协议成功提交的标准流程。所有参与者都准备好后，协调器通知它们统一提交事务。

C. ②③⑤：这个序列以 ready 开头，缺失了第一阶段的 prepare 指令，因此不完整且不符合协议规定的消息顺序。

D. ②③④：这个序列混合了 ready 和 abort 这两个互斥的回复，逻辑上不可能发生。一个参与者不可能同时对同一个事务既回复 ready 又回复 abort。

11.12.在分布式数据库中，关系的存储采用分片和复制技术，存储在不同的站点上。用户无需知道所有的数据存储在哪个站点上，称为（ 位置透明性 ）。分布式事务的执行可能会涉及到多个站点上的数据操作，在2PC协议中，当事务Ti完成执行时，事务Ti的发起者协调器Ci向所有参与Ti的执行站点发送<prepare Ti>的消息，当收到所有执行站点返回的<ready Ti>消息后，再向所有执行站点发送<commit Ti>消息。若参与事务执行的某个站点故障恢复后日志中有<ready Ti>记录，而没有<commit Ti>记录，则（ 12 ）。

请作答：第 12 题

A事务Ti已完成提交，该站点无需做任何操作

B事务Ti已完成提交，该站点应做REDO操作

C事务Ti未完成提交，该站点应做UNDO操作

D应向协调器询问以决定Ti的最终结果

该站点不能自行决定提交还是回滚，因为它不知道其他站点是否都 ready、协调器最终做了什么决定。

必须向协调器（或其他参与者）询问事务 Ti 的最终状态，然后根据结果执行 REDO（提交）或 UNDO（回滚）。

数据库访问接口

6.不属于数据库访问接口的是（）。

A ODBC Open Database Connectivity

B JDBC Java Database Connectivity

C ADO ActiveX Data Objects

D HTML

面向对象数据库

9.以下关于面向对象数据模型的叙述中，错误的是（）

A一个对象对应着E-R模型中的一个实体

B对象类是一系列相似对象的集合

C对象中的属性和方法对外界是不可见的

对象会暴露公有属性和方法为外界提供接口，只隐藏内部实现细节。

D对象之间的相互作用通过消息来实现

10.以下关于面向对象数据库系统的叙述中，错误的是（）。

A具有表达和管理对象的能力

B具有表达复杂对象结构的能力

C不具有表达对象嵌套的能力

D具有表达和管理数据库变化的能力

13.在面向对象数据库系统的数据类型中，对象属于（）类型。

A基本

B复杂

C引用

D其他

在面向对象数据库系统中，数据类型通常分为两类：

基本类型 原子类型，不可再分整数、浮点数、字符、布尔值、字符串
复杂类型 由其他类型组合构造而成对象、集合、列表、数组、元组、结构体

15.以下关于面向对象数据库的叙述中，不正确的是（）。

A类之间可以具有层次结构✅ 类的继承关系形成类层次

B类内部可以具有嵌套层次结构✅ 类的属性可以是另一个类

C类的属性不能是类

D类包含属性和方法✅ 这是类的基本定义

19.以下关于面向对象数据库的叙述中，不正确的是（）。

A类是一组具有相同或相似性质的对象的抽象。一个对象是某一类的一个实例

B类的属性可以是基本类，如整数、字符串等，也可以是包含属性和方法的一般类

C类的某个属性的定义可以是该类自身

✅ 类的属性定义可以是该类自身，这称为自引用或递归嵌套

D一个对象通常对应实际领域的一个实体，有唯一的标识，即对象标识OID，用户可以修改OID

对象标识（OID）是系统自动生成、唯一且不可修改的

26.E-R图中的实体集A、B之前为1：＊联系，转换为关系模型时，在B实体集中增加A实体集的标识符作外码；而在面向对象数据模型中，（）。

A 在B对象中增加一个引用属性外，对A对象不作任何处理

B 在B对象中增加一个引用属性外，在A对象中增加一组引用属性

B 对象是1：n中的“多方”，它只需要一个引用就能找到属于它的1方

C 在A对象中增加一组引用属性外，对B对象不作任何处理

D 在A对象中增加一组引用属性外，在B对象中增加一组引用属性

在 E-R 模型中实体集 A 与实体集 B 是 1:N（即 1:*）联系：

典型的例子就是：每个科室有若干名职工，一名职工只属于一个科室

关系模型做法：在“多方”的 B 实体集中增加一个外码，即把 A 实体集的标识符放进 B 表里，这样很容易从 B （如职工）找到对应的 A（科室）。
因为数据库的 JOIN 是对称的，所以关系模型不需要为“科室查职工”这个方向单独存一份数据。只存一份外键，通过关联查询就能解决所有问题，也避免了数据冗余。
面向对象模型做法：对象之间用引用属性来表达联系，而且通常联系是双向的，所以：
- B 对象：增加一个单值的引用属性，指向它所属的那个 A 对象（对应 1:N 的“多方找一方”）。
- A 对象：增加一组/一个集合类型的引用属性，指向属于它的所有 B 对象（对应 1:N 的“一方找多方”）。

NoSQL数据库

NoSQL”这个术语的本意就是指“Not Only SQL”或“非关系型”，专门用来描述那些不使用传统关系模型的数据库。

20.MongoDB是一种NoSQL数据库，具体地说，是（）存储数据库。

A 键值 Dynamo ，Memcached ，Redis等

B 文档 BaseX ，CouchDB ，MongoDB等

C 图形 FlockDB 、Neo4j 等

D XML

22.以下NoSQL数据库中，（）是一种高性能的分布式内存对象缓存数据库，通过缓存数据库查询结果，减少数据库访问次数，以提高动态Web应用的速度，提高可扩展性。

A Mongodb 文档型数据库，通用数据持久存储

B Memcached

C Neo4j 图形数据库，处理复杂关系网络数据

D Hbase 列族数据库，适合大规模稀疏数据的实时读写

CAP理论

23.CAP 理论是 NoSql理论的基础，下列性质不属于 CAP 的是（）。

A 分区容错性

B 原子性

C 可用性

D 一致性

C - 一致性 Consistency 所有节点在同一时刻看到相同的数据

A - 可用性 Availability 每个请求都能得到非错误的响应（但不保证是最新数据）

P - 分区容错性 Partition Tolerance 系统在部分节点间网络故障时仍能继续正常运行

CAP 理论的核心是：分布式系统中，这三者最多只能同时满足两个

31.分布式数据库的 CAP理论指的是：对于一个分布式数据库系统，一致性、可用性和分区容错性这三个特点，最多只能满足（ 2 ）个。

35.分布式数据库CAP理论中的A指的是（ 可用性 Availability ）。

27.Redis是一种NoSQL数据库，具体地说，是（ 键-值 ）存储数据库。

28.（）不是目前NoSQL数据库产品的数据模型。

A图模型

B文档模型

C键值存储模型

D层次模型

29.以下关于NoSQL数据库的说法中，正确的是（）。

A NoSQL数据库保证BASE特性

NoSQL 数据库遵循 BASE 原则：

Basically Available（基本可用）
Soft state（软状态）
Eventually consistent（最终一致性）

B NoSQL数据库保证ACID特性

C 各种NoSQL数据库具有统一的架构

D NoSQL数据库经常使用JOIN操作

32.NoSQL数据库的四大分类是指（）。

值存储数据库，列存储数据库，文档型数据库，图数据库

34.以下（）不属于NoSQL。

A Cassandra 列

B MongoDB 文档

C PostgreSQL

D Neo4j 图

题库2.1.NoSql数据库的存储模型有（）。

A列存储，图存储，文件存储

文档存储也可以视为文件存储的一种延伸

Bkey-value存储，图存储，关系表存储关系表存储属于SQL

C对象存储，XML存储，层次存储层次存储和XML存储不属于

D对象存储，图存储，关系表存储关系表存储属于SQL

并行数据库

24.以下是并行数据库的四种体系结构，在（）体系结构中所有处理器共享一个公共的主存储器和磁盘。

A共享内存：指的是内存和磁盘都共享

B共享磁盘

C无共享：每个节点都有自己的处理器、内存和磁盘。

D层次：混合了共享内存、共享磁盘和无共享结构，形成多层次架构，比如在顶层是无共享结构，底层各节点内部是共享内存结构。

云计算与大数据处理

1.以下关于大数据的叙述中，错误的是（）。

A大数据的数据量巨大

B结构化数据不属于大数据

C大数据具有快变性

D大数据具有价值

大数据的“4V”特征：

Volume（大量）：数据量巨大（A 正确）
Velocity（高速）：数据产生和处理速度快，包含实时性和快变性（C 正确）
Variety（多样）：数据类型多样，包括结构化数据、半结构化数据和非结构化数据
Value（价值）：大数据蕴含着巨大的商业和社会价值（D 正确）

题库2.3.大数据的特性一般包括（）。

①数量大②速度增长快③多样性④价值密度低

题库2.2.以下关于MapReduce技术的说法中，不正确的是（）。

A MapReduce的计算过程分解为两个主要阶段：Map阶段和Reduce阶段

Map 负责映射转换，Reduce 负责归约汇总

B 用户无需编写Map函数和Reduce函数

MapReduce 框架自动调度，但 Map 和 Reduce 函数必须自己写

C MapReduce中存在数据chunk的冗余复制

Hadoop 分布式文件系统默认将数据块复制 3 份，保证高可用。因此，MapReduce 处理的数据天然存在冗余复制。

D 在同等硬件条件下，MapReduce的性能一般低于并行数据库

MapReduce 更通用、灵活，但原始性能通常不如并行数据库

MapReduce是分布式计算模型，把海量数据的处理任务，拆成一大堆能在普通机器上并行执行的小任务。

菜单

分享

数据库系统工程师⑰：数据库发展与应用技术/NoSQL

一、2025真题

三、按知识点分类的往年题：

数据库应用系统体系结构

分布式数据库

两阶段提交协议（2PC）

数据库访问接口

面向对象数据库

NoSQL数据库

CAP理论

并行数据库

云计算与大数据处理

评论

LNMP基础：MySQL/MariaDB篇

1Panel升级应用失败/容器镜像加速

SSMS和SQL Server基础

LNMP基础：Nginx篇

Redis基础

数据库系统工程师⑪：数据库技术基础

数据库系统工程师⑱：案例题1-ER图分析

数据库系统工程师①：基础知识刷题篇

RHCSA/HCIA⑤：权限管理

数据库系统工程师⑫：关系数据库