FChao
发布于 2026-05-10 / 16 阅读
0
0

数据库系统工程师⑰:数据库发展与应用技术/NoSQL

一、2025真题

1.在分布式数据库架构中,( )最适合处理高并发且可以动态扩展。

A. 分布中间件 是代理,负责路由和协调,所有请求都要经过

B. 主从架构 主节点处理所有写入,多个从节点复制数据并处理只读查询

C. 多主架构 多个节点都可接受写入,彼此之间同步数据,性能不佳且难以保证ACID 特性

D. 分片架构

分片架构指的是将数据横向切片分散存储在多个节点上,能将高并发的读写请求均匀分摊到不同分片,通过增加新分片节点(水平扩展)来实现近似线性的动态扩展

2.在分布式系统中,( )通常用于保证多个节点之间数据的可靠性和容错性。

A. 数据复制

B. 数据索引 提高查询速度

C. 数据加密 提高安全性

D. 数据压缩 节省空间

3.使用树形结构组织数据的数据库模型为()。

A网状模型

B.关系模型

C.层次模型

D.文档模型

层次模型 树形结构

网状模型 图结构

关系模型 二维表 MySQL, Oracle, PostgreSQL

文档模型 JSON/BSON 文档

4.在图数据库中,用什么来表示“数据与数据之间的联系”。

A、表和行:这是关系型数据库(如 MySQL)的概念,不符合图数据库。

B、链接和值:这不是图数据库的标准术语。

C、文本和字段:这更接近文档数据库(如 MongoDB)或一般数据结构的描述。

D、节点和边:这正是图数据库的核心模型。其中,节点用于表示实体(即题目中的“数”),边用于表示实体之间的联系。

三、按知识点分类的往年题:

数据库应用系统体系结构

1.在C/S 体系结构中,客户端执行的操作是()。

A触发器

B嵌入式SQL

C存储过程

D扩展存储过程

  • 触发器、存储过程、扩展存储过程都是在后台数据库中执行的操作,属于数据库对象。

  • 运行在客户端的程序通常由高级语言编写,可以使用接口技术或嵌入式SQL等方式访问数据库。

7.C/S(客户机/服务器)与B/S(浏览器/服务器)体系结构的区别是:( ) 。

A B/S建立在局域网上,C/S建立在广域网上

在考试情景下,B/S才是建立在广域网,C/S在局域网

B B/S客户相对固定集中,C/S客户分散

恰恰相反

C B/S软件重用性弱于C/S

重用性就是字面意思代码可复用性,客户端针对特定操作系统和平台开发,重用性弱

D B/S较C/S易于维护

程序逻辑都在服务器端,更新时只需升级服务器端,不用维护客户端

16-18.在数据库应用系统的体系结构中,常用的是C/S(客户机/服务器)结构和B/S(浏览器/服务器)结构。无论哪种结构,服务器都由( 16 )负责数据库的运行和维护。在C/S结构中,应用程序安装运行在( 客户机 )端,负责用户与数据库的交互;在B/S结构中,应用程序安装运行在( Web服务器 )端,负责构建用户界面与数据库的交互,客户端使用浏览器展示用户界面并获取用户输入。

请作答:第 16 题

A DBMS

B DBA

C DataBase

D DBS

请作答:第 17 、18题

A 客户机

B DB服务器

C Web服务器

D 数据库

分布式数据库

2.在分布式数据库系统中,应用程序直接使用本结点数据的性质称为()。

A共享性 数据在多个节点之间可以被共同访问和使用,强调的是全局数据的统一访问

B自治性

指每个节点对自己的数据具有独立的控制权和处理能力,本地应用程序可以不依赖其他节点直接访问本地数据。

C可用性 系统在面对故障时仍能提供服务的能力

D分布性 数据物理上分散存储在不同节点上

8.银行系统采用分布式数据库系统,对本地储户的存储业务能够在本地正常进行,而不依赖于其他场地数据库,称为分布式数据库的(自治性)。

4.关于分布式数据库,下列描述正确的是( )。

A客户机是分布在不同场地的

分布式指的是数据和服务器的分布,不是客户机的分布。客户机可以是集中,也可以是分散的。

B多个数据库服务器间的数据交互通过客户端程序来实现

多个数据库服务器间的数据交互由分布式DBMS自身协调

C数据的物理存储分布在不同的服务器上,而用户只关心访问的逻辑结构

D每个服务器上必须运行相同的DBMS

各场地可以使用不同的DBMS

5.分布式数据库允许部分数据存在多个复本,而用户不必知道这些复本的存在,称为( )。

A分片透明 用户不必知道数据被水平或垂直切分后存在哪些节点上

B复制透明

C位置透明 用户不必知道数据具体存储在哪个节点上

D全局共享

补充:局部映射透明,用户不必知道底层数据的具体存储结构

14.分布式数据库系统除了包含集中式数据库系统的模式结构之外,还增加了几个模式级别,其中( )定义分布式数据库中数据的整体逻辑结构,使得数据如同没有分布一样。

A全局外模式 用户视图,某个用户或应用看到的局部逻辑结构

B全局概念模式

C分片 数据如何被水平或垂直切分成片段

D分布 片段分配在哪个站点上,以及副本策略

21.全局概念层是分布式数据库的整体抽象,包含了系统中全都数据的特性和逻辑结构,从其分布透明特性来说,包含的三种模式描述信息中不包括( )模式。

A全局概念

B分片

C分配

D访问

分布式数据库系统的模式结构一般包括以下几个级别(自上而下):

全局外模式 用户看到的局部逻辑视图

全局概念模式 ✅ 整体数据的逻辑结构,屏蔽分布细节

分片模式 ✅ 定义数据如何被水平或垂直切分成片段

分配模式 ✅ 定义各片段存储的具体站点,包含副本策略

局部概念模式 各站点本地的逻辑视图

25.( )不是分布式数据库管理系统应该遵循的准则。

A本地自治

B依赖中心结点:一旦依赖中心点,单点故障全瘫痪

C分片透明

D位置透明

30.下列描述中,( )不是分布式数据库数据透明性的表现形式。

A代码透明性

B分片透明性 用户无需知道数据是如何被水平或垂直切分的

C位置透明性 用户无需知道数据实际存储在哪个物理节点上

D模型透明性 用户无需知道底层各局部数据库使用的具体数据模型

33.下列选项中,( )不属于分布式数据库的优点。

A可拓展性好

B具有数据分布透明性

C体系结构灵活

D存取结构简单

34.分布式数据库的设计主要考虑数据分布的设计,数据分布主要目的是提高访问的( ),即通过数据的合理分布,尽可能地使更多的数据能够就地存放,以减少远距离的数据访问。

A局部性:“就地存放,减少远距离的数据访问”是局部性原则的定义

B全局性 分布式系统追求全局统一视图

C重构性 数据库重构(修改逻辑结构)

D完整性 数据的正确性和相容性,与数据的物理位置无关

题库2.2.相比于集中式数据库,分布式数据库具有( )的优点。

A成本低

B结构简单

C拓展性强

D数据冗余低

数据冗余 指的是相同的数据在多个地方重复存储,分布式把数据复制到多个节点,于是冗余变高

两阶段提交协议(2PC)

3.根据分布式数据库系统中的两阶段提交协议(2PC),有如下操作指令:

① 协调器向参与者发prepare消息;

② 参与者向协调器发回ready消息;

③ 参与者向协调器发回abort消息;

④ 协调器向参与者发commit消息;

⑤ 协调器向参与者发rollback消息;

满足2PC 的序列是 () 。

两阶段提交协议(2PC)的目的是保证分布式事务的原子性,即所有参与者要么全部提交(commit),要么全部回滚(rollback)。

第一阶段:准备阶段

  1. 协调器向所有参与者发送 prepare 消息(操作①),询问是否可以提交事务。

  2. 每个参与者执行事务操作,但不真正提交,然后根据自身情况向协调器回复:

    • 如果执行成功,回复 ready 消息(操作②),表示“准备好提交”。

    • 如果执行失败,回复 abort 消息(操作③),表示“无法提交”。

第二阶段:提交阶段

  • 如果所有参与者都回复了 ready:协调器决定全局提交,向所有参与者发送 commit 消息(操作④)。

  • 如果任意一个参与者回复了 abort(或超时无响应):协调器决定全局回滚,向所有参与者发送 rollback 消息(操作⑤)。

A. ①②⑤:这个序列是 prepare → ready → rollback。在所有参与者都回复 ready 的情况下,协调器正确的决定应该是 commit 而不是 rollback,因此该序列不符合2PC的正确逻辑。

B. ①②④:这个序列是 prepare → ready → commit。这正是2PC协议成功提交的标准流程。所有参与者都准备好后,协调器通知它们统一提交事务。

C. ②③⑤:这个序列以 ready 开头,缺失了第一阶段的 prepare 指令,因此不完整且不符合协议规定的消息顺序。

D. ②③④:这个序列混合了 ready 和 abort 这两个互斥的回复,逻辑上不可能发生。一个参与者不可能同时对同一个事务既回复 ready 又回复 abort。

11.12.在分布式数据库中,关系的存储采用分片和复制技术,存储在不同的站点上。用户无需知道所有的数据存储在哪个站点上,称为( 位置透明性 )。分布式事务的执行可能会涉及到多个站点上的数据操作,在2PC协议中,当事务Ti完成执行时,事务Ti的发起者协调器Ci向所有参与Ti的执行站点发送<prepare Ti>的消息,当收到所有执行站点返回的<ready Ti>消息后, 再向所有执行站点发送<commit Ti>消息。若参与事务 执行的某个站点故障恢复后日志中有<ready Ti>记录,而没有<commit Ti>记录,则( 12 )。

请作答:第 12 题

A事务Ti已完成提交,该站点无需做任何操作

B事务Ti已完成提交,该站点应做REDO操作

C事务Ti未完成提交,该站点应做UNDO操作

D应向协调器询问以决定Ti的最终结果

该站点不能自行决定提交还是回滚,因为它不知道其他站点是否都 ready、协调器最终做了什么决定。

必须向协调器(或其他参与者)询问事务 Ti 的最终状态,然后根据结果执行 REDO(提交)或 UNDO(回滚)。

数据库访问接口

6.不属于数据库访问接口的是( )。

A ODBC Open Database Connectivity

B JDBC Java Database Connectivity

C ADO ActiveX Data Objects

D HTML

面向对象数据库

9.以下关于面向对象数据模型的叙述中,错误的是( )

A一个对象对应着E-R模型中的一个实体

B对象类是一系列相似对象的集合

C对象中的属性和方法对外界是不可见的

对象会暴露 公有属性和方法 为外界提供接口,只隐藏内部实现细节。

D对象之间的相互作用通过消息来实现

10.以下关于面向对象数据库系统的叙述中,错误的是( )。

A具有表达和管理对象的能力

B具有表达复杂对象结构的能力

C不具有表达对象嵌套的能力

D具有表达和管理数据库变化的能力

13.在面向对象数据库系统的数据类型中,对象属于( )类型。

A基本

B复杂

C引用

D其他

在面向对象数据库系统中,数据类型通常分为两类:

  • 基本类型 原子类型,不可再分 整数、浮点数、字符、布尔值、字符串

  • 复杂类型 由其他类型组合构造而成 对象、集合、列表、数组、元组、结构体

15.以下关于面向对象数据库的叙述中,不正确的是( ) 。

A类之间可以具有层次结构✅ 类的继承关系形成类层次

B类内部可以具有嵌套层次结构✅ 类的属性可以是另一个类

C类的属性不能是类

D类包含属性和方法✅ 这是类的基本定义

19.以下关于面向对象数据库的叙述中,不正确的是( )。

A类是一组具有相同或相似性质的对象的抽象。一个对象是某一类的一个实例

B类的属性可以是基本类,如整数、字符串等,也可以是包含属性和方法的一般类

C类的某个属性的定义可以是该类自身

✅ 类的属性定义可以是该类自身,这称为自引用递归嵌套

D一个对象通常对应实际领域的一个实体,有唯一的标识,即对象标识OID,用户可以修改OID

对象标识(OID)是系统自动生成、唯一且不可修改的

26.E-R图中的实体集A、B之前为1:*联系,转换为关系模型时,在B实体集中增加A实体集的标识符作外码;而在面向对象数据模型中,( )。

A 在B对象中增加一个引用属性外,对A对象不作任何处理

B 在B对象中增加一个引用属性外,在A对象中增加一组引用属性

B 对象是1:n中的“多方”,它只需要一个引用就能找到属于它的1方

C 在A对象中增加一组引用属性外,对B对象不作任何处理

D 在A对象中增加一组引用属性外,在B对象中增加一组引用属性

在 E-R 模型中实体集 A 与实体集 B 是 1:N(即 1:*)联系:

典型的例子就是:每个科室有若干名职工,一名职工只属于一个科室

  • 关系模型做法:在“多方”的 B 实体集中增加一个外码,即把 A 实体集的标识符放进 B 表里,这样很容易从 B (如职工)找到对应的 A(科室)。

  • 因为数据库的 JOIN 是对称的,所以关系模型不需要为“科室查职工”这个方向单独存一份数据。只存一份外键,通过关联查询就能解决所有问题,也避免了数据冗余。

  • 面向对象模型做法:对象之间用引用属性来表达联系,而且通常联系是双向的,所以:

    • B 对象:增加一个单值的引用属性,指向它所属的那个 A 对象(对应 1:N 的“多方找一方”)。

    • A 对象:增加一组/一个集合类型的引用属性,指向属于它的所有 B 对象(对应 1:N 的“一方找多方”)。

NoSQL数据库

NoSQL”这个术语的本意就是指“Not Only SQL”或“非关系型”,专门用来描述那些不使用传统关系模型的数据库。

20.MongoDB是一种NoSQL数据库,具体地说,是( )存储数据库。

A 键值 Dynamo ,Memcached ,Redis等

B 文档 BaseX ,CouchDB ,MongoDB等

C 图形 FlockDB 、Neo4j 等

D XML

22.以下NoSQL数据库中,(  )是一种高性能的分布式内存对象缓存数据库,通过缓存数据库查询结果,减少数据库访问次数,以提高动态Web应用的速度,提高可扩展性。

A Mongodb 文档型数据库,通用数据持久存储

B Memcached

C Neo4j 图形数据库,处理复杂关系网络数据

D Hbase 列族数据库,适合大规模稀疏数据的实时读写

CAP理论

23.CAP 理论是 NoSql理论的基础,下列性质不属于 CAP 的是( )。

A 分区容错性

B 原子性

C 可用性

D 一致性

C - 一致性 Consistency 所有节点在同一时刻看到相同的数据

A - 可用性 Availability 每个请求都能得到非错误的响应(但不保证是最新数据)

P - 分区容错性 Partition Tolerance 系统在部分节点间网络故障时仍能继续正常运行

CAP 理论的核心是:分布式系统中,这三者最多只能同时满足两个

31.分布式数据库的 CAP理论指的是:对于一个分布式数据库系统,一致性、可用性和分区容错性这三个特点,最多只能满足( 2 )个。

35.分布式数据库CAP理论中的A指的是( 可用性 Availability )。

27.Redis是一种NoSQL数据库,具体地说,是( 键-值 )存储数据库。

28.( )不是目前NoSQL数据库产品的数据模型。

A图模型

B文档模型

C键值存储模型

D层次模型

29.以下关于NoSQL数据库的说法中,正确的是( )。

A NoSQL数据库保证BASE特性

NoSQL 数据库遵循 BASE 原则:

  • Basically Available(基本可用)

  • Soft state(软状态)

  • Eventually consistent(最终一致性)

B NoSQL数据库保证ACID特性

C 各种NoSQL数据库具有统一的架构

D NoSQL数据库经常使用JOIN操作

32.NoSQL数据库的四大分类是指( )。

值存储数据库,列存储数据库,文档型数据库,图数据库

34.以下( )不属于NoSQL。

A Cassandra 列

B MongoDB 文档

C PostgreSQL

D Neo4j 图

题库2.1.NoSql数据库的存储模型有( )。

A列存储,图存储,文件存储

文档存储也可以视为文件存储的一种延伸

Bkey-value存储,图存储,关系表存储 关系表存储属于SQL

C对象存储,XML存储,层次存储 层次存储和XML存储不属于

D对象存储,图存储,关系表存储 关系表存储属于SQL

并行数据库

24.以下是并行数据库的四种体系结构,在( )体系结构中所有处理器共享一个公共的主存储器和磁盘。

A共享内存:指的是内存和磁盘都共享

B共享磁盘

C无共享:每个节点都有自己的处理器、内存和磁盘。

D层次:混合了共享内存、共享磁盘和无共享结构,形成多层次架构,比如在顶层是无共享结构,底层各节点内部是共享内存结构。

云计算与大数据处理

1.以下关于大数据的叙述中,错误的是( )。

A大数据的数据量巨大

B结构化数据不属于大数据

C大数据具有快变性

D大数据具有价值

大数据的“4V”特征:

  1. Volume(大量):数据量巨大(A 正确)

  2. Velocity(高速):数据产生和处理速度快,包含实时性和快变性(C 正确)

  3. Variety(多样):数据类型多样,包括结构化数据、半结构化数据和非结构化数据

  4. Value(价值):大数据蕴含着巨大的商业和社会价值(D 正确)

题库2.3.大数据的特性一般包括( )。

①数量大②速度增长快③多样性④价值密度低

题库2.2.以下关于MapReduce技术的说法中,不正确的是( )。

A MapReduce的计算过程分解为两个主要阶段:Map阶段和Reduce阶段

Map 负责映射转换,Reduce 负责归约汇总

B 用户无需编写Map函数和Reduce函数

MapReduce 框架自动调度,但 Map 和 Reduce 函数必须自己写

C MapReduce中存在数据chunk的冗余复制

Hadoop 分布式文件系统默认将数据块复制 3 份,保证高可用。因此,MapReduce 处理的数据天然存在冗余复制。

D 在同等硬件条件下,MapReduce的性能一般低于并行数据库

MapReduce 更通用、灵活,但原始性能通常不如并行数据库

MapReduce是分布式计算模型,把海量数据的处理任务,拆成一大堆能在普通机器上并行执行的小任务。


评论