一、2025真题
1.在分布式数据库架构中,( )最适合处理高并发且可以动态扩展。
A. 分布中间件 是代理,负责路由和协调,所有请求都要经过
B. 主从架构 主节点处理所有写入,多个从节点复制数据并处理只读查询
C. 多主架构 多个节点都可接受写入,彼此之间同步数据,性能不佳且难以保证ACID 特性
D. 分片架构
分片架构指的是将数据横向切片分散存储在多个节点上,能将高并发的读写请求均匀分摊到不同分片,通过增加新分片节点(水平扩展)来实现近似线性的动态扩展
2.在分布式系统中,( )通常用于保证多个节点之间数据的可靠性和容错性。
A. 数据复制
B. 数据索引 提高查询速度
C. 数据加密 提高安全性
D. 数据压缩 节省空间
3.使用树形结构组织数据的数据库模型为()。
A网状模型
B.关系模型
C.层次模型
D.文档模型
层次模型 树形结构
网状模型 图结构
关系模型 二维表 MySQL, Oracle, PostgreSQL
文档模型 JSON/BSON 文档
4.在图数据库中,用什么来表示“数据与数据之间的联系”。
A、表和行:这是关系型数据库(如 MySQL)的概念,不符合图数据库。
B、链接和值:这不是图数据库的标准术语。
C、文本和字段:这更接近文档数据库(如 MongoDB)或一般数据结构的描述。
D、节点和边:这正是图数据库的核心模型。其中,节点用于表示实体(即题目中的“数”),边用于表示实体之间的联系。
三、按知识点分类的往年题:
数据库应用系统体系结构
1.在C/S 体系结构中,客户端执行的操作是()。
A触发器
B嵌入式SQL
C存储过程
D扩展存储过程
触发器、存储过程、扩展存储过程都是在后台数据库中执行的操作,属于数据库对象。
运行在客户端的程序通常由高级语言编写,可以使用接口技术或嵌入式SQL等方式访问数据库。
7.C/S(客户机/服务器)与B/S(浏览器/服务器)体系结构的区别是:( ) 。
A B/S建立在局域网上,C/S建立在广域网上
在考试情景下,B/S才是建立在广域网,C/S在局域网
B B/S客户相对固定集中,C/S客户分散
恰恰相反
C B/S软件重用性弱于C/S
重用性就是字面意思代码可复用性,客户端针对特定操作系统和平台开发,重用性弱
D B/S较C/S易于维护
程序逻辑都在服务器端,更新时只需升级服务器端,不用维护客户端
16-18.在数据库应用系统的体系结构中,常用的是C/S(客户机/服务器)结构和B/S(浏览器/服务器)结构。无论哪种结构,服务器都由( 16 )负责数据库的运行和维护。在C/S结构中,应用程序安装运行在( 客户机 )端,负责用户与数据库的交互;在B/S结构中,应用程序安装运行在( Web服务器 )端,负责构建用户界面与数据库的交互,客户端使用浏览器展示用户界面并获取用户输入。
请作答:第 16 题
A DBMS
B DBA
C DataBase
D DBS
请作答:第 17 、18题
A 客户机
B DB服务器
C Web服务器
D 数据库
分布式数据库
2.在分布式数据库系统中,应用程序直接使用本结点数据的性质称为()。
A共享性 数据在多个节点之间可以被共同访问和使用,强调的是全局数据的统一访问
B自治性
指每个节点对自己的数据具有独立的控制权和处理能力,本地应用程序可以不依赖其他节点直接访问本地数据。
C可用性 系统在面对故障时仍能提供服务的能力
D分布性 数据物理上分散存储在不同节点上
8.银行系统采用分布式数据库系统,对本地储户的存储业务能够在本地正常进行,而不依赖于其他场地数据库,称为分布式数据库的(自治性)。
4.关于分布式数据库,下列描述正确的是( )。
A客户机是分布在不同场地的
分布式指的是数据和服务器的分布,不是客户机的分布。客户机可以是集中,也可以是分散的。
B多个数据库服务器间的数据交互通过客户端程序来实现
多个数据库服务器间的数据交互由分布式DBMS自身协调
C数据的物理存储分布在不同的服务器上,而用户只关心访问的逻辑结构
D每个服务器上必须运行相同的DBMS
各场地可以使用不同的DBMS
5.分布式数据库允许部分数据存在多个复本,而用户不必知道这些复本的存在,称为( )。
A分片透明 用户不必知道数据被水平或垂直切分后存在哪些节点上
B复制透明
C位置透明 用户不必知道数据具体存储在哪个节点上
D全局共享
补充:局部映射透明,用户不必知道底层数据的具体存储结构
14.分布式数据库系统除了包含集中式数据库系统的模式结构之外,还增加了几个模式级别,其中( )定义分布式数据库中数据的整体逻辑结构,使得数据如同没有分布一样。
A全局外模式 用户视图,某个用户或应用看到的局部逻辑结构
B全局概念模式
C分片 数据如何被水平或垂直切分成片段
D分布 片段分配在哪个站点上,以及副本策略
21.全局概念层是分布式数据库的整体抽象,包含了系统中全都数据的特性和逻辑结构,从其分布透明特性来说,包含的三种模式描述信息中不包括( )模式。
A全局概念
B分片
C分配
D访问
分布式数据库系统的模式结构一般包括以下几个级别(自上而下):
全局外模式 用户看到的局部逻辑视图
全局概念模式 ✅ 整体数据的逻辑结构,屏蔽分布细节
分片模式 ✅ 定义数据如何被水平或垂直切分成片段
分配模式 ✅ 定义各片段存储的具体站点,包含副本策略
局部概念模式 各站点本地的逻辑视图
25.( )不是分布式数据库管理系统应该遵循的准则。
A本地自治
B依赖中心结点:一旦依赖中心点,单点故障全瘫痪
C分片透明
D位置透明
30.下列描述中,( )不是分布式数据库数据透明性的表现形式。
A代码透明性
B分片透明性 用户无需知道数据是如何被水平或垂直切分的
C位置透明性 用户无需知道数据实际存储在哪个物理节点上
D模型透明性 用户无需知道底层各局部数据库使用的具体数据模型
33.下列选项中,( )不属于分布式数据库的优点。
A可拓展性好
B具有数据分布透明性
C体系结构灵活
D存取结构简单
34.分布式数据库的设计主要考虑数据分布的设计,数据分布主要目的是提高访问的( ),即通过数据的合理分布,尽可能地使更多的数据能够就地存放,以减少远距离的数据访问。
A局部性:“就地存放,减少远距离的数据访问”是局部性原则的定义
B全局性 分布式系统追求全局统一视图
C重构性 数据库重构(修改逻辑结构)
D完整性 数据的正确性和相容性,与数据的物理位置无关
题库2.2.相比于集中式数据库,分布式数据库具有( )的优点。
A成本低
B结构简单
C拓展性强
D数据冗余低
数据冗余 指的是相同的数据在多个地方重复存储,分布式把数据复制到多个节点,于是冗余变高
两阶段提交协议(2PC)
3.根据分布式数据库系统中的两阶段提交协议(2PC),有如下操作指令:
① 协调器向参与者发prepare消息;
② 参与者向协调器发回ready消息;
③ 参与者向协调器发回abort消息;
④ 协调器向参与者发commit消息;
⑤ 协调器向参与者发rollback消息;
满足2PC 的序列是 () 。
两阶段提交协议(2PC)的目的是保证分布式事务的原子性,即所有参与者要么全部提交(commit),要么全部回滚(rollback)。
第一阶段:准备阶段
协调器向所有参与者发送
prepare消息(操作①),询问是否可以提交事务。每个参与者执行事务操作,但不真正提交,然后根据自身情况向协调器回复:
如果执行成功,回复
ready消息(操作②),表示“准备好提交”。如果执行失败,回复
abort消息(操作③),表示“无法提交”。
第二阶段:提交阶段
如果所有参与者都回复了
ready:协调器决定全局提交,向所有参与者发送commit消息(操作④)。如果任意一个参与者回复了
abort(或超时无响应):协调器决定全局回滚,向所有参与者发送rollback消息(操作⑤)。
A. ①②⑤:这个序列是 prepare → ready → rollback。在所有参与者都回复 ready 的情况下,协调器正确的决定应该是 commit 而不是 rollback,因此该序列不符合2PC的正确逻辑。
B. ①②④:这个序列是 prepare → ready → commit。这正是2PC协议成功提交的标准流程。所有参与者都准备好后,协调器通知它们统一提交事务。
C. ②③⑤:这个序列以 ready 开头,缺失了第一阶段的 prepare 指令,因此不完整且不符合协议规定的消息顺序。
D. ②③④:这个序列混合了 ready 和 abort 这两个互斥的回复,逻辑上不可能发生。一个参与者不可能同时对同一个事务既回复 ready 又回复 abort。
11.12.在分布式数据库中,关系的存储采用分片和复制技术,存储在不同的站点上。用户无需知道所有的数据存储在哪个站点上,称为( 位置透明性 )。分布式事务的执行可能会涉及到多个站点上的数据操作,在2PC协议中,当事务Ti完成执行时,事务Ti的发起者协调器Ci向所有参与Ti的执行站点发送<prepare Ti>的消息,当收到所有执行站点返回的<ready Ti>消息后, 再向所有执行站点发送<commit Ti>消息。若参与事务 执行的某个站点故障恢复后日志中有<ready Ti>记录,而没有<commit Ti>记录,则( 12 )。
请作答:第 12 题
A事务Ti已完成提交,该站点无需做任何操作
B事务Ti已完成提交,该站点应做REDO操作
C事务Ti未完成提交,该站点应做UNDO操作
D应向协调器询问以决定Ti的最终结果
该站点不能自行决定提交还是回滚,因为它不知道其他站点是否都 ready、协调器最终做了什么决定。
必须向协调器(或其他参与者)询问事务 Ti 的最终状态,然后根据结果执行 REDO(提交)或 UNDO(回滚)。
数据库访问接口
6.不属于数据库访问接口的是( )。
A ODBC Open Database Connectivity
B JDBC Java Database Connectivity
C ADO ActiveX Data Objects
D HTML
面向对象数据库
9.以下关于面向对象数据模型的叙述中,错误的是( )
A一个对象对应着E-R模型中的一个实体
B对象类是一系列相似对象的集合
C对象中的属性和方法对外界是不可见的
对象会暴露 公有属性和方法 为外界提供接口,只隐藏内部实现细节。
D对象之间的相互作用通过消息来实现
10.以下关于面向对象数据库系统的叙述中,错误的是( )。
A具有表达和管理对象的能力
B具有表达复杂对象结构的能力
C不具有表达对象嵌套的能力
D具有表达和管理数据库变化的能力
13.在面向对象数据库系统的数据类型中,对象属于( )类型。
A基本
B复杂
C引用
D其他
在面向对象数据库系统中,数据类型通常分为两类:
基本类型 原子类型,不可再分 整数、浮点数、字符、布尔值、字符串
复杂类型 由其他类型组合构造而成 对象、集合、列表、数组、元组、结构体
15.以下关于面向对象数据库的叙述中,不正确的是( ) 。
A类之间可以具有层次结构✅ 类的继承关系形成类层次
B类内部可以具有嵌套层次结构✅ 类的属性可以是另一个类
C类的属性不能是类
D类包含属性和方法✅ 这是类的基本定义
19.以下关于面向对象数据库的叙述中,不正确的是( )。
A类是一组具有相同或相似性质的对象的抽象。一个对象是某一类的一个实例
B类的属性可以是基本类,如整数、字符串等,也可以是包含属性和方法的一般类
C类的某个属性的定义可以是该类自身
✅ 类的属性定义可以是该类自身,这称为自引用或递归嵌套
D一个对象通常对应实际领域的一个实体,有唯一的标识,即对象标识OID,用户可以修改OID
对象标识(OID)是系统自动生成、唯一且不可修改的
26.E-R图中的实体集A、B之前为1:*联系,转换为关系模型时,在B实体集中增加A实体集的标识符作外码;而在面向对象数据模型中,( )。
A 在B对象中增加一个引用属性外,对A对象不作任何处理
B 在B对象中增加一个引用属性外,在A对象中增加一组引用属性
B 对象是1:n中的“多方”,它只需要一个引用就能找到属于它的1方
C 在A对象中增加一组引用属性外,对B对象不作任何处理
D 在A对象中增加一组引用属性外,在B对象中增加一组引用属性
在 E-R 模型中实体集 A 与实体集 B 是 1:N(即 1:*)联系:
典型的例子就是:每个科室有若干名职工,一名职工只属于一个科室
关系模型做法:在“多方”的 B 实体集中增加一个外码,即把 A 实体集的标识符放进 B 表里,这样很容易从 B (如职工)找到对应的 A(科室)。
因为数据库的 JOIN 是对称的,所以关系模型不需要为“科室查职工”这个方向单独存一份数据。只存一份外键,通过关联查询就能解决所有问题,也避免了数据冗余。
面向对象模型做法:对象之间用引用属性来表达联系,而且通常联系是双向的,所以:
B 对象:增加一个单值的引用属性,指向它所属的那个 A 对象(对应 1:N 的“多方找一方”)。
A 对象:增加一组/一个集合类型的引用属性,指向属于它的所有 B 对象(对应 1:N 的“一方找多方”)。
NoSQL数据库
NoSQL”这个术语的本意就是指“Not Only SQL”或“非关系型”,专门用来描述那些不使用传统关系模型的数据库。
20.MongoDB是一种NoSQL数据库,具体地说,是( )存储数据库。
A 键值 Dynamo ,Memcached ,Redis等
B 文档 BaseX ,CouchDB ,MongoDB等
C 图形 FlockDB 、Neo4j 等
D XML
22.以下NoSQL数据库中,( )是一种高性能的分布式内存对象缓存数据库,通过缓存数据库查询结果,减少数据库访问次数,以提高动态Web应用的速度,提高可扩展性。
A Mongodb 文档型数据库,通用数据持久存储
B Memcached
C Neo4j 图形数据库,处理复杂关系网络数据
D Hbase 列族数据库,适合大规模稀疏数据的实时读写
CAP理论
23.CAP 理论是 NoSql理论的基础,下列性质不属于 CAP 的是( )。
A 分区容错性
B 原子性
C 可用性
D 一致性
C - 一致性 Consistency 所有节点在同一时刻看到相同的数据
A - 可用性 Availability 每个请求都能得到非错误的响应(但不保证是最新数据)
P - 分区容错性 Partition Tolerance 系统在部分节点间网络故障时仍能继续正常运行
CAP 理论的核心是:分布式系统中,这三者最多只能同时满足两个
31.分布式数据库的 CAP理论指的是:对于一个分布式数据库系统,一致性、可用性和分区容错性这三个特点,最多只能满足( 2 )个。
35.分布式数据库CAP理论中的A指的是( 可用性 Availability )。
27.Redis是一种NoSQL数据库,具体地说,是( 键-值 )存储数据库。
28.( )不是目前NoSQL数据库产品的数据模型。
A图模型
B文档模型
C键值存储模型
D层次模型
29.以下关于NoSQL数据库的说法中,正确的是( )。
A NoSQL数据库保证BASE特性
NoSQL 数据库遵循 BASE 原则:
Basically Available(基本可用)
Soft state(软状态)
Eventually consistent(最终一致性)
B NoSQL数据库保证ACID特性
C 各种NoSQL数据库具有统一的架构
D NoSQL数据库经常使用JOIN操作
32.NoSQL数据库的四大分类是指( )。
值存储数据库,列存储数据库,文档型数据库,图数据库
34.以下( )不属于NoSQL。
A Cassandra 列
B MongoDB 文档
C PostgreSQL
D Neo4j 图
题库2.1.NoSql数据库的存储模型有( )。
A列存储,图存储,文件存储
文档存储也可以视为文件存储的一种延伸
Bkey-value存储,图存储,关系表存储 关系表存储属于SQL
C对象存储,XML存储,层次存储 层次存储和XML存储不属于
D对象存储,图存储,关系表存储 关系表存储属于SQL
并行数据库
24.以下是并行数据库的四种体系结构,在( )体系结构中所有处理器共享一个公共的主存储器和磁盘。
A共享内存:指的是内存和磁盘都共享
B共享磁盘
C无共享:每个节点都有自己的处理器、内存和磁盘。
D层次:混合了共享内存、共享磁盘和无共享结构,形成多层次架构,比如在顶层是无共享结构,底层各节点内部是共享内存结构。
云计算与大数据处理
1.以下关于大数据的叙述中,错误的是( )。
A大数据的数据量巨大
B结构化数据不属于大数据
C大数据具有快变性
D大数据具有价值
大数据的“4V”特征:
Volume(大量):数据量巨大(A 正确)
Velocity(高速):数据产生和处理速度快,包含实时性和快变性(C 正确)
Variety(多样):数据类型多样,包括结构化数据、半结构化数据和非结构化数据
Value(价值):大数据蕴含着巨大的商业和社会价值(D 正确)
题库2.3.大数据的特性一般包括( )。
①数量大②速度增长快③多样性④价值密度低
题库2.2.以下关于MapReduce技术的说法中,不正确的是( )。
A MapReduce的计算过程分解为两个主要阶段:Map阶段和Reduce阶段
Map 负责映射转换,Reduce 负责归约汇总
B 用户无需编写Map函数和Reduce函数
MapReduce 框架自动调度,但 Map 和 Reduce 函数必须自己写
C MapReduce中存在数据chunk的冗余复制
Hadoop 分布式文件系统默认将数据块复制 3 份,保证高可用。因此,MapReduce 处理的数据天然存在冗余复制。
D 在同等硬件条件下,MapReduce的性能一般低于并行数据库
MapReduce 更通用、灵活,但原始性能通常不如并行数据库
MapReduce是分布式计算模型,把海量数据的处理任务,拆成一大堆能在普通机器上并行执行的小任务。