大话数据结构 01,02

本文最后更新于:2020年9月16日 下午

第1章 数据结构绪论

数据结构:相互之间存在一种或多种特定关系的数据元素的集合

1.4 基本概念和术语

1.4.1 数据

描述客观事物的符号,是计算机可以操组的对象,是能被计算机识别,并输入给计算机处理的符号集合

1.4.2 数据元素

组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理。也被称为记录

比如:人。

1.4.3 数据项

一个数据元素可以由若干个数据项组成

比如:眼,耳,鼻,嘴,手,脚等

  • 数据项是数据不可分割的最小单位
  • 实际中,数据元素才是数据结构中建立数据模型的着眼点

1.4.4 数据对象

性质相同的数据元素的集合,是数据的子集

1.4.5 数据结构

相互之间存在一种或多种特定关系的数据元素的集合

1.5 逻辑结构与物理结构

1.5.1 逻辑结构

数据对象中数据元素之间的相互关系

1. 集合结构

集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系

  • 各个数据元素是“平等”的

2. 线性结构

数据元素之间是一对一的关系

3. 树形结构

数据元素之间存在一种一对多的层次关系

4. 图形结构

数据元素是多对多的关系

1.5.2 物理结构

数据的逻辑结构在计算机中的存储形式

1. 顺序存储结构

把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的

2. 链式存储结构

把数据元素存储在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的

1.6 抽象数据类型

1.6.1 数据类型

一组性质相同的值的集合及定义在此集合上的一些操作的总称

1.6.2 抽象数据类型

一个数学模型及定义在该模型上的一组操作

  • “抽象”的意义在于数据类型的数学抽象特性
  • 抽象数据类型体现了程序设计中问题分解,抽象和信息隐藏的特性

第2章 算法

算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作

2.5 算法的特性

2.5.1 输入输出

算法具有零个或多个输入,至少有一个或多个输出

2.5.2 有穷性

算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间完成

2.5.3 确定性

算法的每一步骤都具有明确的含义,不会出现二义性

2.5.4 可行性

算法的每一步都必须是可行的,每一步都能够在通过执行有限次数完成

2.6 算法设计的要求

2.6.1 正确性

算法至少应该具有输入、输出和加工处理无歧义性、能正确反映问题的需求、能够得到问题的正确答案

“正确”大体分为四个层次:

  1. 没有语法错误
  2. 对合法的输入数据能够产生满足要求的输出结果
  3. 对于非法的输入数据能够得到满足规格说明的结果
  4. 对于精心选择的,甚至刁难的测试数据都有满足要求的输出结果

2.6.2 可读性

算法设计的另一目的是为了便于阅读、理解和交流

2.6.3 健壮性

当输入数据不合法时,算法也能做出相关处理,而不产生异常或莫名奇妙的结果

2.6.4 时间效率高和存储量低

2.7 算法效率的度量方法

2.7.1 事后统计方法

通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低

  • 有很多缺陷,不予采纳

2.7.2 事前分析估算方法

在计算机程序编制前,依据统计方法对算法进行估算

一个高级程序语言编写的程序在计算机上运行时所消耗的时间取决于下列因素

  1. 算法采用的策略和方法
  2. 编译产生的代码质量
  3. 问题的输入规模
  4. 机器执行指令的速度
  • 测定运行时间最可靠的方法:计算对运行时间有消耗的基本操作的执行次数,运行时间与这个计数成正比
  • 分析程序的运行时间时,最重要的是把程序看成独立于程序设计语言的算法或一系列步骤

2.8 函数的渐近增长

给定两个函数 f(n) 和 g(n),如果存在一个整数 N,使得对于所有的 n > N,f(n) 总是比 g(n) 大,那么,我们说 f(n) 的增长渐近快于 g(n)

  • 忽略加法常数
  • 与最高次项相乘的常数并不重要

  • 判断一个算法的效率时,函数中的常数和其他次要项常常可以忽略,而更应该关注(最高阶项)的阶数

2.9 算法时间复杂度

2.9.1 算法时间复杂度定义

在进行算法分析时,语句总的执行次数 T(n) 是关于问题规模 n 的函数,进而分析 T(n) 随 n 的变化情况而确定 T(n) 的数量级。算法的时间复杂度,也就是算法的时间量度,记作: T(n) = O(f(n))。它表示随问题规模 n 的增大,算法执行时间的增长率和 f(n) 的增长率相同,称作算法的渐近时间复杂度,简称为时间复杂度。

2.9.2 推导大 O 阶方法

  1. 用常数 1 取代运行时间中的所有加法常数
  2. 在修改后的运行次数函数中,只保留最高阶项
  3. 如果最高阶项存在且不是1,则去除这个项相乘的常数。得到的结果就是大 O 阶

2.9.3 常数阶

  • 时间复杂度:O(1)
1
2
3
int sum = 0, n = 100;		//执行一次
sum = (1 + n) * n / 2; //执行一次
cout << sum << endl; //执行一次

单纯的分支结构(不包含在循环结构中),其时间复杂度也是 O(1)。

2.9.4 线性阶

分析算法复杂度,关键就是要分析循环结构的运行情况

  • 时间复杂度:O(n)
1
2
3
for(int i = 0; i < n; i++){
//时间复杂度为 O(1) 的程序步骤序列
}

2.9.5 对数阶

时间复杂度:O(logn)

$2^x = n$ 得到 $x = log_2 n$

1
2
3
4
5
6
int count = 1;
while ( count < n)
{
count = count * 2;
//时间复杂度为 O(1)的程序步骤序列
}

2.9.6 平方阶

时间复杂度:O(n^2)

1
2
3
4
5
for(int i = 0; i < n; i++){
for(int j = 0; j < n; j++){
//时间复杂度为 O(1)的程序步骤序列
}
}

时间复杂度:O(n^2)

$n + (n-1)+(n-2)+…+1 = n^2/2 + n/2$

1
2
3
4
5
for(int i = 0; i < n; i++){
for(int j = i; j < n; j++){
//时间复杂度为 O(1)的程序步骤序列
}
}

2.10 常见的时间复杂度

常用的时间复杂度所耗费的时间从小到大依次是:

$O(1)<O(logn)<O(n)<O(nlogn)<O(n^2)<O(n^3)<O(n!)<O(n^n)$

2.11 最坏的情况与平均情况

  • 除非特别指定,我们提到的运行时间都是最坏情况的运行时间
  • 平均运行时间是所有情况中最有意义的,因为它是期望的运行时间,平均运行时间很难通过分析得到,一般都是通过运行一定数量的实验数据后估算出来

2.12 算法空间复杂度

算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记作:S(n) = O(f(n)),其中,n 为问题的规模,f(n) 为语句关于 n 所占存储空间的函数

  • 若算法执行时所需的辅助空间相对于输入数据量而言是个常数,则称此算法为原地工作,空间复杂度为 O(1)