DataStructures_AlgorithmAnalysis_C

数据结构和算法分析C语言版书的学习代码 - 2019.08.01

1. 说明

对该书慕名而来，终于开刷了，总结自己学习用到的书中相关代码和内容，或许不全面，慢慢补充学习
C语言实现，Xcode编译器
目的：刷了剑指offer,觉得自己缺乏对数据结构的算法的整体把握，通过这本书能有个全面的总结学习，以后再继续深入。

2. 内容

第1章绪论 - 2019.8.1

主要内容

大量输入下的程序性能重要性
数学基础：给了几个公司，指数，对数，级数，归纳法。主要是为了后面算法分析使用。（具体看书）
递归：基准，推进，设计，效益。

大致作为引论的功能，了解

第2章算法分析 - 2019.8.1

主要内容：

数学公式：阐述了几个复杂度的数学概念，四定义，三法则。对时间复杂度，增长率清晰了不少
模型：计算机指令

举例：最大子序列和的问题。作者给了四种方法，把时间复杂度从O(n^3) -> O(n),真正明白算法的威力。具体代码看这里
给了三个对数复杂度的问题。跟对数相关主要是折半。代码在这里

总结：这一章对后面的算法复杂度分析会很重要，看明白神清气爽！

第3章表,栈,队列 2019.8.8

1.表 - 2019.8.8

实现方法：

1.指针实现
2.游标法实现：使用数组，不使用指针

例子

1.多项式：代码完成数组和链表两种实现方法。参考1, 参考2
2.基数排序：
3.多重表：

2.栈 - 2019.8.8

构造和基本操作实现：链表和数组方式有些不同，结构体也不同，但是对外的结构要是一致的。

例子

1.平衡符号判断：判断一串符号是否匹配。参考内容
2.后缀表达式的计算和转换: 这个很经典，彻底实现了，包括对字符串的使用，好好看看。参考内容
3.函数调用：主调函数的变量，指针等内容都存储在栈中。

3.队列 - 2019.8.9

队列的构造和实现：链表和数组两种方式，两个结构体不一样，操作一样。实现参考

数组实现：两个结构体，队和队中的节点。注意指针
链表实现：主要是判空条件，不同的实现方法。rear和front的关系，或者增加size变量。

例子

所有的排队应用，计算机网络等
排队理：接线员问题

总结：这三个是最基础的数据结构，后面高级数据结构以及算法的实现会大量用到它们，要烂熟于心，灵活调用！

第4章树 - 2019.8.14

4.1 树的定义实现，遍历和应用

实现：树节点结构体：每个节点存放数据，以及儿子节点的指针。
应用：操作系统目录结构。

先序 - 打印文件名
后序 - 计算磁盘大小

4.2 二叉树

1. 实现：定义二叉树节点。

typedef struct TreeNode *pNode;
typedef struct pNode Tree;

struct TreeNode
{
    ElementType Element;
    Tree Left;
    Tree Right;
}

2. 应用：

表达式树：树叶是操作数，其他节点是操作符。表达式树后序遍历是后缀表达式，中序遍历是中序表达式。
实现思路：参考.

每次读入一个符号表达式；
如果是操作数：生成树节点，压入栈中；
如果是操作符：从栈中弹出两个树节点T1,T2，形成一个新树，树根为操作符，左右儿子分别是T2,T1(先出栈的是右孩子),然后压入栈中；

表达式树完整代码实现.

4.3 二叉查找树

性质：每个节点X，左子树的关键值小于X,右子树的关键值大于X;查找复杂度为O(logn)
二叉查找树的构造和使用:完整代码.

MakeEmpty(),Find()
FindMin(),FindMax():递归左右子树即可
Insert
Delete:三种情况：待删节点是树叶，有1个孩子，有2个孩子(用右子树最小值代替，然后删除右子树最小值)。

4.4 AVL平衡二叉树 - 2019.8.19

性质：每个节点的左子树和右子树的高度最多差1的二叉查找树。在插入和删除时，要使用保持平衡性质。（单旋转，双旋转）
AVL平衡二叉树的构造和使用,完整实现。

MakeEmpty(), Find(), SingleRotateWithLeft(), SingleRotateWithRight(), DoubleRotateWithLeft(), DoubleRotateWithRight(),Insert(), Delete().
参考代码

4.5. 伸展树 - 2019.8.19

基本思想：当一个节点被访问后，它要经过一系列AVL树的旋转被放到跟上。（当前被操作的节点很有很能在最近一段时间频繁访问）。
实现参考

4.6 B-树（M值为3，2—3树）

性质：

树的根要么是树叶，要么其儿子说在[2,M]之间。
除根外，所有非叶节点的儿子树在[M/2, M]之间。
所有树叶都在相同深度上，且所有数据存在树叶上。
有 k 个子节点的非叶子节点拥有 k − 1 个键，每一个内部节点的键将节点的子树分开，每个键值表示后一个叶子节点的最小值。

操作：

插入：搜索树找到叶子节点，如果可以容纳，直接插入；该叶子节点没有空间，通过分裂，插入
删除：删除之后，如果不满足空间条件，可以通过合并兄弟，更新父节点键值完成。

实现参考.

附加

B+树：在B-tree的基础上，为叶子节点增加链表指针。参考
红黑树：不完全的平衡，避免想AVL树一样每次插入都要调整。参考

总结：树很重要，要清清楚楚，要能从二叉树开始讲，遍历，二叉查找树，AVL，B-，红黑树。都什么特点，怎么操作，为什么不断延伸，解决什么问题能说的清楚明白。

第5章散列Hash表 - 2019.8.23

1. Hash构成：关键字+数组

1 散列函数：根据关键字的值，把关键字映射为0~TableSize-1中的某个数，然后放到固定单元中。这个映射就是散列函数
2 解决冲突：当两个关键字通过散列函数映射到相同值时，如何解决放到不同的位置。

2. 散列函数：有多种不同的函数。

尽量根据关键字特性，进行映射，分布越均匀越好。Hash大小为素数。
其他参考书中内容。

3. 解决冲突：分离连接，开放定址。参考网上代码

分离连接：把Hash中散列到同一个位置的元素保留到一个表中。代码参考
开放定址：有冲突，尝试另外的单元。H(X) = (Hash(X) + F(i) mod TableSize). 线性探测 - F(i) = i. 平方探测 - F(i) = i^2。代码参考.
再散列：开辟更大的散列表（当前散列大小2倍的素数），然后复制旧的到新的散列中。

4. 可扩散列

增加散列关键字，增加可访问散列大小

总结：明白散列函数+解决冲突方法，就对散列清楚了，多看代码，画图分析！

6 优先队列（堆）. - 2019.8.25

1. 模型讲解

返回优先级最高的数据结构，最大最小堆。有Insert，DeleteMin操作等
实现方法极其复杂度

实现方法	Insert	DeleteMin
链表	O(1)	O(n)
二叉查找树	log(n)	log(n)
二叉堆	log(n)	O(1)

2. 二叉堆的及其实现 - 2019.8.25

性质

结构性质：是完全二叉树（完全二叉树的第i个节点的父节点是i/2,左子节点是2i,右子节点是2i+1）。
堆序性质：父节点小于左右子节点。

操作以及代码实现

Insert:上滤
DeleteMin：下滤

实现的网上参考代码。

3 d-堆 - 2019.8.26

二叉堆的推广，每个树可以有d个儿子

4 左式堆:(代码未实现，实现可参考该博客)

性质

同样以二叉树构建，但不是完全二叉树了
任一节点的零路径长（节点到一个没有两个儿子节点的最短路径）比其儿子零路径长的最小值大1.
父节点的属性值小于子节点属性值。
堆中的任何节点，其左儿子的零路径长>=右儿子的零路径长的二叉树。

操作

合并，删除，插入

5 斜堆

左式堆的自调节形式。同样具有堆序，但是对树的结构没有什么限制。

2. 没有看且没有实现，以后补充实现。

6 二项式队列：（代码未实现，要实现可参考该博客）

完全未看且没有实现，以后补充。

总结：1.最重要的是二叉堆，要烂熟于心这个，后面排序要用。2.左式堆，斜堆，二项队列都没实现，抽时间再来补充

第7章排序. - 2019.8.29

1. 每种排序的介绍：具体实现代码参看这里

插入排序：遍历N-1趟数组，每一趟向前面已经有序的数组插入一个元素，并保证插入之后有序。
希尔排序：每一趟选取一定间隔，使得一定间隔的元素有序；最后间隔为1，整体有序
堆排序：对数组创建成为最大堆O(n)，每次执行DeteleMin操作log(n)，把最大值放到数组最后；完成排序
归并排序：分治思路，把要排序数组分成两快，然后对每块进行排序，然后把排序完成的合并成一个。其中合并主要用对两个有序数组合并成一个有序数组。分O(logN) + 合并O(N)
快速排序：分治递归思路。首先选取枢纽，然后根据枢纽把数组分成两块，使得枢纽在有序后的位置上；最后对两块分别递归，完成排序。(这还可以运用到找第k大值中)
桶排序：最快的排序，不基于比较。首先选取固定数量桶，桶是从小到大的；然后把数组元素放入对应桶中，并排序；最后按照顺序连接桶即可。代码网上参考。参考2
外部排序：排序-归并策略。先读入内存能装下数量元素进行排序，输出到外部存储中保存；然后再讲这些一个一个合并（类似归并，把两个有序数组合并成一个有序），放到外村中。
其他排序算法补充参考

2. 每种排序的分析，最好/最坏/平均复杂度

对于基于比较的方法，复杂度有下届是 O(NlogN),就是说最好情况下要进行log(N!)上取整次比较，平均需要O(NlogN)次比较
每种排序的具体好坏，复杂度分析具体看书中说明，要了然于胸。

复杂度	最好情况	最差情况	平均
1.插入排序	O(n)	O(n^2)	O(n^2)
2.希尔排序	O(n)	O(n^2)	O(n^3/2
3.堆排序	O(nlogn)	O(nlogn)	O(nlogn)
4.归并排序		O(nlogn)	O(nlogn)
5.快速排序	O(n^2)	O(nlogn)	O(nlogn)
6.桶排序	O(N)		O(M + N)

总结：现在只有这几种，对于思路，代码，还要复杂度分析，包括改进方法，一定要清清楚楚，对答如流才行！

第8章不相交集（并查集）. - 2019.8.29

1. 等价关系

对于a,b验证a,b是否包含在同等价关系中。
等价类：a对于S的等价类表示包含所有与a有关系的集合。
初始元素都是不相交的，通过Union运算，使得对应元素有关系；通过Find()运算查找元素所在集合。

2. 基本数据结构

数组：对每个数组内的元素维护一个id号，表示所属的集合；
树：不断判断root节点，表示所属的集合；

3. 操作

Find: 返回树根 -> 路径压缩优化
Union: 随机求并 -> 按大小求并 -> 按深度求并。
复杂度：对N个元素进行M次Find-Union操作 - O(MlogN)。

4. 之前C++学习对并查集的实现,可参考

总结：要清晰思虑，写算法题中要会自己很快实现，并会用

9章. 图论 - (未用代码实现，抽时间一定要实现它) - (2020.1.4)

若干定义：
1. 基本定义：
  - 图：一个图G(V,E)由定点集V和边集E组成。
  - 有向图和无向图：边是有方向的称作有向图；无方向成为无向图；
  - 路径：是一个顶点的序列$w_1,…,w_N$,使得($w_i$,$w_{i+1}$)属于边集E；
  - 度：图中与某个顶点相关联的边的数目，称为该顶点的度；
  - 环：图包含一条从一个顶点到它自身的边(u，v)，路径u,v也叫做一个环；除了第一个顶点和最后一个顶点之外，其余顶点不重复出现的回路，称为简单回路
  - 连通图：一个无向图中从每个顶点到每个其他顶点都有一条路径，则该无向图是连通的；
  - 完全图：每个顶点间都存在一条边的图；
2. 图的表示方法：
  1. 邻接矩阵：使用一个二维数组，对于每条边(u，v)，置A[u][v] = 1;否则数组元素为0；
    - 邻接表简单，方便表示，容易查看边和顶点的度；但是如果用来表示稀疏图非常浪费O(n^2);
  2. 邻接表：对于每个顶点，使用一个表存放所有邻接的顶点；该表表示以该顶点为起点的所有边的信息(终点序号，权值，连接域)。
    - 图的邻接表便于查找任一顶点的关连边和邻接点，O(E/V)；对于有向图容易查找后继节点，但是不容易查找前继，需要扫描整个表，所以对于经常查找入度或者以顶点为终点的运算，可以建立逆向邻接表；
  3. 在图中，不能使用名字作为索引，所以需要提供名字到数字的映射；可以使用散列表(存储一个名字对应的1到|V|的编号)；
3. 图的具体实现：
  1. 邻接表表示图的代码实现：使用开放定址法构建哈希表(使得每个节点对应一个顶点)。
  2. 邻接矩阵实现：
拓扑排序： - (2020.1.4)
- 说明：对有向无圈图顶点的一种排序，使得如果存在一条从$v_i$到$v_j$的路径，那么在排序中$v_j$出现在$v_i$后面;
- 实现：(找到任意一个没有入边的顶点，记录并把它和其边一起从图中删除；然后对其他部分同样处理)
  1. 图使用邻接表存储，计算图中所有定点的入度存入Indegree数组中(对邻接表每条边的顶点进行统计)
  2. 扫描indegree数组，找所有入度为0的顶点(如果不存在，则有环)；把顶点入队(该队是专门存放入度为0的顶点)；
  3. 出队一个顶点（记录该顶点作为结果）；然后在Indegree数组中把与该顶点相连的顶点入度减1；
  4. 重复2，3直到队列为空，结束；
最短路径算法： - (2020.1.4)
1. 有向无权图最短路径：BFS方法，(在一个有向无权图中，找某个顶点s到其他所有顶点的最短路径)
  - 解决：BFS方法如下
    1. 选取顶点s作为起点，得出起点到s的距离为0，记录该信息；
    2. 选取与s相连的顶点v，距离为1，记录所有顶点信息；
    3. 选取所有与v相连的顶点，距离为2，记录信息，重复这个步骤，直至所有顶点都被考察过；
  - 数据结构：(为了实现BFS，需要记录3个信息)
    1. 顶点是否被考察过：使用know数组标记；
    2. 顶点到起点s的距离：用$d_v$记录；
    3. 实际的路径信息：就是到达该顶点的上一个顶点，用$p_v$记录；
  - 算法步骤：(使用邻接表实现图，复杂度为O(V+E)，复杂度最低)
    1. 初始化know数组为false；距离$d_v$为无穷大；路径$p_v$为None；
    2. 把初始距离置为0，然后入队初始节点；
    3. 出队一个节点，把该节点在know中置为true已访问；把和他相邻的未知顶点距离$d_v$设为该顶点距离加1；路径$p_v$设为该顶点，然后相邻顶点入队；
    4. 重复3，直到队列为空；
2. 有向带权图最短路径：Dijkstra算法
  - 解决：Dijkstra算法，大名鼎鼎的贪婪算法，每次在未知顶点中选取最小的$d_v$
    1. 选择一个起始点v1，得出从起始点到v1长为0，记录信息；
    2. 考察所有和v1相连的顶点，并记录v1到他们的距离；
    3. 选择和v1距离最短的顶点为v4，起始点到v4的距离被固定下来；然后考察该顶点(v4)的所有相邻顶点，如果从该顶点到相邻顶点的路径小于之前路径，则更新路径,调整他们在表中信息（这里调整的意思是在后面访问过程中有可能会出现比通过v2顶点更短的情况，具体来说就是去数据结构表中扫描$d_v$的值，找到最小距离值进行往后访问）；
    4. 选择余下未被访问顶点中最短的顶点，为v2，重复3过程，直到确定所有顶点的最短距离信息；
  - 数据结构：(同样记录3个信息）
    1. 顶点是否已经被访问确定过最短路径：使用known数组；
    2. 顶点到起点的距离：用$d_v$记录；
    3. 路径信息：$p_v$记录，该顶点的上一个顶点；
  - 算法步骤：(使用最小堆降低查找最小$d_v$的复杂度，每次查找O(logV),查找V次，总复杂度O(E+VlogV));
    1. 初始化表结构数组；初始Known所有元素为false；距离$d_v$无穷大；路径$p_v$为None；
    2. 初始顶点距离置为0，插入最小堆中（这里用最小堆，就是为了降低查找$d_v$最小值的复杂度）；
    3. 获取堆的最小值，如果该值对应的顶点未访问，则访问，并更新该顶点相邻顶点的路径长度$d_v$；把更新值插入最小堆中；
    4. 重复3，直到所有边被访问过，即可找出最短路径；
3. 具有负权值：
  1. Dijkstra不再有效，因为负值可能使得$d_v$最小值无限循环下去；可以认为设置某一定点出队|V|+1次后停止，避免负权值顶点不断入队；
4. 无圈图：
  1. 可以使用拓扑排序进行改进Dijkstra算法；
网络流问题：
1. 定义：在给定容量的有向图中，找到从发点到收点之间可以存着的最大网络流；
2. Edmond-Karp算法：
  1. 建立一个空的$G_f$图作为流图；
  2. 建立一个残余图$G_r$，残余图初始化和给定的网络流图相同；
  3. 在残余图上用BFS寻找增广途径，如果找到，则用该路径上的最小流值修改$G_f$和$G_r$;
  4. 重复3，直到无法找出从发点到收点的增广路径（就是该通路上每条边还能增加多少流的量的和）；则此次$G_f$即为所求；
最小生成树：(连接图中所有顶点的边构成的树，且边的总权值最小) - (2020.1.4)
1. Prim算法：(不断寻找与当前已构的树相连且权最小的边)，复杂度：O(ElogV)，实现和Dijkstra算法一样，logV是对最小权值堆的调整复杂度，具体思路是：在所有节点中，寻找和当前最小生成树MST集合中的节点相连的最小权值边，加入MST中，直到有V-1条边或者BST中有V个顶点；具体实现类似Dijkstra算法，步骤如下：
  1. 图中所有顶点的集合为V；初始集合为u = {s}, v = V - u;
  2. 在两个集合u,v能够组成的边中，选择一条权值最小的$(u_0,v_0)$边（注意这里用一个最小堆维护最小权值边，降低复杂度），加入最小生成树，并把v0加入u中；
  3. 重复步骤2，直到最小生成树有V个顶点或者V-1条边；
2. Kruskal算法：(分别找最小的权边互相合并，不形成环即可)，复杂度最坏为O(ElogE)，有可能把所有边都查找了一遍，具体步骤如下：
  1. 把每条边权值非降序排列；
  2. 每次挑选一个权值最小的边，检查把它加入最小生成树中是否会形成环（这里可以用并查集来检测）；如果不会就加入，会就舍弃;
  3. 重复步骤2，直到最小生成树中有V-1条边；
DFS应用：(没看忘了)
1. 首先要实现DFS：
2. 应用1：判断双连通性求割点（割点就是去了这个点图就不连通了）；
3. 应用2：欧拉回路；
参考：1.代码实现,2.代码实现.3. 实现博客讲解

10章. 算法设计技巧

贪婪算法：
分治算法：
动态规划：
随机算法：
回溯算法：

3. 总结

4. 参考

Mooc的算法学习代码.

里面有一些基础的算法C++实现，以及算法改进，可以看一看。

个人剑指offer刷题记录。

里面是《剑指offer》书的全部实现代码，有大量实现和测试，对我收获颇多，常看。

跟人对C++的一些练习

这里是对C++的练习，以后会慢慢加深的，包括语法，STL实现等等。

网上大佬对数据结构和算法的总结分析
9章中图的代码都没实现，抽时间系统实现他们；可以参考这个大佬

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
ch02_Algorithm_Analysis		ch02_Algorithm_Analysis
ch03_List_Stack_Queue		ch03_List_Stack_Queue
ch04_Tree		ch04_Tree
ch05_Hash		ch05_Hash
ch06_Heap		ch06_Heap
ch07_Sort		ch07_Sort
ch08_Union_Find		ch08_Union_Find
数据结构与算法分析：C语言描述（原书第2版）课后习题		数据结构与算法分析：C语言描述（原书第2版）课后习题
README.md		README.md
_config.yml		_config.yml

slientreed/DataStructures_AlgorithmAnalysis_C

Folders and files

Latest commit

History

Repository files navigation

DataStructures_AlgorithmAnalysis_C

1. 说明

2. 内容

第1章 绪论 - 2019.8.1

第2章 算法分析 - 2019.8.1

总结：这一章对后面的算法复杂度分析会很重要，看明白神清气爽！

第3章 表,栈,队列 2019.8.8

1.表 - 2019.8.8

2.栈 - 2019.8.8

3.队列 - 2019.8.9

总结：这三个是最基础的数据结构，后面高级数据结构以及算法的实现会大量用到它们，要烂熟于心，灵活调用！

第4章 树 - 2019.8.14

4.1 树的定义实现，遍历和应用

4.2 二叉树

1. 实现：定义二叉树节点。

2. 应用：

4.3 二叉查找树

4.4 AVL平衡二叉树 - 2019.8.19

4.5. 伸展树 - 2019.8.19

4.6 B-树（M值为3，2—3树）

附加

总结：树很重要，要清清楚楚，要能从二叉树开始讲，遍历，二叉查找树，AVL，B-，红黑树。都什么特点，怎么操作，为什么不断延伸，解决什么问题能说的清楚明白。

第5章 散列Hash表 - 2019.8.23

1. Hash构成：关键字+数组

2. 散列函数：有多种不同的函数。

3. 解决冲突：分离连接，开放定址。参考网上代码

4. 可扩散列

总结：明白散列函数+解决冲突方法，就对散列清楚了，多看代码，画图分析！

6 优先队列（堆）. - 2019.8.25

1. 模型讲解

2. 二叉堆的及其实现 - 2019.8.25

3 d-堆 - 2019.8.26

4 左式堆:(代码未实现，实现可参考该博客)

5 斜堆

6 二项式队列：（代码未实现，要实现可参考该博客）

总结：1.最重要的是二叉堆，要烂熟于心这个，后面排序要用。2.左式堆，斜堆，二项队列都没实现，抽时间再来补充

第7章 排序. - 2019.8.29

1. 每种排序的介绍：具体实现代码参看这里

2. 每种排序的分析，最好/最坏/平均复杂度

总结： 现在只有这几种，对于思路，代码，还要复杂度分析，包括改进方法，一定要清清楚楚，对答如流才行！

第8章 不相交集（并查集）. - 2019.8.29

1. 等价关系

2. 基本数据结构

3. 操作

4. 之前C++学习对并查集的实现,可参考

总结： 要清晰思虑，写算法题中要会自己很快实现，并会用

9章. 图论 - (未用代码实现，抽时间一定要实现它) - (2020.1.4)

10章. 算法设计技巧

3. 总结

4. 参考

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

第1章绪论 - 2019.8.1

第2章算法分析 - 2019.8.1

第3章表,栈,队列 2019.8.8

第4章树 - 2019.8.14

第5章散列Hash表 - 2019.8.23

第7章排序. - 2019.8.29

总结：现在只有这几种，对于思路，代码，还要复杂度分析，包括改进方法，一定要清清楚楚，对答如流才行！

第8章不相交集（并查集）. - 2019.8.29

总结：要清晰思虑，写算法题中要会自己很快实现，并会用

Packages