0%

数据结构学习笔记 - 06 二分搜索树

关于树结构

计算机中的文件夹系统,现实生活中的图书馆、公司组织架构等,都是树结构。

树结构相比线性结构的一大优势就是将查找效率由 O(n) 提升到了 O(lgn),因为我们往往只需顺着树的一支就能找的我们需要的元素了。

二叉树介绍

  • 二叉树名词:左孩子、右孩子、左子树、右子树、父亲节点、叶子节点;
  • 二叉树具有唯一根节点;
  • 每个节点最多有两个孩子节点;每个节点最多有一个父亲节点;
  • 二叉树具有天然递归性,左子树、右子树都是一个二叉树;
  • 二叉树不一定是满的,一个链表、一个根节点、甚至空都可以看作是一棵二叉树;

二分搜索树介绍

BST 即 Binary Search Tree 二分搜索树。

二分搜索树特点:

  • 首先是一棵二叉树;
  • 二分搜索树每一个节点的值都大于其左子树中所有节点的值,都小于其右子树中所有节点的值。二分搜索树具有顺序性。
  • 所存储的元素必须具有可比较性。
  • 不必是一棵完全二叉树,更不必是满二叉树。
1
2
3
4
5
6
7
8

// 这就是一棵二分搜索树。

41
/ \
22 58
/ \ \
15 40 61

所以,当我们在二分搜索树中查找一个元素的时候,只需从根节点开始比较即可,并不需要对所有元素进行遍历。

二分搜索树的实现

这里这个二分搜索树需要满足泛型,同时,这个类型必须是可比较的,因此,这个类型 E 需要满足 Comparable 这个接口。类似地,可以和 Swift 中的协议做对比。

我们实现的这个二分搜索树不包含重复元素。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
public class BST<E extends Comparable<E>> {

// 在类的内部定义一个二分搜索树的节点类
private class Node {
public E e;
public Node left, right;

public Node(E e) {
this.e = e;
left = null;
right = null;
}
}

// 根节点
private Node root;
// 元素数量
private int size;

public BST() {
root = null;
size = 0;
}

public int size() {
return size;
}

public boolean isEmpty() {
return size == 0;
}

/**
* 给树添加新元素。
*/
public void add(E e) {

// if (root == null) {
// root = new Node(e);
// size++;
// } else {
// add(root, e);
// }

// 改进后
root = add(root, e);
}

/**
* 向以 node 为根的二分搜索树中插入元素 E, 递归算法。
*/
// private void add(Node node, E e) {
// if (e.equals(node.e)) {
// return;
// } else if (e.compareTo(node.e) < 0 && node.left == null) {
// node.left = new Node(e);
// size++;
// return;
// } else if (e.compareTo(node.e) > 0 && node.right == null) {
// node.right = new Node(e);
// size++;
// return;
// }

// if (e.compareTo(node.e) < 0) {
// add(node.left, e);
// } else {
// add(node.right, e);
// }
// }

/**
* 改进后的递归函数。
*/
private Node add(Node node, E e) {

if (node == null) {
size++;
return new Node(e);
}

if (e.compareTo(node.e) < 0) {
node.left = add(node.left, e);
} else if (e.compareTo(node.e) > 0) {
node.right = add(node.right, e);
}

return node;
}

/**
* 查看二分搜索树中是否包含元素 e
*/
public boolean contains(E e) {
return contains(root, e);
}

/**
* 私有的递归方法。
*/
private boolean contains(Node node, E e) {

if (node == null) {
return false;
}

if (e.compareTo(node.e) == 0) {
return true;
} else if (e.compareTo(node.e) < 0) {
return contains(node.left, e);
} else {
return contains(node.right, e);
}
}

/**
* 二分搜索树的前序遍历。
* 前序遍历就是先访问节点,然后访问左右子树。
*/
public void preOrder() {
preOrder(root);
}

/**
* 二分搜索树前序遍历私有递归方法。
*/
private void preOrder(Node node) {

if (node == null) {
return;
}

System.out.println(node.e);

preOrder(node.left);
preOrder(node.right);
}

/**
* 非递归写法的前序遍历。
*/
public void preOrderNR() {
Stack<Node> stack = new Stack<>();

stack.push(root);

while (!stack.isEmpty()) {
Node cur = stack.pop();
System.out.println(cur.e);

if (cur.right != null) {
stack.push(cur.right);
}
if (cur.left != null) {
stack.push(cur.left);
}
}
}

/**
* 二分搜索树的中序遍历。中序遍历最重要的特点就是,它就是元素从小到大的排序。
* 中序遍历就是先遍历左子树,再遍历根节点,再遍历右子树。
*/
public void inOrder() {
inOrder(root);
}

/**
* 中序遍历递归方法。
*/
private void inOrder(Node node) {
if (node == null) {
return;
}

inOrder(node.left);
System.out.println(node.e);
inOrder(node.right);
}

/**
* 二分搜索树的后序遍历。
* 后序遍历就是先遍历左右子树,再遍历根节点。
* 后序遍历的一个应用是为二分搜索树释放内存。
*/
public void postOrder() {
postOrder(root);
}

private void postOrder(Node node) {
if (node == null) {
return;
}

inOrder(node.left);
inOrder(node.right);
System.out.println(node.e);
}

/**
* 层序遍历。顾名思义,就是从跟节点开始一层一层遍历,每层从左到右。
* 层序遍历一般使用非递归的算法完成,需要使用队列。这也是队列的一个不错的应用。
*
* 前序遍历、中序遍历、后序遍历都是深度优先遍历,而层序遍历是广度优先遍历。
*/
public void levelOrder() {
Queue<Node> q = new LinkedList<>();
q.add(root);

while (!q.isEmpty()) {
Node cur = q.remove();
System.out.println(cur.e);

if (cur.left != null) {
q.add(cur.left);
}

if (cur.right != null) {
q.add(cur.right);
}
}
}

/**
* 寻找二分搜索树的最小元素。
*/
public E minimum() {
if (size == 0) {
throw new IllegalArgumentException("BST is empty");
}

return minimum(root).e;
}

private Node minimum(Node node) {

if (node.left == null) {
return node;
}

return minimum(node.left);
}

/**
* 寻找二分搜索树的最大元素。
*/
public E maximum() {
if (size == 0) {
throw new IllegalArgumentException("BST is empty.");
}

return maximum(root).e;
}

private Node maximum(Node node) {

if (node.right == null) {
return node;
}

return maximum(node.right);
}

/**
* 从二分搜索树中删除最小值所在的节点,返回最小值。
* 注意点就是,如果最小值所在节点还存在右子树的话,需要把右子树的根节点接到该节点的位置。
*/
public E removeMin() {
E ret = minimum();

root = removeMin(root);

return ret;
}

/**
* 删除以 node 为根的二分搜索树的最小节点,并返回删除节点后新的二分搜索树的根
*/
private Node removeMin(Node node) {

if (node.left == null) {
Node rightNode = node.right;
node.right = null;
size--;
return rightNode;
}

node.left = removeMin(node.left);
return node;
}

/**
* 从二分搜索树中删除最大值所在的节点,返回最大值。
* 注意点就是,如果最大值所在节点还存在左子树的话,需要把左子树的根节点接到该节点的位置。
*/
public E removeMax() {
E ret = maximum();

root = removeMax(root);

return ret;
}

/**
* 删除以 node 为根的二分搜索树的最大节点,并返回删除节点后新的二分搜索树的根
*/
private Node removeMax(Node node) {

if (node.right == null) {

// Java 里类的赋值是完全拷贝?
Node leftNode = node.left;
node.left = null;
size--;
return leftNode;
}

node.right = removeMin(node.right);
return node;
}

/**
* 从二分搜索树中删除元素为 e 的节点。
*/
public void remove(E e) {
root = remove(root, e);
}

private Node remove(Node node, E e) {
if (node == null) {
return null;
}

if (e.compareTo(node.e) < 0) {
node.left = remove(node.left, e);
return node;
} else if (e.compareTo(node.e) > 0) {
node.right = remove(node.right, e);
return node;
} else {
// 待删除节点右子树为空
if (node.left == null) {
Node rightNode = node.right;
node.right = null;
size--;
return rightNode;
}

// 待删除节点右子树为空
if (node.right == null) {
Node leftNode = node.left;
node.left = null;
size--;
return leftNode;
}

// 待删除节点左右子树均不为空
// 找到比待删除节点大的最小节点,即待删除节点右子树的最小节点,也就是这个节点的后继(相应也有前驱的概念)。
// 用这个节点顶替待删除节点的位置。
Node successor = minimum(node.right);
successor.right = removeMin(node.right);
successor.left = node.left;

node.left = node.right = null;

return successor;
}
}

@Override
public String toString() {
StringBuilder res = new StringBuilder();

generateBSTString(root, 0, res);
return res.toString();
}

// 生成以 node 为根节点,深度为 depth 的描述二叉树的字符串。
private void generateBSTString(Node node, int depth, StringBuilder res) {

if (node == null) {
res.append(generateDepthString(depth) + "null\n");
return;
}

res.append(generateDepthString(depth) + node.e + "\n");
generateBSTString(node.left, depth + 1, res);
generateBSTString(node.right, depth + 1, res);
}

private String generateDepthString(int depth) {
StringBuilder res = new StringBuilder();

for (int i = 0; i < depth; i++) {
res.append("--");
}

return res.toString();
}
}

二分搜索树的遍历

  • 前序遍历:先根节点,再左右子树。非递归可使用栈辅助实现。
  • 中序遍历:先左子树、再根节点、再右子树。中序遍历正好元素从小到大的排序顺序。
  • 后序遍历:先左右子树,再根节点。应用场景是内存释放,必须先把孩子节点释放才能释放该节点本身。
  • 层序遍历:从根节点开始一层一层遍历。非递归可使用队列辅助实现。