面试内容整理—数据结构

重要参考链接https://juejin.im/post/58ca051f61ff4b0060165122

堆与栈(http://blog.csdn.net/hairetz/article/details/4141043/)

栈区（stack）由编译器自动分配释放，存放方法（函数）的参数值，局部变量的值等。
堆区（heap）一般由程序员分配与释放，若程序员不释放，则会内存溢出。
栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。
堆：首先应该知道操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序，另外，对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的delete语句才能正确的释放本内存空间。
另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。
栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。
堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

hashmap的基础数据结构

HashMap基于hashing原理，我们通过put()和get()方法储存和获取对象。当我们将键值对传递给put()方法时，它调用键对象的hashCode()方法来计算hashcode，让后找到bucket位置来储存值对象。当获取对象时，通过键对象的equals()方法找到正确的键值对，然后返回值对象。HashMap使用LinkedList来解决碰撞问题，当发生碰撞了，对象将会储存在LinkedList的下一个节点中。 HashMap在每个LinkedList节点中储存键值对对象。

循环队列

循环队列的优点：

　　可以有效的利用资源。用数组实现队列时，如果不移动，随着数据的不断读写，会出现假满队列的情况。即尾数组已满但头数组还是空的；循环队列也是一种数组，只是它在逻辑上把数组的头和尾相连，形成循环队列，当数组尾满的时候，要判断数组头是否为空，不为空继续存放数据。

循环队列的缺点：

　　循环队列中，由于入队时尾指针向前追赶头指针；出队时头指针向前追赶尾指针，造成队空和队满时头尾指针均相等。因此，无法通过条件front==rear来判别队列是”空”是”满”。

解决这个问题有两个办法：一是增加一个参数，用来记录数组中当前元素的个数；第二个办法是，少用一个存储空间，也就是数组的最后一个存数空间不用，当（rear+1）%maxsiz=front时，队列满

栈结构与队列的区别？

栈（stack）：限定只能在表的一端进行插入和删除操作的线性表。
队列（queue）：限定只能在表的一端插入和在另一端进行删除操作的线性表。
1）队列先进先出，栈先进后出。
2）对插入和删除操作的“限定”不同。
3）遍历数据速度不同。队列遍历数据的速度要快得多。

二叉树的深度优先遍历(递归与非递归（非递归后序最难））

写出一次快排后的具体变化情况

什么是红黑树。

红黑树是每个节点都带有颜色属性的二叉查找树，颜色或红色或黑色。在二叉查找树强制一般要求以外，对于任何有效的红黑树我们增加了如下的额外要求:
性质1. 节点是红色或黑色。
性质2. 根节点是黑色。
性质3 每个叶节点（NIL节点，空节点）是黑色的。
性质4 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
性质5. 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。
这些约束强制了红黑树的关键性质: 从根到叶子的最长的可能路径不多于最短的可能路径的两倍长。结果是这个树大致上是平衡的。因为操作比如插入、删除和查找某个值的最坏情况时间都要求与树的高度成比例，这个在高度上的理论上限允许红黑树在最坏情况下都是高效的，而不同于普通的二叉查找树。

红黑树的插入和删除

写一个快排。

Quick Sort是目前已知最快的排序法，平均复杂度为O(NlogN)，可是最坏情况下将达O(N^2)。
Quick Sort算法可以叙述如下。假设S代表将被处理的序列：
1、如果S的元素个数为0或1，结束。
2、取S中的任何一个元素，当做枢轴(pivot) v。
3、将S分割为L、R两段，使L内的每一个元素都小于或等于v，R内的每一个元素都大于或等于v。
4、对L、R递归执行Quick Sort。

一个单链表怎么判断有没有环？环的起点怎么找？如何找出环的连接点在哪里？带环链表的长度是多少？

1、对于问题1，使用追赶的方法，设定两个指针slow、fast，从头指针开始，每次分别前进1步、2步。如存在环，则两者相遇；如不存在环，fast遇到NULL退出。
2、对于问题2，记录下问题1的碰撞点p，slow、fast从该点开始，再次碰撞所走过的操作数就是环的长度s。
3、问题3：有定理：碰撞点p到连接点的距离=头指针到连接点的距离，因此，分别从碰撞点、头指针开始走，相遇的那个点就是连接点。
该定理的证明可参考：http://fayaa.com/tiku/view/7/
4、问题3中已经求出连接点距离头指针的长度，加上问题2中求出的环的长度，二者之和就是带环单链表的长度

哈希表解决冲突的方法

开放定址法（当关键字key的哈希地址p=H（key）出现冲突时，以p为基础，产生另一个哈希地址p1，如果p1仍然冲突，再以p为基础，产生另一个哈希地址p2，…，直到找出一个不冲突的哈希地址pi ，将相应元素存入其中，线性探测再散列，二次探测再散列，伪随机探测再散列）
再哈希法（这种方法是同时构造多个不同的哈希函数）
链地址法（这种方法的基本思想是将所有哈希地址为i的元素构成一个称为同义词链的单链表）
建立一个公共溢出区（将哈希表分为基本表和溢出表两部分，凡是和基本表发生冲突的元素，一律填入溢出表）
散列表查找的复杂度
O(1)
动态规划，最长公共子串等最长递增子序列（nlogn的算法）
http://blog.csdn.net/joylnwang/article/details/6766317
排序：快排、归并、堆，时间复杂度是一样的，有什么区别？为什么平均情况下快排最快？
给定一棵树，除左右节点外，还有一个random域，不一定指向哪，可能是空节点，可能是树中的其他节点，做树拷贝。
大整数加、减、乘、除、求模运算实现
二叉查找
二叉搜索树
Top(k)
1.将输入内容（假设用数组存放）进行完全排序，从中选出排在前K的元素即为所求。有了这个思路，我们可以选择相应的排序算法进行处理，目前来看快速排序，堆排序和归并排序都能达到O(nlogn)的时间复杂度。
```
2.对输入内容进行部分排序，即只对前K大的元素进行排序（这K个元素即为所求）。此时我们可以选择冒泡排序或选择排序进行处理，即每次冒泡（选择）都能找到所求的一个元素。这类策略的时间复杂度是O(Kn)。
3.对输入内容不进行排序，显而易见，这种策略将会有更好的性能开销。我们此时可以选择两种策略进行处理：
        a)利用小根堆维护一个大小为K的数组，目前该小根堆中的元素是排名前K的数，其中根是最小的数。此后，每次从原数组中取一个元素与根进行比较，如大于根的元素，则将根元素替换并进行堆调整（下沉），即保证小根堆中的元素仍然是排名前K的数，且根元素仍然最小；否则不予处理，取下一个数组元素继续该过程。该算法的时间复杂度是O(nlogK)，一般来说企业中都采用该策略处理top-K问题，因为该算法不需要一次将原数组中的内容全部加载到内存中，而这正是海量数据处理必然会面临的一个关卡。
        b)利用快速排序的分划函数找到分划位置K，则其前面的内容即为所求。该算法是一种非常有效的处理方式，时间复杂度是O(n)。对于能一次加载到内存中的数组，该策略非常优秀。
```
单链表翻转（两个指针如何实现）、查找、删除、插入以及双向链表、有序链表合并
判断一个整数是否是2的整数次幂.
(n&(n-1))
数组中只有一个数出现了两次，求这个数，并使得空间效率最优（用位图bitmap，比O（n）的线性空间更优）
位运算
利用异或的特性，x^y^x=y^x^x=y
二分查找（注意边界条件）
二分查找算法的填空（PS：注意陷阱：数会溢出的问题）
定中间值的时候写错了 mind = low+high/2 ，后面回来一查，说这样子会溢出 low+high 会越界溢出，查阅相关资料 mind = low+（high-low）>>1，这样才可以，果然，哪里有这么简单的题目…注意陷阱……
常见排序算法的实现以及稳定性（快排跟归并考的很多）
字符串翻转（O(n)）、匹配（KMP算法）
指定一个数组，求2个数的和等于指定的和（某一个数），如果是3,4,5，n个等于个的和（某一个数）呢？（可以看作背包问题）
跳台阶问题
一堆数据怎么找中位数（分两种，内存是不是能一次装下所用数据，能的话用快排，不能用分桶）
http://blog.csdn.net/jiyanfeng1/article/details/8088237
找出一个字符串中只出现一次且是第一个的字符
建立一个hash表，遍历一遍字符串，记录每个字符出现的次数
在不使用额外空间的情况下，交换两个数？
位操作（异或）或者加减

呼呼呼山(http://code4fun.me)
18 Sep 2017 9:04 PM

重要参考链接https://juejin.im/post/58ca051f61ff4b0060165122

堆与栈(http://blog.csdn.net/hairetz/article/details/4141043/)

hashmap的基础数据结构

循环队列

循环队列的优点：

循环队列的缺点：

栈结构与队列的区别？

二叉树的深度优先遍历(递归与非递归（非递归后序最难））

写出一次快排后的具体变化情况

什么是红黑树。

红黑树的插入和删除

写一个快排。

一个单链表怎么判断有没有环？环的起点怎么找？ 如何找出环的连接点在哪里？带环链表的长度是多少？

哈希表解决冲突的方法

散列表查找的复杂度

动态规划，最长公共子串等 最长递增子序列（nlogn的算法）

排序：快排、归并、堆，时间复杂度是一样的，有什么区别？为什么平均情况下快排最快？

给定一棵树，除左右节点外，还有一个random域，不一定指向哪，可能是空节点，可能是树中的其他节点，做树拷贝。

大整数加、减、乘、除、求模运算实现

二叉查找

二叉搜索树

Top(k)

单链表翻转（两个指针如何实现）、查找、删除、插入以及双向链表、有序链表合并

判断一个整数是否是2的整数次幂.

数组中只有一个数出现了两次，求这个数，并使得空间效率最优（用位图bitmap，比O（n）的线性空间更优）

二分查找（注意边界条件）

常见排序算法的实现以及稳定性（快排跟归并考的很多）

字符串翻转（O(n)）、匹配（KMP算法）

指定一个数组，求2个数的和等于指定的和（某一个数），如果是3,4,5，n个等于个的和（某一个数）呢？（可以看作背包问题）

跳台阶问题

一堆数据怎么找中位数（分两种，内存是不是能一次装下所用数据，能的话用快排，不能用分桶）

找出一个字符串中只出现一次且是第一个的字符

在不使用额外空间的情况下，交换两个数？

一个单链表怎么判断有没有环？环的起点怎么找？如何找出环的连接点在哪里？带环链表的长度是多少？

动态规划，最长公共子串等最长递增子序列（nlogn的算法）