Java面试题-基础知识

本文来源于清英的一篇文章：你应该知道的JAVA面试题，最近自己也在面试一些候选人，发现这篇文章中的有些点我也拿不准，因此按照自己的理解整理一份参考回答。

基础题目

1. Java线程的状态

Java线程在某个时刻只能处于以下六个状态中的一个。 – New（新创建），一个线程刚刚被创建出来，还没有开始运行的状态，更通俗点说：还没有调用start方法； – Runnable（可运行），可以在Java虚拟机中运行的状态；一个可运行的线程可能正在运行自己的代码也可能没有，这取决于操作系统提供的时间片； – Blocked（被阻塞），当一个线程试图获取一个内部的对象锁（不是java.util.concurrent库中的锁），而该锁此时正被其他线程持有，则该线程进入阻塞状态； – Waiting（等待），当线程等待另一个线程通知调度器一个条件时，它自己进入等待状态。在调用Object.wait方法或Thread.join方法，或者是等待java.util.concurrent库中的Lock或Condition时，就会出现这种情况； – Timed waiting（计时等待），Object.wait、Thread.join、Lock.tryLock和Condition.await等方法有超时参数，还有Thread.sleep方法、LockSupport.parkNanos方法和LockSupport.parkUntil方法，这些方法会导致线程进入计时等待状态，如果超时或者出现通知，都会切换会可运行状态； – Terminated（被终止），因为run方法正常退出而死亡，或者因为没有捕获的异常终止了run方法而死亡。

Java线程状态.png

参考资料： – Java Platform SE 8文档 – Java核心技术卷I—P634

2. 进程与线程的区别，进程间如何通讯，线程间如何通讯？

在并发编程领域，有进程和线程两个概念，在Java语言中说起并发编程，常常是指多线程，但是了解进程的概念也非常重要： – 进程是操作系统的资源调度实体，有自己的内存地址空间和运行环境； – 线程一般被称为轻量级的进程，线程和进程一样，也有自己的运行环境，但是创建一个线程要需要的资源比创建一个进程要少。线程存在于进程之中——每个进程至少有一个线程。一个进程下的多个线程之间可以共享进程的资源，包括内存空间和打开的文件。 – 进程跟程序（programs）、应用（applications）具备相同的含义，进程间通讯依靠IPC资源，例如管道（pipes）、套接字（sockets）等； – 线程间通讯依靠JVM提供的API，例如wait方法、notify方法和notifyAll方法，线程间还可以通过共享的主内存来进行值的传递；

参考资料： – Oracle Java Doc——进程和线程

3. HashMap的数据结构是什么？如何实现的？和HashTable、ConcurrentHashMap的区别？

在Java 8中，HashMap的数据结构是由Node<k,v>作为元素组成的数组：（1）如果有多个值hash到同一个桶中，则组织成一个链表，而且，当这个链表的节点个数超过某个值（TREEIFY_THRESHOLD参数指定）时，则将这个链表重构为一个二叉树；（2）如果发现map中的元素个数超过了threshold，则进行空间扩容——二倍空间。</k,v>
HashMap和HashTable的数据结构和操作基本相同，区别是前者是非线程安全，并且HashMap接受value为null。
ConcurrentHashMap和HashTable一样，都是线程安全的，但是区别是：HashTable每次操作都会锁住整个表结构——导致一次只能有一个线程访问HashTable对象，而ConcurrentHashMap不会，只会锁住某个节点，只有在涉及到size的操作时才会锁整个表结构。
参考资料：《Java并发编程实战》 ### 4. Cookie和Session的区别 HTTP是无状态协议，但是在实际应用中有跟踪客户端状态的需求，Cookie和Session是两种不同的实现方案。
Cookie保存在客户端，Session保存在服务端
Cookie没有Session安全，侵入者可以通过分析客户端的cookie信息侵入网站；
使用Session存储重要信息，使用Cookie存储不那么重要的信息；
使用Session方案时，常常需要依赖Cookie传递SID的值，如果客户端禁用了Cookie，则转而采取URL重写技术（但是这种技术有安全风险）；
参考资料：What is the difference between Sessions and Cookies in PHP?

5. 索引有什么用？如何建索引？

索引的作用：索引是一种数据结构，用于加快mysql获取数据的速度；
如何建索引？在使用InnoDB引擎的前提下讨论：（1）最左前缀原理：分析业务中的查询条件，区分度高的字段放在前面，尽量减少一条SQL的影响行数；（2）A+B可以代替A，A+B+C可以代替A+B，如果查询是A+C则只能使用到A列索引；
- 关于InnoDB的认识：InnoDB使用B+Tree作为存储数据结构，属于聚簇索引，每个辅助索引最后都会指向主键的值，每次查询两次；（4）由于聚簇索引的特性，建议在使用InnoDB引擎的时候，使用自增ID作为主键，不要使用随机的业务列作为主键。
参考资料
- 曹神的文章：如何应对索引
- MySQL索引背后的数据结构及算法原理

6. ArrayList是如何实现的，ArrayList和LinkedList的区别？ArrayList如何实现扩容？

可变数组实现了List接口的所有操作，功能上跟Vector相同，区别是Vector是线程安全的；
区别：LinkedList实现了List和Deque接口，一般称为双向链表；LinkedList在插入和删除数据时效率更高，ArrayList在查找某个index的数据时效率更高；LinkedList比ArrayList需要更多的内存；
关于可变数组的扩容策略，可以查看源码，不同的JDK实现不太一样，我这里使用JDK 8：首先尝试扩容为原来大小的二倍，如果newCapacity还不够大，则再扩大为minCapacity值；如果newCapacity比数组的规定最大容量还大，则根据minCapacity的值进行定夺，参见hugeCapacity方法。 “` private static final int MAXARRAYSIZE = Integer.MAXVALUE – 8 /** * Increases the capacity to ensure that it can hold at least the * number of elements specified by the minimum capacity argument. * * @param minCapacity the desired minimum capacity */ private void grow(int minCapacity) { // overflow-conscious code int oldCapacity = elementData.length; int newCapacity = oldCapacity + (oldCapacity >> 1); if (newCapacity – minCapacity < 0) newCapacity = minCapacity; if (newCapacity – MAXARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); // minCapacity is usually close to size, so this is a win: elementData = Arrays.copyOf(elementData, newCapacity); }private static int hugeCapacity(int minCapacity) { if (minCapacity < 0) // overflow throw new OutOfMemoryError(); return (minCapacity > MAXARRAYSIZE) ? Integer.MAXVALUE : MAXARRAY_SIZE; } “`
在代码中，如果预先知道需要增加大量元素，则可以提前对当前的可变数组调用ensureCapacity方法，可以避免多次递增的内存重新分配；
参考资料：
- Java 8 DOC-LinkedList
- Java 8 DOC-ArrayList
- JDK 1.8中ArrayList的源码

7. equals、hashcode等Object类中一些方法的讨论？

覆写equals方法的时候，也必须覆写hashcode方法；
编写equals方法后，检查是否符合：对称性、传递性、一致性、自反性和非空性
参考资料
- 《Effective Java 中文第二版》
- Java doc – Object#equals

8. 面向对象

三大特性
- 封装
- 继承
- 多态

9. JVM如何加载字节码文件？

虚拟机把描述类的数据从Class文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可被虚拟机直接使用的Java类型，这就是虚拟机的类加载机制。

Java语言中类的加载、连接和初始化过程都是在程序运行期间完成的，领Java具备高度的灵活性。

类加载的过程：加载、连接（验证、准备、解析）、初始化。 – 加载：通过一个类的名字获取此类的二进制字节流（PS：不限于从文件中读取）；将这个字节流代表的静态存储结构转换为方法区的运行时结构（由具体的虚拟机自己定义）；在内存中生成一个java.lang.Class对象，作为方法区这个类的各种数据结构的访问入口。 – 验证：文件格式验证、元数据验证（语义分析，类与类的继承关系等）、字节码验证（数据流和控制流分析）、符号引用验证（对类自身以外的信息进行匹配校验） – 准备：正式为类变量分配内存并设置初始值，这里类变量指的是被static修饰的变量。例外：如果类字段是常量，则在这里会被初始化为表达式指定的值。 – 解析：将常量池内的符号引用替换为直接引用。符号引用：类似于OS中的逻辑地址；直接引用：类似于OS中的物理地址，直接指向目标的指针、相对偏移量或一个能间接定位到目标的句柄。 – 初始化：真正开始执行类中定义的Java程序代码；初始化用于执行Java类的构造方法。类初始化的过程是不可逆的，如果中间一步出错，则无法执行下一步，参见不可逆的类初始化过程。

10. GC算法

垃圾回收解决三个问题：哪些内存需要回收？什么时候回收？如何回收？
垃圾回收关注的是堆内存（heap）；
常见的垃圾收集算法
- 标记-清除算法
- 复制算法
- 标记-整理算法
- 分代收集算法

11. 什么情况下回出现Full GC，什么情况下会出现Young GC

对象优先在新生代Eden区中分配，如果Eden区没有足够的空间时，就会触发一次young gc
Full gc的触发条件有多个，FULL GC的时候会STOP THE WORD。
- 在执行Young gc之前，JVM会进行空间分配担保——如果老年代的连续空间小于新生代对象的总大小（或历次晋升的平均大小），则触发一次full gc。
- 显式调用System.gc()方法时；
- 大对象直接进入老年代，从年轻代晋升上来的老对象，尝试在老年代分配内存时，但是老年代内存空间不够；

12. JVM内存模型

– Java虚拟机规范定义Java内存模型，尝试屏蔽掉各种硬件和操作系统的访问差异； – JVM内存模型的目标：定义程序中各个变量的访问规则，即在虚拟机中将变量存储到内存和从内存取出来这样的细节； – volatile关键字：当一个变量用volatile关键字限定后，会有两个语义：（1）当这个变量的值被修改后，会立即刷新到主内存中，对其他线程可见；当某个线程读取这个变量的时候，也会重新将主内存中的数据刷一份到工作内存中来。但是，如果多线程操作这个变量的计算中，后一个值依赖前一个值，就还是会有并发问题，说明volatile不具备原子性；（2）禁止指令重排优化，观察voatile变量对应的字节码文件，会发现变量的操作指令后面加了一句lock addl $0x0,(%esp)的操作，这个操作相当于一个内存屏障。 – synchronized关键字：当一个线程对一个变量加锁的时候，就会清空这个变量在当前工作内存中的值，因此该关键字同时满足了可见性和原子性。 – 参考资料 – 程晓明：深入理解JVM内存模型1 – 《深入理解JVM虚拟机》 – 《Java并发编程实战》

13. Java运行时数据区

Java虚拟机运行时数据区 – 程序计数器（PC）：Java线程私有，类似于操作系统里的PC计数器，用于指定下一条需要执行的字节码的地址； – Java虚拟机栈：Java线程私有，虚拟机展描述的是Java方法执行的内存模型：每个方法在执行的时候，都会创建一个栈帧用于存储局部变量、操作数、动态链接、方法出口等信息；每个方法调用都意味着一个栈帧在虚拟机栈中入栈到出栈的过程； – 本地方法栈：和Java虚拟机栈的作用类似，区别是该该区域为JVM调用到的本地方法服务； – 堆（Heap）：所有线程共享的一块区域，垃圾收集器管理的主要区域。目前主要的垃圾回收算法都是分代收集，因此该区域还可以细分为如下区域： – 年轻代 – Eden空间 – From Survivor空间1，From Survivor空间2，用于存储在Young gc过程中幸存的对象； – 老年代 – 方法区：各个线程共享的一个区域，用于存储虚拟机加载的类信息、常量、静态变量等信息； – 运行时常量池：方法区的一部分，用于存放编译器生成的各种字面量和符号引用；

14. 事务的实现原理

事务的特性：ACID——原子性、一致性、隔离性和持久性
Spring中的事务管理？Spring事务管理那些事
MySQL中的事务？事务的隔离级别和锁，参考何登成的MySQL的加锁处理分析

原创文章，转载请注明： 转载自并发编程网 – ifeve.com本文链接地址: Java面试题-基础知识

并发编程网 - ifeve.com

让天下没有难学的技术