Java NIO主要需要理解缓冲区、通道、选择器三个核心概念,作为对Java I/O的补充, 以提升大批量数据传输的效率。
(推荐教程:java课程)
学习NIO之前最好能有基础的网络编程知识
Java I/O流
Java 网络编程
Java NIO:缓冲区
通道(Channel)作为NIO的三大核心概念之一(缓冲区、通道、选择器),用于在字节缓冲区与位于通道另一侧的实体(文件或者套接字)之间有效的传输数据(核心是传输数据)
NIO编程的一般模式是:把数据填充到发送字节缓冲区 --> 通过通道发送到通道对端文件或者套接字
通道基础
使用Channel的目的是进行数据传输,使用前需要打开通道、使用后需要关闭通道
打开通道
我们知道I/O有两大类:File IO和 Stream I/O,其对应到通道也就有文件通道(FileChannel)和套接字通道(SocketChannel、ServerSocketChannel、DatagramChannel)两种
对于套接字通道,使用静态工厂方法打开
SocketChannel sc = SocketChannel.open(); ServerSocketChannel sc = ServerSocketChannel.open(); DatagramChannel sc = DatagramChannel.open();
对于文件通道只能通过对一个RandomAccessFile、FileInputStream、FileOutputStream对象调用getChannel()方法获取
FileInputStream in = new FileInputStream("/tmp/a.txt"); FileChannel fc = in.getChannel();
使用通道进行数据传输
下段代码首先将要写入的数据放到ByteBuffer中, 然后打开文件通道,把缓冲区中的数据放到文件通道。
//准备数据并放入字节缓冲区 ByteBuffer bf = ByteBuffer.allocate(1024); bf.put("i am cool".getBytes()); bf.flip(); //打开文件通道 FileOutputStream out = new FileOutputStream("/tmp/a.txt"); FileChannel fc = out.getChannel(); //数据传输 fc.write(bf); //关闭通道 fc.close();
关闭通道
如同Socket、FileInputStream等对象使用完毕之后需要关闭一样, 通道使用之后也需要关闭。一个打开的通道代表与一个特定I/O服务的特定连接并封装该连接的状态,通道关闭时连接丢失,不再连接任何东西。
阻塞 & 非阻塞模式
通道有阻塞和非阻塞两种运行模式,非阻塞模式的通道永远不会休眠,请求的操作要么立即完成,要么返回一个结果表明未进行任何操作(具体看Socket通道处的描述)。只有面向流的通道可使用非阻塞模式
文件通道
文件通道用于对文件进行访问, 通过对一个RandomAccessFile、FileInputStream、FileOutputStream对象调用getChannel()方法获取。调用getChannel方法返回一个连接到相同文件的FileChannel对象,该FileChannel对象具有与file对象相同的访问权限。
文件访问
使用文件通道的目的还是对文件进行读写操作,通道的读写api如下:
public abstract int read(ByteBuffer dst) throws IOException; public abstract int write(ByteBuffer src) throws IOException;
下面是一段读取文件的Demo
//打开文件channel RandomAccessFile f = new RandomAccessFile("/tmp/a.txt", "r"); FileChannel fc = f.getChannel(); //从channel中读取数据,直到文件尾 ByteBuffer bb = ByteBuffer.allocate(1024); while (fc.read(bb) != -1) { ; } //翻转(读之前需要先进行翻转) bb.flip(); StringBuilder builder = new StringBuilder(); //把每一个字节转为字符(ascii编码) while (bb.hasRemaining()) { builder.append((char) bb.get()); } System.out.println(builder.toString());
上面这个demo有个问题:我们只能读取字节, 然后由应用程序去解码,这个问题我们可以通过工具类Channels将通道包装成Reader和Writer来解决;当然我们也可以直接使用Java I/O流模式的Reader和Writer操作字符
文件通道位置与文件空洞
文件通道位置(position)就是普通文件的位置, position的值决定了文件中哪个位置的数据接下来将被读或者写
读取超出文件尾部位置的数据会返回-1(文件EOF)
往一个超出文件尾部的位置写入数据会造成文件空洞:比如一个文件现在有10个字节, 但是此时往position=20 处写入数据就会造成10~20之间的位置是没有数据的,这就是文件空洞
force操作
force操作强制通道将全部修改立即应用到磁盘文件(防止系统宕机导致修改丢失)
public abstract void force(boolean metaData) throws IOException;
内存文件映射
FileChannel提供了一个map()方法,该方法可以在一个打开的文件和特殊类型的ByteBuffer(MappedByteBuffer)之间建立一个虚拟内存映射。
因为map方法返回的MappedByteBuffer对象是直接缓冲区,所以通过MappedByteBuffer来操作文件非常高效(尤其是大量数据传输的情况)
MappedByteBuffer的使用
通过MappedByteBuffer读取文件
FileInputStream in = new FileInputStream("/tmp/a.txt"); FileChannel fc = in.getChannel(); MappedByteBuffer mbb = fc.map(MapMode.READ_ONLY, 0, fc.size()); StringBuilder builder = new StringBuilder(); while (mbb.hasRemaining()) { builder.append((char) mbb.get()); } System.out.println(builder.toString());
MappedByteBuffer的三种模式
READ_ONLY
READ_WRITE
PRIVATE
只读和读写模式都好理解,PRIVATE模式下写操作写的是一个临时缓冲区,不会真正去写文件。(写时拷贝思想)
Socket通道
Socket 通道可以运行在非阻塞模式且是可选择的,这两点使得对于网络编程我们不再需要为每个Socket连接创建一个线程,而是使用一个线程即可管理成百上千的Socket连接。
所有的Socket通道在实例化的时候都会创建一个对象的Socket对象, Socket通道并不负责协议相关的操作, 协议相关的操作都委派给对等socket对象(如SocketChannel对象委派给Socket对象)
非阻塞模式
相较于传统Java Socket的阻塞模式,SocketChannel提供了非阻塞模式,以构建高性能的网络应用程序
非阻塞模式下,几乎所有的操作都是立刻返回的。比如下面的SocketChannel运行在非阻塞模式下,connect操作会立即返回,如果success为true代表连接已经建立成功了, 如果success为false, 代表连接还在建立中(tcp连接需要一些时间)。
//打开Socket通道 SocketChannel ch = SocketChannel.open(); //非阻塞模式 ch.configureBlocking(false); //连接服务器 boolean success = ch.connect(InetSocketAddress.createUnresolved("127.0.0.1", 7001)); //轮训连接状态, 如果连接还未建立就可以做一些别的工作 while (!ch.finishConnect()){ //dosomething else } //连接建立, 做正事 //do something;
ServerSocketChannel
ServerSocketChannel与ServerSocket类似,只是可以运行在非阻塞模式下
下为一个通过ServerSocketChannel构建服务器的简单例子,主要体现了非阻塞模式,核心思想与ServerSocket类似
ServerSocketChannel ssc = ServerSocketChannel.open(); ssc.configureBlocking(false); ssc.bind(new InetSocketAddress(7001)); while (true){ SocketChannel sc = ssc.accept(); if(sc != null){ handle(sc); }else { Thread.sleep(1000); } }
SocketChannel 与 DatagramChannel
SocketChannel 对应 Socket, 模拟TCP协议;DatagramChannel对应DatagramSocket, 模拟UDP协议
二者的使用与SeverSocketChannel大同小异,看API即可
工具类
文体通道那里我们提到过, 通过只能操作字节缓冲区, 编解码需要应用程序自己实现。如果我们想在通道上直接操作字符,我们就需要使用工具类Channels,工具类Channels提供了通道与流互相转换、通道转换为阅读器书写器的能力,具体API入下
//通道 --> 输入输出流 public static OutputStream newOutputStream(final WritableByteChannel ch); public static InputStream newInputStream(final AsynchronousByteChannel ch); //输入输出流 --> 通道 public static ReadableByteChannel newChannel(final InputStream in); public static WritableByteChannel newChannel(final OutputStream out); //通道 --> 阅读器书写器 public static Reader newReader(ReadableByteChannel ch, String csName); public static Writer newWriter(WritableByteChannel ch, String csName);
通过将通道转换为阅读器、书写器我们就可以直接在通道上操作字符。
RandomAccessFile f = new RandomAccessFile("/tmp/a.txt", "r"); FileChannel fc = f.getChannel(); //通道转换为阅读器,UTF-8编码 Reader reader = Channels.newReader(fc, "UTF-8"); int i = 0, s = 0; char[] buff = new char[1024]; while ((i = reader.read(buff, s, 1024 - s)) != -1) { s += i; } for (i = 0; i总结
通道主要分为文件通道和套接字通道。
对于文件操作:如果是大文件使用通道的文件内存映射特性(MappedByteBuffer)来有利于提升传输性能, 否则我更倾向传统的I/O流模式(字符API);对于套接字操作, 使用通道可以运行在非阻塞模式并且是可选择的,利于构建高性能网络应用程序。