图片来源自网络,保持更新;更多内容请关注 cnblogs.com/xuyaowen
所以后面的讨论基本上是讨论IO相关的系统调用和文件系统Page Cache的一些机制。 Linux内核中的IO栈 这一小节来看Linux内核的IO栈的结构。 先上一张全貌图[4]: 由图可见,从系统调用的接口再往下,Linux下的IO栈致大致有三个层次: 文件系统层,以 write 为例,内核拷贝了write参数指定的用户态数据到文件系统Cache中,并适时向下层同步 块层,管理块设备的IO队列,对IO请求进行合并、排序(还记得操作系统课程学习过的IO调度算法吗?) 设备层,通过DMA与内存直接交互,完成数据和具体设备之间的交互 结合这个图,想想Linux系统编程里用到的Buffered IO、mmap、Direct IO,这些机制怎么和Linux IO栈联系起来呢 除了传统的Buffered IO可以比较自由的用偏移+长度的方式读写文件之外,mmap和Direct IO均有数据按页对齐的要求,Direct IO还限制读写必须是底层存储设备块大小的整数倍(甚至Linux
由图可见,从系统调用的接口再往下,Linux下的IO栈致大致有三个层次: 文件系统层,以 write(2) 为例,内核拷贝了write(2)参数指定的用户态数据到文件系统Cache中,并适时向下层同步 块层,管理块设备的IO队列,对IO请求进行合并、排序(还记得操作系统课程学习过的IO调度算法吗?) 设备层,通过DMA与内存直接交互,完成数据和具体设备之间的交互 结合这个图,想想Linux系统编程里用到的Buffered IO、mmap(2)、Direct IO,这些机制怎么和Linux IO栈联系起来呢 那Direct IO做了什么?这个机制更狠,直接让用户态和块IO层对接,直接放弃Page Cache,从磁盘直接和用户态拷贝数据。好处是什么? 除了传统的Buffered IO可以比较自由的用偏移+长度的方式读写文件之外,mmap(2)和Direct IO均有数据按页对齐的要求,Direct IO还限制读写必须是底层存储设备块大小的整数倍(甚至
作者简介 廖威雄,就职于珠海全志科技股份有限公司,负责Linux IO全栈研发、性能优化、开源社区开发交流、Linux 内核开源社区pstore/blk,mtdpstore模块的作者(与maintainer 由于认知的局限性,如有考虑不周的地方,希望一起交流学习 整体认识IO栈 如果有完整的IO栈的认识,无疑有助于更细腻的优化IO。循着IO栈从上往下的顺序,我们逐层分析可优化的地方。 在网上有Linux完整的IO栈结构图,但太过完整反而不容易理解。按我的认识,简化过后的IO栈应该是下图的模样。 ? 用户空间:除了用户自己的APP之外,也隐含了所有的库,例如常见的C库。 根据这个流程,考虑到我没要到KVM host的权限,我只能着手从Guest端的IO栈做优化,具体包括以下几个方面: 交换分区(swap) 文件系统(ext4) 页缓存(Page Cache) Request 层(IO调度算法) 由于源码以及编译的临时文件都不大但数量极其多,对随机IO的要求非常高。
明白了栈的基本操作后,我们需要去深入地思考一下,栈是如何工作的。换句话说,为了使栈这个数据结构按照栈的方式去工作,它需要什么? 1)栈需要有一个指针,我们称之为 TOP,用它来指向栈中最顶部的那个元素。 2)当我们初始化一个栈的时候,我们把 TOP 的值设置为 -1,这样我们就可以通过 TOP == -1 来判断栈是否为空。 空栈的时候,TOP 等于 -1;把元素 1 压入栈中的时候,stack[0] 为 1,TOP 加 1 变为 0;把元素 2 压入栈中的时候,stack[1] 为 2,TOP 加 1 变为 1;把元素 3 假设栈中的元素是 int 类型,我们可以用 Java 语言来自定义一个最简单的栈。 3)用于浏览器:浏览器的后退按钮会把我们访问的 URL 压入一个栈中,每次我们访问一个新的页面,新的 URL 就压入了栈的顶部,当我们点了后退按钮,最新的那个 URL 就从栈中移除,之前的那个 URL
VxWorks provides a standard I/O package (stdio.h) with full ANSI C support that is compatible with the UNIX and Windows standard I/O packages.
标准代码(try-with-source) import java.io.*; public class TestIO { public static void main(String[] args) 2.2 IO中的装饰器模式 ? 3. (2)字符流和字节流的区别 ①字节流操作本身用不到缓冲区(内存),直接与文件进行操作;字符流有缓冲区,写后需要flush(close后会自动flush) ②使用io流时,先考虑目标对象是字节流还是字符流
Formatted I/O /* ANSI */ /* write a formatted string to the standard output stream */ int printf(char *, ...); /* write a formatted string to a buffer */ int sprintf(char *, char *, ...); /* write a formatted string to a buffer, not exceeding buffer
Basic I/O system的7个函数:creat(), remove(), open(), close(), read(), write(), ioctl()。creat()与remove()主要用于文件系统。函数声明如下
这是普通的IO操作,除此之外还有各种方式用于加快IO,譬如DMA、零拷贝技术等。 网络IO 服务端如何实现高并发、海量连接与网络IO的方式有着千丝万缕的联系,与磁盘IO不同的是,网络IO是从网卡拿数据,仅此而已 在讨论网络IO的方式之前,我们应该先对阻塞/非阻塞、同步/异步的概念有一个比较清晰的认识 ,可以将网络IO分为阻塞IO和非阻塞IO 具体来说,用户态进程发起了读写请求,但是内核态数据还未准备就绪(磁盘、网卡还没准备好数据), 如果进程需要阻塞等待,直到内核数据准备好,才返回,则为阻塞IO; 如果内核立马返回,不会阻塞进程,则为非阻塞IO; 同步IO与异步IO 在一次IO中数据传输的两个步骤中,但凡有一处发生了阻塞,就被称为同步IO;如果两个步骤都不阻塞,则被称为异步IO。 IO多路复用 为了解决上面提到的NIO会导致大量系统调用的问题,出现了IO多路复用模型。
总的来说,Buffer I/O为了提高读写效率和保护磁盘,使用了页缓存机制,不过由于页缓存处于内核空间,不能被应用程序(用户进程)直接寻址,所以还需要将页缓存数据再拷贝到内存对应的用户空间中。这样,需要两次数据拷贝才能完成用户进程对数据的读取操作。写操作也是一样,将页缓存的数据写入磁盘的时候,必须先拷贝到内核空间对应的主存,然后在写入磁盘中。
IO类型 同步与异步(synchronous,asynchronous):关注消息通知机制 同步: 进程发出系统调用之后,不会立即有返回信息,但是一旦有返回信息,则一定是最终结果. IO模型的分类 阻塞I/O 非阻塞I/O 复用I/O 事件驱动I/O 异步I/O 自己画的 ? 画完之后参考网上的 ? 阻塞I/O模型 ? 当用户进程发起系统调用之后,该进程可以发送多个处理请求交给内核处理,select,poll,epoll都是IO多路复用的机制。
在 Linux 操作系统中,文件 I/O(输入/输出)是程序与文件系统交互的基础。理解文件 I/O 的工作原理对于编写高效、可靠的程序至关重要。本文将深入探讨系统文件 I/O 的机制。
io 操作大致分为两种: 文件 io 网络 io io 操作分为两步 发起 io 请求 接收处理 io 同步 io 和异步 io 最大的区别就是同步 io 的发起方(用户线程)会阻塞或轮询等待 io 完成 同步 io 的特点 1、同步 io 是用户线程发起 io 请求并以阻塞或轮询的方式来等待 io 的完成 2、同步 io 是 io 的发起方,同时也是处理方 3、同步 io 是需要将内核态准备就绪的数据拷贝到用户态 ,所以需要阻塞用户态程序并等待 io 完成 异步 io 的特点 1、异步 io 在用户线程发起 io 请求后会立即返回继续执行后续的逻辑流 2、异步 io 是 io 的发起方,但内核态才是处理方 3、异步 io 的处理方是内核态,所以不需要阻塞 阻塞 io: 用户线程发起 io 请求并阻塞用户线程释放 CPU 执行权,等待内核态的 io 处理完成。 总结以上几种 io 模型,除了最后一个是异步 io 模型,其它的 io 模型都是同步。
5种IO模型、阻塞IO和非阻塞IO、同步IO和异步IO 看了一些文章,发现有很多不同的理解,可能是因为大家入切的角度、环境不一样。所以,我们先说明基本的IO操作及环境。 IO有内存IO、网络IO和磁盘IO三种,通常我们说的IO指的是后两者。 2、5种IO模型 《UNIX网络编程》说得很清楚,5种IO模型分别是阻塞IO模型、非阻塞IO模型、IO复用模型、信号驱动的IO模型、异步IO模型;前4种为同步IO操作,只有异步IO模型是异步IO操作。 3-1、阻塞IO调用和非阻塞IO调用、阻塞IO模型和非阻塞IO模型 注意这里的阻塞IO调用和非阻塞IO调用不是指阻塞IO模型和非阻塞IO模型: 阻塞IO调用 :在用户进程(线程)中调用执行的时候,进程会等待该 所以, 阻塞IO模型、非阻塞IO模型、IO复用模型、信号驱动的IO模型者为同步IO模型,只有异步IO模型是异步IO。 END 我知道你 “在看”
IO流 第一部分 (OutputStreamWriter BufferOutputStream) 转换流 超类为Reader和Writer 是字符流通向字节流的桥梁:可使用指定的字符编码表,将要写入流中的字符编码成字节
一个通用的 IO 模型通常包括打开文件、读写文件、关闭文件这些基本操作,主要涉及到 4 个函数:open()、read()、write()以及 close()。 文件IO tips:我们在 Linux 系统下,可以通过 man 命令查看某函数的用法和帮助信息以及头文件引用信息。 char *pathname, int flags); int open(const char *pathname, int flags, mode_t mode); 在 Linux 内核提供的标准文件 IO unistd.h> ssize_t read(int fd, void *buf, size_t count); 关闭文件 #include <unistd.h> int close(int fd); 标准IO
对于其他的IO操作,Java提供了几种不同的方式,以下是几个例子: 使用传统的阻塞IO(Java IO): import java.io.*; public class ClassicIOExample IOException e) { e.printStackTrace(); } } } 使用Java NIO的文件通道来快速复制文件: import java.io.IOException IOException e) { e.printStackTrace(); } } } 使用Java 7+的Files类进行简化的文件操作: import java.io.IOException } catch (IOException e) { e.printStackTrace(); } } } 在实际开发中,应根据具体需求选择最适合的IO
IO File类 作用 访问和操作文件的类 创建方式 File file = new File( String pathname ); 常用方法 boolean exists( )//判断文件是否存在 删除文件或者目录 boolean createNewFile( )//创建新的文件 long length()//返回文件的长度,字节问单位,如果文件不存在返回的是0L 举例 package jbit.io ; import java.io.*; public class FileMethods { public static void main(String[] args) {
非阻塞 I/O(Input/Output)是一种在进行文件和套接字操作时不阻塞进程的机制。在 Linux 中,非阻塞 I/O 可以通过设置文件描述符(File Descriptor)为非阻塞模式来实现。