第一章 緩沖流
昨天學習了基本的一些流,作為IO流的入門,今天我們要見識一些更強大的流。比如能夠高效讀寫的緩沖流,能夠 轉換編碼的轉換流,能夠持久化存儲對象的序列化流等等。這些功能更為強大的流,都是在基本的流對象基礎之上 創建而來的,就像穿上鎧甲的武士一樣,相當于是對基本流對象的一種增強。
1.1概述
緩沖流,也叫高效流,是對4個基本的 FileXxx 流的增強,所以也是4個流,按照數據類型分類:
字節緩沖流: BufferedInputStream , BufferedOutputStream
字符緩沖流: BufferedReader , BufferedWriter
緩沖流的基本原理,是在創建流對象時,會創建一個內置的默認大小的緩沖區數組,通過緩沖區讀寫,減少系統IO 次數,從而提高讀寫的效率。
1.2字節緩沖流
構造方法
public BufferedInputStream(InputStream in) :創建一個 新的緩沖輸入流。
public BufferedOutputStream(OutputStream out) : 創建一個新的緩沖輸出流。
構造舉例,代碼如下:
// 創建字節緩沖輸入流 BufferedInputStream bis = new BufferedInputStream(new FileInputStream("bis.txt")); // 創建字節緩沖輸出流 BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("bos.txt"));
效率測試
查詢API,緩沖流讀寫方法與基本的流是一致的,我們通過復制大文件(375MB),測試它的效率。
1.基本流,代碼如下:
public class BufferedDemo { public static void main(String[] args) throws FileNotFoundException { // 記錄開始時間 long start = System.currentTimeMillis(); // 創建流對象 try ( FileInputStream fis = new FileInputStream("jdk9.exe"); FileOutputStream fos = new FileOutputStream("copy.exe") ){ // 讀寫數據 int b; while ((b = fis.read()) != ‐1) { fos.write(b); } } catch (IOException e) { e.printStackTrace(); } // 記錄結束時間 long end = System.currentTimeMillis(); System.out.println("普通流復制時間:"+(end ‐ start)+" 毫秒"); } } 十幾分鐘過去了...
2.緩沖流,代碼如下:
public class BufferedDemo { public static void main(String[] args) throws FileNotFoundException { // 記錄開始時間 long start = System.currentTimeMillis(); // 創建流對象 try ( BufferedInputStream bis = new BufferedInputStream(new FileInputStream("jdk9.exe")); BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("copy.exe")); ){ // 讀寫數據 int b; while ((b = bis.read()) != ‐1) { bos.write(b); } } catch (IOException e) { e.printStackTrace(); } // 記錄結束時間 long end = System.currentTimeMillis(); System.out.println("緩沖流復制時間:"+(end ‐ start)+" 毫秒"); } } 緩沖流復制時間:8016 毫秒
如何更快呢?
使用數組的方式,代碼如下:
public class BufferedDemo { public static void main(String[] args) throws FileNotFoundException { // 記錄開始時間 long start = System.currentTimeMillis(); // 創建流對象 try ( BufferedInputStream bis = new BufferedInputStream(new FileInputStream("jdk9.exe")); BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("copy.exe")); ){ // 讀寫數據 int len; byte[] bytes = new byte[8*1024]; while ((len = bis.read(bytes)) != ‐1) { bos.write(bytes, 0 , len); } } catch (IOException e) { e.printStackTrace(); } // 記錄結束時間 long end = System.currentTimeMillis(); System.out.println("緩沖流使用數組復制時間:"+(end ‐ start)+" 毫秒"); } } 緩沖流使用數組復制時間:666 毫秒
1.3字符緩沖流
構造方法
public BufferedReader(Reader in) :創建一個 新的緩沖輸入流。
public BufferedWriter(Writer out) : 創建一個新的緩沖輸出流。
構造舉例,代碼如下:
// 創建字符緩沖輸入流 BufferedReader br = new BufferedReader(new FileReader("br.txt")); // 創建字符緩沖輸出流 BufferedWriter bw = new BufferedWriter(new FileWriter("bw.txt"));
特有方法
字符緩沖流的基本方法與普通字符流調用方式一致,不再闡述,我們來看它們具備的特有方法。
BufferedReader: public String readLine() : 讀一行文字。
BufferedWriter: public void newLine() : 寫一行行分隔符,由系統屬性定義符號。
readLine 方法演示,代碼如下:
public class BufferedReaderDemo { public static void main(String[] args) throws IOException { // 創建流對象 BufferedReader br = new BufferedReader(new FileReader("in.txt")); // 定義字符串,保存讀取的一行文字 String line = null; // 循環讀取,讀取到最后返回null while ((line = br.readLine())!=null) { System.out.print(line); System.out.println("‐‐‐‐‐‐"); } // 釋放資源 br.close(); } }
newLine 方法演示,代碼如下:
public class BufferedWriterDemo throws IOException { public static void main(String[] args) throws IOException { // 創建流對象 BufferedWriter bw = new BufferedWriter(new FileWriter("out.txt")); // 寫出數據 bw.write("對象"); // 寫出換行 bw.newLine(); bw.write("程序"); bw.newLine(); bw.write(" 員 "); bw.newLine(); // 釋放資源 bw.close(); } } 輸出效果: 對象 程序 員
1.4練習:文本排序
請將文本信息恢復順序。
3.侍中、侍郎郭攸之、費祎、董允等,此皆良實,志慮忠純,是以先帝簡拔以遺陛下。愚以為宮中之事,事無大小,悉 以咨之,然后施行,必得裨補闕漏,有所廣益。 8.愿陛下托臣以討賊興復之效,不效,則治臣之罪,以告先帝之靈。若無興德之言,則責攸之、祎、允等之慢,以彰其 咎;陛下亦宜自謀,以咨諏善道,察納雅言,深追先帝遺詔,臣不勝受恩感激。 4.將軍向寵,性行淑均,曉暢軍事,試用之于昔日,先帝稱之曰能,是以眾議舉寵為督。愚以為營中之事,悉以咨之, 必能使行陣和睦,優劣得所。 2.宮中府中,俱為一體,陟罰臧否,不宜異同。若有作奸犯科及為忠善者,宜付有司論其刑賞,以昭陛下平明之理,不 宜偏私,使內外異法也。 1.先帝創業未半而中道崩殂,今天下三分,益州疲弊,此誠危急存亡之秋也。然侍衛之臣不懈于內,忠志之士忘身于外 者,蓋追先帝之殊遇,欲報之于陛下也。誠宜開張圣聽,以光先帝遺德,恢弘志士之氣,不宜妄自菲薄,引喻失義,以 塞忠諫之路也。 9.今當遠離,臨表涕零,不知所言。 6.臣本布衣,躬耕于南陽,茍全性命于亂世,不求聞達于諸侯。先帝不以臣卑鄙,猥自枉屈,三顧臣于草廬之中,咨臣 以當世之事,由是感激,遂許先帝以驅馳。后值傾覆,受任于敗軍之際,奉命于危難之間,爾來二十有一年矣。 7.先帝知臣謹慎,故臨崩寄臣以大事也。受命以來,夙夜憂嘆,恐付托不效,以傷先帝之明,故五月渡瀘,深入不毛。 今南方已定,兵甲已足,當獎率三軍,北定中原,庶竭駑鈍,攘除奸兇,興復漢室,還于舊都。此臣所以報先帝而忠陛 下之職分也。至于斟酌損益,進盡忠言,則攸之、祎、允之任也。 5.親賢臣,遠小人,此先漢所以興隆也;親小人,遠賢臣,此后漢所以傾頹也。先帝在時,每與臣論此事,未嘗不嘆息 痛恨于桓、靈也。侍中、尚書、長史、參軍,此悉貞良死節之臣,愿陛下親之信之,則漢室之隆,可計日而待也。
案例分析
1.逐行讀取文本信息。
2.解析文本信息到集合中。
3.遍歷集合,按順序,寫出文本信息。
案例實現
public class BufferedTest { public static void main(String[] args) throws IOException { // 創建map集合,保存文本數據,鍵為序號,值為文字 HashMap<String, String> lineMap = new HashMap<>(); // 創建流對象 BufferedReader br = new BufferedReader(new FileReader("in.txt")); BufferedWriter bw = new BufferedWriter(new FileWriter("out.txt")); // 讀取數據 String line = null; while ((line = br.readLine())!=null) { // 解析文本 String[] split = line.split("\."); // 保存到集合 lineMap.put(split[0],split[1]); } // 釋放資源 br.close(); // 遍歷map集合 for (int i = 1; i <= lineMap.size(); i++) { String key = String.valueOf(i); // 獲取map中文本 String value = lineMap.get(key); // 寫出拼接文本 bw.write(key+"."+value); // 寫出換行 bw.newLine(); } // 釋放資源 bw.close(); } }
第二章 轉換流
2.1字符編碼和字符集
字符編碼
計算機中儲存的信息都是用二進制數表示的,而我們在屏幕上看到的數字、英文、標點符號、漢字等字符是二進制 數轉換之后的結果。按照某種規則,將字符存儲到計算機中,稱為編碼 。反之,將存儲在計算機中的二進制數按照某種規則解析顯示出來,稱為解碼 。比如說,按照A規則存儲,同樣按照A規則解析,那么就能顯示正確的文本f符 號。反之,按照A規則存儲,再按照B規則解析,就會導致亂碼現象。
字符編碼 Character Encoding : 就是一套自然語言的字符與二進制數之間的對應規則。
字符集
字符集 Charset :也叫編碼表。是一個系統支持的所有字符的集合,包括各國家文字、標點符號、圖形符 號、數字等。
計算機要準確的存儲和識別各種字符集符號,需要進行字符編碼,一套字符集必然至少有一套字符編碼。常見字符 集有ASCII字符集、GBK字符集、Unicode字符集等。
可見,當指定了編碼,它所對應的字符集自然就指定了,所以編碼才是我們最終要關心的。
ASCII字符集 :
ASCII(American Standard Code for Information Interchange,美國信息交換標準代碼)是基于拉丁字母的一套電腦編碼系統,用于顯示現代英語,主要包括控制字符(回車鍵、退格、換行鍵等)和可顯 示字符(英文大小寫字符、阿拉伯數字和西文符號)。
基本的ASCII字符集,使用7位(bits)表示一個字符,共128字符。ASCII的擴展字符集使用8位(bits) 表示一個字符,共256字符,方便支持歐洲常用字符。
ISO-8859-1字符集:
拉丁碼表,別名Latin-1,用于顯示歐洲使用的語言,包括荷蘭、丹麥、德語、意大利語、西班牙語等。
ISO-5559-1使用單字節編碼,兼容ASCII編碼。
GBxxx字符集:
GB就是國標的意思,是為了顯示中文而設計的一套字符集。
GB2312:簡體中文碼表。一個小于127的字符的意義與原來相同。但兩個大于127的字符連在一起時, 就表示一個漢字,這樣大約可以組合了包含7000多個簡體漢字,此外數學符號、羅馬希臘的字母、日文 的假名們都編進去了,連在ASCII里本來就有的數字、標點、字母都統統重新編了兩個字節長的編碼,這 就是常說的"全角"字符,而原來在127號以下的那些就叫"半角"字符了。
GBK:最常用的中文碼表。是在GB2312標準基礎上的擴展規范,使用了雙字節編碼方案,共收錄了21003個漢字,完全兼容GB2312標準,同時支持繁體漢字以及日韓漢字等。
GB18030:最新的中文碼表。收錄漢字70244個,采用多字節編碼,每個字可以由1個、2個或4個字節組成。支持中國國內少數民族的文字,同時支持繁體漢字以及日韓漢字等。
Unicode字符集 :
Unicode編碼系統為表達任意語言的任意字符而設計,是業界的一種標準,也稱為統一碼、標準萬國 碼。
它最多使用4個字節的數字來表達每個字母、符號,或者文字。有三種編碼方案,UTF-8、UTF-16和UTF- 32。最為常用的UTF-8編碼。
UTF-8編碼,可以用來表示Unicode標準中任何字符,它是電子郵件、網頁及其他存儲或傳送文字的應用 中,優先采用的編碼?;ヂ摼W工程工作小組(IETF)要求所有互聯網協議都必須支持UTF-8編碼。所以, 我們開發Web應用,也要使用UTF-8編碼。它使用一至四個字節為每個字符編碼,編碼規則:
1.128個US-ASCII字符,只需一個字節編碼。
2.拉丁文等字符,需要二個字節編碼。
3.大部分常用字(含中文),使用三個字節編碼。
4.其他極少使用的Unicode輔助字符,使用四字節編碼。
2.2編碼引出的問題
在IDEA中,使用 FileReader 讀取項目中的文本文件。由于IDEA的設置,都是默認的 UTF-8 編碼,所以沒有任何 問題。但是,當讀取windows系統中創建的文本文件時,由于Windows系統的默認是GBK編碼,就會出現亂碼。
public class ReaderDemo { public static void main(String[] args) throws IOException { FileReader fileReader = new FileReader("E:\File_GBK.txt"); int read; while ((read = fileReader.read()) != ‐1) { System.out.print((char)read); } fileReader.close(); } } 輸出結果: ???
那么如何讀取GBK編碼的文件呢?
2.3InputStreamReader類
轉換流 JAVA.io.InputStreamReader ,是Reader的子類,是從字節流到字符流的橋梁。它讀取字節,并使用指定 的字符集將其解碼為字符。它的字符集可以由名稱指定,也可以接受平臺的默認字符集。
構造方法
InputStreamReader(InputStream in) : 創建一個使用默認字符集的字符流。
InputStreamReader(InputStream in, String charsetName) : 創建一個指定字符集的字符流。
構造舉例,代碼如下:
InputStreamReader isr = new InputStreamReader(new FileInputStream("in.txt")); InputStreamReader isr2 = new InputStreamReader(new FileInputStream("in.txt") , "GBK");
指定編碼讀取、、
public class ReaderDemo2 {
public static void main(String[] args) throws IOException {
// 定義文件路徑,文件為gbk編碼
String FileName = "E:\file_gbk.txt";
// 創建流對象,默認UTF8編碼
InputStreamReader isr = new InputStreamReader(new FileInputStream(FileName));
// 創建流對象,指定GBK編碼
InputStreamReader isr2 = new InputStreamReader(new FileInputStream(FileName) , "GBK");
// 定義變量,保存字符
int read;
// 使用默認編碼字符流讀取,亂碼
while ((read = isr.read()) != ‐1) {
System.out.print((char)read); // ????
}
isr.close();
// 使用指定編碼字符流讀取,正常解析
while ((read = isr2.read()) != ‐1) { System.out.print((char)read);// 大家好
}
isr2.close();
}
}
2.4OutputStreamWriter類
轉換流 java.io.OutputStreamWriter ,是Writer的子類,是從字符流到字節流的橋梁。使用指定的字符集將字符 編碼為字節。它的字符集可以由名稱指定,也可以接受平臺的默認字符集。
構造方法
OutputStreamWriter(OutputStream in) : 創建一個使用默認字符集的字符流。 OutputStreamWriter(OutputStream in, String charsetName) : 創建一個指定字符集的字符流。
構造舉例,代碼如下:
OutputStreamWriter isr = new OutputStreamWriter(new FileOutputStream("out.txt")); OutputStreamWriter isr2 = new OutputStreamWriter(new FileOutputStream("out.txt") , "GBK");
指定編碼寫出
public class OutputDemo { public static void main(String[] args) throws IOException { // 定義文件路徑 String FileName = "E:\out.txt"; // 創建流對象,默認UTF8編碼 OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(FileName)); // 寫出數據 osw.write("你好"); // 保存為6個字節 osw.close(); // 定義文件路徑 String FileName2 = "E:\out2.txt"; // 創建流對象,指定GBK編碼 OutputStreamWriter osw2 = new OutputStreamWriter(new FileOutputStream(FileName2),"GBK"); // 寫出數據 osw2.write("你好");// 保存為4個字節 osw2.close(); } }
轉換流理解圖解
轉換流是字節與字符間的橋梁!
2.5練習:轉換文件編碼
將GBK編碼的文本文件,轉換為UTF-8編碼的文本文件。
案例分析
1.指定GBK編碼的轉換流,讀取文本文件。
2.使用UTF-8編碼的轉換流,寫出文本文件。
案例實現
public class TransDemo { public static void main(String[] args) { // 1.定義文件路徑 String srcFile = "file_gbk.txt"; String destFile = "file_utf8.txt"; // 2.創建流對象 // 2.1 轉換輸入流,指定GBK編碼 InputStreamReader isr = new InputStreamReader(new FileInputStream(srcFile) , "GBK"); // 2.2 轉換輸出流,默認utf8編碼 OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(destFile)); // 3.讀寫數據 // 3.1 定義數組 char[] cbuf = new char[1024]; // 3.2 定義長度 int len; // 3.3 循環讀取 while ((len = isr.read(cbuf))!=‐1) { // 循環寫出 osw.write(cbuf,0,len); } // 4.釋放資源osw.close(); isr.close(); } }
第三章 序列化
3.1概述
Java 提供了一種對象序列化的機制。用一個字節序列可以表示一個對象,該字節序列包含該 對象的數據 、 對象的 類型 和 對象中存儲的屬性 等信息。字節序列寫出到文件之后,相當于文件中持久保存了一個對象的信息。
反之,該字節序列還可以從文件中讀取回來,重構對象,對它進行反序列化。 對象的數據 、 對象的類型 和 對象中 存儲的數據 信息,都可以用來在內存中創建對象??磮D理解序列化:
3.2ObjectOutputStream類
java.io.ObjectOutputStream 類,將Java對象的原始數據類型寫出到文件,實現對象的持久存儲。
構造方法
public ObjectOutputStream(OutputStream out) : 創建一個指定OutputStream的ObjectOutputStream。
構造舉例,代碼如下:
FileOutputStream fileOut = new FileOutputStream("employee.txt"); ObjectOutputStream out = new ObjectOutputStream(fileOut);
序列化操作
1.一個對象要想序列化,必須滿足兩個條件:
該類必須實現 java.io.Serializable 接口, Serializable 是一個標記接口,不實現此接口的類將不會使任 何狀態序列化或反序列化,會拋出 NotSerializableException 。
該類的所有屬性必須是可序列化的。如果有一個屬性不需要可序列化的,則該屬性必須注明是瞬態的,使用 transient 關鍵字修飾。
public class Employee implements java.io.Serializable { public String name; public String address; public transient int age; // transient瞬態修飾成員,不會被序列化public void addressCheck() { System.out.println("Address check : " + name + " ‐‐ " + address); } }
2.寫出對象方法
public final void writeObject (Object obj) : 將指定的對象寫出。
public class SerializeDemo{ public static void main(String [] args) { Employee e = new Employee(); e.name = "zhangsan"; e.address = "beiqinglu"; e.age = 20; try { // 創建序列化流對象 ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream("employee.txt")); // 寫出對象 out.writeObject(e); // 釋放資源out.close(); fileOut.close(); System.out.println("Serialized data is saved"); // 姓名,地址被序列化,年齡沒有被序列 化。 } catch(IOException i) { i.printStackTrace(); } } } 輸出結果: Serialized data is saved
3.3ObjectInputStream類
ObjectInputStream反序列化流,將之前使用ObjectOutputStream序列化的原始數據恢復為對象。
構造方法
public ObjectInputStream(InputStream in) : 創建一個指定InputStream的ObjectInputStream。
反序列化操作1
如果能找到一個對象的class文件,我們可以進行反序列化操作,調用 ObjectInputStream 讀取對象的方法:
public final Object readObject () : 讀取一個對象。
public class DeserializeDemo { public static void main(String [] args) { Employee e = null; try { // 創建反序列化流 FileInputStream fileIn = new FileInputStream("employee.txt"); ObjectInputStream in = new ObjectInputStream(fileIn); // 讀取一個對象 e = (Employee) in.readObject(); // 釋放資源in.close(); fileIn.close(); }catch(IOException i) { // 捕獲其他異常i.printStackTrace(); return; }catch(ClassNotFoundException c) { // 捕獲類找不到異常 System.out.println("Employee class not found"); c.printStackTrace(); return; } // 無異常,直接打印輸出 System.out.println("Name: " + e.name); // zhangsan System.out.println("Address: " + e.address); // beiqinglu System.out.println("age: " + e.age); // 0 } }
對于JVM可以反序列化對象,它必須是能夠找到class文件的類。如果找不到該類的class文件,則拋出一個 ClassNotFoundException 異常。
反序列化操作2
另外,當JVM反序列化對象時,能找到class文件,但是class文件在序列化對象之后發生了修改,那么反序列化操 作也會失敗,拋出一個 InvalidClassException 異常。發生這個異常的原因如下:
該類的序列版本號與從流中讀取的類描述符的版本號不匹配
該類包含未知數據類型
該類沒有可訪問的無參數構造方法
Serializable 接口給需要序列化的類,提供了一個序列版本號。 serialVersionUID 該版本號的目的在于驗證序 列化的對象和對應類是否版本匹配。
public class Employee implements java.io.Serializable { // 加入序列版本號 private static final long serialVersionUID = 1L; public String name; public String address; // 添加新的屬性 ,重新編譯, 可以反序列化,該屬性賦為默認值. public int eid; public void addressCheck() { System.out.println("Address check : " + name + " ‐‐ " + address); } }
3.4練習:序列化集合
- 將存有多個自定義對象的集合序列化操作,保存到 list.txt 文件中。
- 反序列化 list.txt ,并遍歷集合,打印對象信息。
- 案例分析
- 1.把若干學生對象 ,保存到集合中。
- 2.把集合序列化。
- 3.反序列化讀取時,只需要讀取一次,轉換為集合類型。
- 4.遍歷集合,可以打印所有的學生信息
- 案例實現
public class SerTest { public static void main(String[] args) throws Exception { // 創建 學生對象 Student student = new Student("老王", "laow"); Student student2 = new Student("老張", "laoz"); Student student3 = new Student("老李", "laol"); ArrayList<Student> arrayList = new ArrayList<>(); arrayList.add(student); arrayList.add(student2); arrayList.add(student3); // 序列化操作 // serializ(arrayList); // 反序列化 ObjectInputStream ois = new ObjectInputStream(new FileInputStream("list.txt")); // 讀取對象,強轉為ArrayList類型 ArrayList<Student> list = (ArrayList<Student>)ois.readObject(); for (int i = 0; i < list.size(); i++ ){ Student s = list.get(i); System.out.println(s.getName()+"‐‐"+ s.getPwd()); } } private static void serializ(ArrayList<Student> arrayList) throws Exception { // 創建 序列化流 ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("list.txt")); // 寫出對象 oos.writeObject(arrayList); // 釋放資源 oos.close(); } }
第四章 打印流
4.1概述
平時我們在控制臺打印輸出,是調用 print 方法和 println 方法完成的,這兩個方法都來自于 java.io.PrintStream 類,該類能夠方便地打印各種數據類型的值,是一種便捷的輸出方式。
4.2PrintStream類
構造方法
public PrintStream(String fileName) : 使用指定的文件名創建一個新的打印流。
構造舉例,代碼如下:
PrintStream ps = new PrintStream("ps.txt");
改變打印流向
System.out 就是 PrintStream 類型的,只不過它的流向是系統規定的,打印在控制臺上。不過,既然是流對象, 我們就可以玩一個"小把戲",改變它的流向。
public class PrintDemo { public static void main(String[] args) throws IOException { // 調用系統的打印流,控制臺直接輸出97 System.out.println(97); // 創建打印流,指定文件的名稱 PrintStream ps = new PrintStream("ps.txt"); // 設置系統的打印流流向,輸出到ps.txt System.setOut(ps); // 調用系統的打印流,ps.txt中輸出97 System.out.println(97); } }