昨天有个刚学java的师弟发了个程序给我,说死活编译不过,老是报编码问题,自己试了一下,也出问题了...
当我们编辑了一个Java源文件保存时,是以操作系统默认的字符编码保存的(Windows xp默认字符集是GBK)。当调用javac命令时,会把源文件进行一次编码转换,如果没有指定字符集,就从操作系统默认的字符集转换成Java内部默认的unicode字符集,然后再将源文件编译成class文件,并且以unicode的编码形式保存到硬盘上。
仔细查看了一下错误,才发现是文件编码的问题,他的文件用的是UTF-8编码的,于是加了-encoding编译成功~~
public class Test { public static void main(String[] args) { System.out.println("你好!"); } }
D:/>javac Test.java
Test.java:3: 警告:编码 GBK 的不可映射字符 System.out.println("浣犲ソ锛?); ^ Test.java:3: 未结束的字符串字面值 System.out.println("浣犲ソ锛?); ^ Test.java:3: 需要 ';' System.out.println("浣犲ソ锛?); ^ Test.java:5: 进行语法解析时已到达文件结尾 }
D:/>javac -encoding utf-8 Test.java
jdk在编译的时候,如果没有用-encoding参数指定java源程序的编码格式,则javac首先获得操作系统默认采用的编码格式,也即在编译java程序时,若不指定源程序文件的编码格式,jdk首先获得操作系统默认的编码格式,xp是GBK,然后jdk就把java源程序从该编码格式转化为java内部默认的unicode格式放入内存中。然后,javac把转换后的unicode格式的文件进行编译成.class类文件,此时.class文件是unicode编码的,它暂放在内存中,紧接着,jdk将此以unicode编码的编译后的class文件保存到操作系统中形成.class文件。最终获得的.class文件是内容以unicode编码格式保存的类文件,它内部包含源程序中的中文字符串,只不过此时它己经由安装系统编码格式转化为unicode格式了。
一般我比较喜欢用UTF-8的,在windows和linux下都能正常跑...
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。