本文实例讲述了Java实现将汉字转化为汉语拼音的方法。分享给大家供大家参考,具体如下:
网上乱转,偶然看到一个很有意思的小工具,名字叫pinyin4j,可以把汉字转换为汉语拼音,利用他的话再配合上lucene、中文分词就可以做出类似google那种输入汉语拼音进行全文检索的功能了。实现的代码如下
package pinyin4j;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class pinyin4jTest {
public static void main(String argsp[]) {
try {
String output = pinyin4jTest.CNToPinyin("你和你好", null);
System.out.println(output);
} catch (BadHanyuPinyinOutputFormatCombination e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
/**
* @parm inputCN 输入的中文字符串
* @parm seg 输出汉语拼音时的分隔符
*
* HanyuPinyinOutputFormat提供了几种输出模式
* HanyuPinyinCaseType:设定输入的结果是大写英文还是小写英文 LOWERCASE :小写 UPPERCASE :大写
* HanyuPinyinToneType:输出是否表明音调和重音 WITH_TONE_NUMBER:标明音调 如YE1 1-4表示 1-4声
* WITHOUT_TONE:不显示音调符 HanyuPinyinVCharType :输出要用何种的拼音编码
*/
public static String CNToPinyin(String inputCN, String seg)
throws BadHanyuPinyinOutputFormatCombination {
char[] inputArray = inputCN.toCharArray();
if (seg == null)
seg = " ";
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
format.setVCharType(HanyuPinyinVCharType.WITH_V);
String output = "";
String[] temp = new String[10];
for (int i = 0; i temp = PinyinHelper.toHanyuPinyinStringArray(inputArray[i], format);
//若输入的汉字为多音字则会将不同的读音依次放入temp[]中,若不是多音字则只有temp[0]中有值
for (int j = 0; j output += temp[j] + seg;
}
}
return output;
}
}
希望本文所述对大家Java程序设计有所帮助。