所有的轉義字符都是由 '\' 打頭的
第二個字符
0-9 :八進制
u :是Unicode轉意,長度固定為6位
Other:則為以下字母中的一個 b,t,n,f,r,",\
都不滿足,則產生一個編譯錯誤。
unicode編碼簡而言之就是將每一個字符用16位2進制數(shù)標識。但是通常都用4位的16進制數(shù)標識。
例如:
1)中文字符串"你好"的unicode碼為:\u4f60\u597d;
2)英文字符串"ab"的unicode碼為:\u0061\u0062;
其中\(zhòng)u是標識unicode碼用的,后面的4位16進制數(shù)則是對應字符的unicode碼。
unicode碼在J2EE項目中應用廣泛,java對unicode碼提供了很好的支持。例如國際化,則是unicode的經典運用。
那么unicode的編碼規(guī)則具體是什么,如何用程序實現(xiàn)?
1、unicode編碼規(guī)則
unicode碼對每一個字符用4位16進制數(shù)表示。具體規(guī)則是:將一個字符(char)的高8位與低8位分別取出,轉化為16進制數(shù),
如果轉化的16進制數(shù)的長度不足2位,則在其后補0,然后將高、低8位轉成的16進制字符串拼接起來并在前面補上"\u" 即可。
2、轉碼程序
1)字符串轉unicode
/**
* 將字符串轉成unicode
* @param str 待轉字符串
* @return unicode字符串
*/
public String convert(String str)
{
str = (str == null ? "" : str);
String tmp;
StringBuffer sb = new StringBuffer(1000);
char c;
int i, j;
sb.setLength(0);
for (i = 0; i < str.length(); i++)
{
c = str.charAt(i);
sb.append("\\u");
j = (c >>>8); //取出高8位
tmp = Integer.toHexString(j);
if (tmp.length() == 1)
sb.append("0");
sb.append(tmp);
j = (c & 0xFF); //取出低8位
tmp = Integer.toHexString(j);
if (tmp.length() == 1)
sb.append("0");
sb.append(tmp);
}
return (new String(sb));
}
2)unicode轉成字符串,與上述過程反向操作即可
/**
* 將unicode 字符串
* @param str 待轉字符串
* @return 普通字符串
*/
public String revert(String str)
{
str = (str == null ? "" : str);
if (str.indexOf("\\u") == -1)//如果不是unicode碼則原樣返回
return str;
StringBuffer sb = new StringBuffer(1000);
for (int i = 0; i < str.length() - 6;)
{
String strTemp = str.substring(i, i + 6);
String value = strTemp.substring(2);
int c = 0;
for (int j = 0; j < value.length(); j++)
{
char tempChar = value.charAt(j);
int t = 0;
switch (tempChar)
{
case 'a':
t = 10;
break;
case 'b':
t = 11;
break;
case 'c':
t = 12;
break;
case 'd':
t = 13;
break;
case 'e':
t = 14;
break;
case 'f':
t = 15;
break;
default:
t = tempChar - 48;
break;
}
c += t * ((int) Math.pow(16, (value.length() - j - 1)));
}
sb.append((char) c);
i = i + 6;
}
return sb.toString();
}
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請
點擊舉報。