解析Java中文乱码的处理方法.docx

上传人:b****4 文档编号:3815345 上传时间:2022-11-25 格式:DOCX 页数:13 大小:22.70KB
下载 相关 举报
解析Java中文乱码的处理方法.docx_第1页
第1页 / 共13页
解析Java中文乱码的处理方法.docx_第2页
第2页 / 共13页
解析Java中文乱码的处理方法.docx_第3页
第3页 / 共13页
解析Java中文乱码的处理方法.docx_第4页
第4页 / 共13页
解析Java中文乱码的处理方法.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

解析Java中文乱码的处理方法.docx

《解析Java中文乱码的处理方法.docx》由会员分享,可在线阅读,更多相关《解析Java中文乱码的处理方法.docx(13页珍藏版)》请在冰豆网上搜索。

解析Java中文乱码的处理方法.docx

解析Java中文乱码的处理方法

为什么说乱码是中国程序员无法避免的话题呢?

这个首先要从编码机制上说起,大家都是中文和英文的编码格式不是一样,解码也是不一样的!

如果中国的程序员不会遇到乱码,那么只有使用汉语编程。

汉语编程是怎么回事,我也不大清楚,应该是前年吧!

我一朋友给我介绍汉语编程,怎么不错不错?

当时因为学习忙没去关注这个,等我闲了,那个朋友不弄这个,问他,他也不说不大清楚,最后自己对这个学习也不了了之了。

我写这个不是讲解中英文之间的差距,解码等,我是将我在这几年工作遇到各种各样的乱码的解决方法,总结起来,也希望大家能把自己晕倒解决乱码的方法都说出来,咱们弄一个解决乱码的“葵花宝典”。

对于Java,由于默认的编码方式是UNICODE,所以用中文也易出问题,常见的解决是:

Strings2=newString(s1.getBytes(“ISO-8859-1”),”GBK”);

1、utf8解决JSP中文乱码问题

一般说来在每个页面的开始处,加入:

<%@pagelanguage="java"contentType="text/html;charset=UTF-8"

pageEncoding="UTF-8"%>

<%

request.setCharacterEncoding("UTF-8");

%>

◆charset=UTF-8的作用是指定JSP向客户端输出的编码方式为“UTF-8”;

◆pageEncoding="UTF-8",为了让JSP引擎能正确地解码含有中文字符的JSP页面,这在LINUX中很有效;

◆request.setCharacterEncoding("UTF-8");是对请求进行了中文编码。

有时,这样仍不能解决问题,还需要这样处理一下:

Stringmsg=request.getParameter("message");

 Stringstr=newString(msg.getBytes("ISO-8859-1"),"UTF-8");

 out.println(st);

2、Tomcat5.5中文乱码

只要把%TOMCAT安装目录%/  webapps\servlets-examples\WEB-INF\classes\filters\SetCharacterEncodingFilter.class文件拷到你的webapp目录/filters下,如果没有filters目录,就创建一个。

  

2)在你的web.xml里加入如下几行:

   

Set  Character  Encoding  

filters.SetCharacterEncodingFilter  

  

encoding  

GBK  

  

  

  

Set  Character  Encoding  

/*  

3)完成

2、get方式的解决办法

1)打开tomcat的server.xml文件,找到区块,加入如下一行:

  

 URIEncoding=”GBK”

完整的应如下:

 

 port="80"  maxThreads="150"  minSpareThreads="25"  maxSpareThreads="75"  

 enableLookups="false"  redirectPort="8443"  acceptCount="100"  

 debug="0"  connectionTimeout="20000"    

 disableUploadTimeout="true"    

 URIEncoding="GBK"  

 />

2)重启tomcat,一切OK。

3、xmlHttpRequest中文问题

页面jsp用的GBK编码

代码:

<%@pagecontentType="text/html;charset=GBK"%>

javascript部分

代码:

functionaddFracasReport(){  

   varurl="controler?

actionId=0_06_03_01&actionFlag=0010";  

   varurlmsg="&reportId="+fracasReport1.textReportId.value; //故障报告表编号  

          

   varxmlHttp=Common.createXMLHttpRequest();  

   xmlHttp.onreadystatechange=Common.getReadyStateHandler(xmlHttp,

eval("turnAnalyPage"));  

   xmlHttp.open("POST",url,true);  

   xmlHttp.setRequestHeader("Content-Type","

application/x-www-form-urlencoded);  

   xmlHttp.send(urlmsg);         

}

#p#

后台java中获得的reportId是乱码,不知道该怎么转,主要是不知道xmlHttp.send(urlmsg);以后是什么编码?

在后面用java来转,试了几种,都没有成功,其中有:

代码:

publicstaticStringUTF_8ToGBK(Stringstr){  

       try{  

           returnnewString(str.getBytes("UTF-8"),"GBK");  

       }catch(Exceptionex){  

           returnnull;  

       }  

   }  

      

   publicstaticStringUTF8ToGBK(Stringstr){  

       try{  

           returnnewString(str.getBytes("UTF-16BE"),"GBK");  

       }catch(Exceptionex){  

           returnnull;  

       }  

   }  

      

   publicstaticStringGBK(Stringstr){  

       try{  

           returnnewString(str.getBytes("GBK"),"GBK");  

       }catch(Exceptionex){  

           returnnull;  

       }  

   }  

        publicstaticStringgetStr(Stringstr){  

       try{  

           Stringtemp_p=str;  

           Stringtemp=newString(temp_p.getBytes("ISO8859_1"),"GBK");  

           temp=sqlStrchop(temp);  

           returntemp;  

       }catch(Exceptione){  

           returnnull;  

       }  

   }

4、JDBCODBCBridge的Bug及其解决方法

在编写一数据库管理程序时,发现JDBC-ODBCBridge存在不易发现的Bug。

在向数据表插入数据时,如果为英文字符,存储内容完全正确,如果存入中文字符,部分数据库只能存储前七八个中文字符,其他内容被截去,导致存储内容的不完整(有些数据库不存在这个问题,如SybaseSQLAnywhere5.0。

JDBC-ODBCBridge还存在无法建表的Bug)。

对于广大需要存储中文信息的Java程序员来说,这可是一个不好的消息。

要么改用其他语言编程,要么选择其他价格昂贵的数据库产品。

“一次编写,到处运行”的目标,也大打折扣。

能不能采用变通的方法,将中文信息进行处理后再存储来解决这个问题呢?

答案是肯定的。

解决问题的具体思路、方法

  

Java采用Unicode码编码方式,中英文字符均采用16bit存储。

既然存储英文信息是正确的,根据一定规则,将中文信息转换成英文信息后存储,自然不会出现截尾现象。

读取信息时再进行逆向操作,将英文信息还原成中文信息即可。

由GB2312编码规则可知,汉字一般为二个高位为1的ASCII码,在转换时将一个汉字的二个高位1去掉,还原时再将二个高位1加上。

为了处理含有英文字符的中文字串,对英文字符则需要加上一个Byte0标记。

以下提供的两个公用静态方法,可加入任何一个类中使用。

将中英文字串转换成纯英文字串

  publicstaticStringtoTureAsciiStr(Stringstr){

  StringBuffersb=newStringBuffer();

  byte[]bt=str.getBytes();

  for(inti=0;i〈bt.length;i++){

  if(bt[i]〈0){

  //是汉字去高位1

  sb.append((char)(bt[i]&&0x7f));

  }else{//是英文字符补0作记录

  sb.append((char)0);

  sb.append((char)bt[i]);

  }

  }

  returnsb.toString();

  }

将经转换的字串还原

  publicstaticStringunToTrueAsciiStr(Stringstr){

  byte[]bt=str.getBytes();

  inti,l=0,length=bt.length,j=0;

  for(i=0;i〈length;i++){

  if(bt[i]==0){

  l++;

  }

  }

  byte[]bt2=newbyte[length-l];

  for(i=0;i〈length;i++){

  if(bt[i]==0){

  i++;

  bt2[j]=bt[i];

  }else{

  bt2[j]=(byte)(bt[i]|0x80);

  }

  j++;

  }

  Stringtt=newString(bt2);

  returntt;

  }

上例在实际编程中效果很好,只是存储的中文信息需要经过同样处理,才能被其他系统使用。

而且如果中文字串出现英文字符,实际上增加了额外的存储空间。

#p#

5、Solaris下Servlet编程的中文问题及解决办法

在使用Java开发Internet上的一个应用系统时,发现在Windows下调试完全正常的Servlet,上传到Solaris服务器上,运行却出现故障——返回的网页不能显示中文,应为中文的信息全为乱码;用中文信息做关键字,不能正确检索数据库。

后来采用加入检查代码等方法探知故障原因如下:

显示乱码主要是因为通过类HttpServletResponse提供的方法setContentType无法改变返回给客户的数据的编码方式,正确的编码方式应为GB2312或者GBK,而事实上为缺省的ISO8859-1。

无法检索中文信息则是因为,客户提交的中文信息经浏览器编码到达服务器后,Servlet无法将其正确解码。

举例说明显示乱码解决方法

Servlet一般通常做法如下:

  publicclassZldTestServletextendsHttpServlet{

  publicvoiddoGet(HttpServletRequestrequest,

HttpServletResponseresponse)throwsServletException,IOException{

  //在使用Writer向浏览器返回数据前,设置content-typeheader,在这里设置相应的字符集gb2312

  response.setContentType("text/html;charset=gb2312");

  PrintWriterout=response.getWriter();//*

  //正式返回数据

  out.println("〈html〉〈head〉〈title〉Servlettest〈/title〉〈/head〉");

  out.println("这是一个测试页!

");

  out.println("〈/body〉〈/html〉");

  out.close();

  }

  ...

  }

解决页面显示乱码问题,需将*处代码换成如下内容:

PrintWriterout=newPrintWriter(newOutputStreamWriter(response.getOutputStream(),"gb2312"));

Solaris中文信息检索问题的解决

浏览器利用表单向服务器提交信息时,一般采用x-www-form-urlencoded的MIME格式对数据进行编码。

如果使用get方法,参数名称和参数值经编码后附加在URL后,在Java中称作查询串(querystring)。

在Servlet程序中,如果采用ServletRequest的方法getParameter取得参数值,在Solaris环境下,对汉字却不能正确解码。

因而无法正确检索数据库。

在Java1.2的包——中提供了URLEncode和URLDecode类。

类URLEncode提供了按x-www-form-urlencoded格式对给定串进行转换的方法。

类URLEncode则提供了逆方法。

6、CommonMail乱码问题

commonmail是一个小而方便的mail包,他实现了对JavaMail的封装,使用起来十分的方便,但是我在使用他的时候发现,使用纯文本的内容发送,结果是乱码,代码如下:

publicclassTestCommonMail{

publicstaticvoidmain(String[]args)throwsEmailException,MessagingException{

SimpleEmailemail=newSimpleEmail();

email.setCharset("GB2312");

email.setHostName("");

email.setSubject("test");

email.addTo("test@");

email.setFrom("test@");

email.setMsg("我的测试");

email.setAuthentication("test","test");

email.send();

}

}

分析了一下commonsmail的源码找到了原因。

源码如下:

publicclassSimpleEmailextendsEmail

{

publicEmailsetMsg(Stringmsg)throwsEmailException,MessagingException

{

if(EmailUtils.isEmpty(msg))

{

thrownewEmailException("Invalidmessagesupplied");

}

setContent(msg,TEXT_PLAIN);

returnthis;

}

}

Email代码片段:

publicvoidsetContent(ObjectaObject,StringaContentType)

{

this.content=aObject;

if(EmailUtils.isEmpty(aContentType))

{

this.contentType=null;

}

else

{

//setthecontenttype

this.contentType=aContentType;

//setthecharsetiftheinputwasproperlyformed

StringstrMarker=";charset=";

intcharsetPos=aContentType.toLowerCase().indexOf(strMarker);

if(charsetPos!

=-1)

{

//findthenextspace(afterthemarker)

charsetPos+=strMarker.length();

intintCharsetEnd=

aContentType.toLowerCase().indexOf("",charsetPos);

if(intCharsetEnd!

=-1)

{

this.charset=

aContentType.substring(charsetPos,intCharsetEnd);

}

else

{

this.charset=aContentType.substring(charsetPos);

}

}

}

}

email.send();的send方法将调用

publicvoidbuildMimeMessage()throwsEmailException

{

try

{

this.getMailSession();

this.message=newMimeMessage(this.session);

if(EmailUtils.isNotEmpty(this.subject))

{

if(EmailUtils.isNotEmpty(this.charset))

{

this.message.setSubject(this.subject,this.charset);

}

else

{

this.message.setSubject(this.subject);

}

}

//=====================================================

//Startofreplacementcode

if(this.content!

=null)

{

this.message.setContent(this.content,this.contentType);

}

//endofreplacementcode

//=====================================================

elseif(this.emailBody!

=null)

{

this.message.setContent(this.emailBody);

}

else

{

this.message.setContent("",Email.TEXT_PLAIN);

}

if(this.fromAddress!

=null)

{

this.message.setFrom(this.fromAddress);

}

else

{

thrownewEmailException("Senderaddressrequired");

}

if(this.toList.size()+this.ccList.size()+this.bccList.size()==0)

{

thrownewEmailException(

"Atleastonereceiveraddressrequired");

}

if(this.toList.size()>0)

{

this.message.setRecipients(

Message.RecipientType.TO,

this.toInternetAddressArray(this.toList));

}

if(this.ccList.size()>0)

{

this.message.setRecipients(

Message.RecipientType.CC,

this.toInternetAddressArray(this.ccList));

}

if(this.bccList.size()>0)

{

this.message.setRecipients(

Message.RecipientType.BCC,

this.toInternetAddressArray(this.bccList));

}

if(this.replyList.size()>0)

{

this.message.setReplyTo(

this.toInternetAddressArray(this.replyList));

}

if(this.headers.size()>0)

{

IteratoriterHeaderKeys=this.headers.keySet().iterator();

while(iterHeaderKeys.hasNext())

{

Stringname=(String)iterHeaderKeys.next();

Stringvalue=(String)headers.get(name);

this.message.addHeader(name,value);

}

}

if(this.message.getSentDate()

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1