2024年6月12日发(作者:)

ASP UTF-8页面乱码+GB2312转UTF-8 +生成UTF-8格式的文件(编码)<转>

最好的方法:

先说一下基本的东西:

<%@ codepage=65001%>UTF-8

<%@ codepage=936%>简体中文

<%@ codepage=950%>繁体中文

<%@ codepage=437 %>美国/加拿大英语

<%@ codepage=932 %>日文

<%@ codepage=949 %>韩文

<%@ codepage=866 %>俄文

codepage指定了IIS按什么编码读取传递过来的串串(表单提交,地址栏传递等)。

出乱码的原因也就是网站要整合的时候模块编码不相同引起的。

就像我的博客相同,整合的时候都会出这个问题,因为BLOG是Utf-8的,

近来很多网友都在为这个问题咨询,我尝试了很多种方法。

最方便的方法如下:

不要转换任何模块网页的编码该utf-8的还是utf-8,该Gb22312的还是Gb2312

在Utf-8模块的包文档(如,但是要注意必须是在第一行调用)

最前面加上

<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>

<%ge=65001%>

在GB2312模块的包文档最前面加上

<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>

<%ge=936%>

其他编码的类推。

UTF-8编码是一种支持多语言的国际化编码格式,它能够让不同语言操作系统和浏览

器的用户访问中文网站时不用下载语言包即可正常浏览。而GB2312却做不到这一点,国

内目前很多程序已经开始支持UTF-8编码。以下是博客作者对ASP中使用UTF-8编码的

技巧小节。

以前做网页都是用的GB2312,因为刚开始不太了解,也就没注意这些。Dreamweaver

中文版默认的就是简体中文,不写编码类型的话也是如此。然而,现在越来越多的网站采

用unicode编码,这样做的好处自然不必多说。但是,要想真正用好utf-8并不是那么容

易。下面我就总结一下自己遇到的问题。

首先,要把meta区的charset由gb2312改为utf-8,这点应该没有人不知道吧。在

dreamweaver里可以直接设置[页面属性]中的[编码],然后会发现编辑器里的字体已经变

了。但仅仅这样做是远远不够的,重要的还在下面。

然后要将所有文件保存成utf-8格式的。具体的方法是,用记事本打开要保存的文件,

选[另存为],然后,在编码中将默认的ANSI(也就是ascii编码)改为utf-8,是utf-8而不

是unicode或其他。

以上两点是其他很多网站都讲过的地方,仅仅这样做之后会发现,还有很多问题,比

如汉字乱码,或者出现“未结束的字符串”等。下面还有三步!

1)ASP文件最前面写<%@CODEPAGE="65001"%>,原来就有的要改变

CODEPAGE,utf-8就要用65001,前面那个脚本语言,如果就用vbscript的话就不用写

了。不是每个文件都要写,而是只要在独立的页面写上就可以了,不包括包含文件。

2)经过上面的那些步骤,刷新一下,基本上就应该可以了。但是,你关闭浏览器重新

打开试试,发现了什么?页面一片空白!打开右键菜单,找到编码,选择utf-8,这才一切

正常。也就是说,浏览器可能不会自动识别编码。在第1)步内容的后面加上

t="utf-8"即可。

3)完成之后,重新打开浏览器,发现一切正常。但这并不代表工作已经完成了。多刷

新几次试试?结果发现,第一次很正常,刷新之后,汉字就出现乱码了。这时,还要在第

2)步的后面加上ge = 65001才行。这一句并不是每个文件都要加,只要

在首页加上就行了。既然用session,就可能出现过期的现象,那就都加上吧。这时,如

果你的站点中还有gb2312的页面,刷新它,就会发现,那个页面中的汉字已经出现乱码

了。

经过以上若干步骤,不出意外,就可以正常使用utf-8了。

注意

有时会遇到奇数汉字或中英文混合时出现乱码或“未结束的字符串”,如果你用的是

netbox而不是IIS的话,就请换用IIS,不用netbox,或把网页传到虚拟空间上再试。基

本上都是netbox本身引起的。

数据库不需改动,因为数据库内部就是unicode编码的,出来的时候再转换成其他编

码。另外,需要注意的是,在utf-8中不可以通过URL参数传递汉字,如果需要的话,要

加上ode(),记得以前使用gb2312时没遇到过这样的问题。

ASP中汉字与UTF-8的互相转换

'=============汉字转换为UTF-8==================

function chinese2unicode(Str)

for i=1 to len(Str)

Str_one=Mid(Str,i,1)

Str_unicode=Str_unicode&chr(38)

Str_unicode=Str_unicode&chr(35)

Str_unicode=Str_unicode&chr(120)

Str_unicode=Str_unicode& Hex(ascw(Str_one))

Str_unicode=Str_unicode&chr(59)

next

chinese2unicode = Str_unicode

end function

'=============UTF-8转换为汉字==================

function UTF2GB(UTFStr)

for Dig=1 to len(UTFStr)

if mid(UTFStr,Dig,1)="%" then

if len(UTFStr) >= Dig+8 then

GBStr=GBStr & ConvChinese(mid(UTFStr,Dig,9))

Dig=Dig+8

else

GBStr=GBStr & mid(UTFStr,Dig,1)

end if

else

GBStr=GBStr & mid(UTFStr,Dig,1)

end if

next

UTF2GB=GBStr

end function

function ConvChinese(x)

A=split(mid(x,2),"%")

i=0

j=0

for i=0 to ubound(A)

A(i)=c16to2(A(i))

next

for i=0 to ubound(A)-1

DigS=instr(A(i),"0")

Unicode=""

for j=1 to DigS-1

if j=1 then

A(i)=right(A(i),len(A(i))-DigS)

Unicode=Unicode & A(i)

else

i=i+1

A(i)=right(A(i),len(A(i))-2)

Unicode=Unicode & A(i)

end if

next

if len(c2to16(Unicode))=4 then

ConvChinese=ConvChinese & chrw(int("&H" & c2to16(Unicode)))

else

ConvChinese=ConvChinese & chr(int("&H" & c2to16(Unicode)))

end if

next

end function

function c2to16(x)

i=1

for i=1 to len(x) step 4

c2to16=c2to16 & hex(c2to10(mid(x,i,4)))

next

end function

function c2to10(x)

c2to10=0

if x="0" then exit function

i=0

for i= 0 to len(x) -1

if mid(x,len(x)-i,1)="1" then c2to10=c2to10+2^(i)

next

end function

function c16to2(x)

i=0

for i=1 to len(trim(x))

tempstr= c10to2(cint(int("&h" & mid(x,i,1))))

do while len(tempstr)<4

tempstr="0" & tempstr

loop

c16to2=c16to2 & tempstr

next

end function

function c10to2(x)

mysign=sgn(x)

x=abs(x)

DigS=1

do

if x<2^DigS then

exit do

else

DigS=DigS+1

end if

loop

tempnum=x

i=0

for i=DigS to 1 step-1

if tempnum>=2^(i-1) then

tempnum=tempnum-2^(i-1)

c10to2=c10to2 & "1"

else

c10to2=c10to2 & "0"

end if

next

if mysign=-1 then c10to2="-" & c10to2

end function

GB2312转UTF-8

'个人代码风格注释(变量名中第一个小写字母表表示变量类型)

'i:为Integer型;

's:为String;

Function U2UTF8(Byval a_iNum)

Dim sResult,sUTF8

Dim iTemp,iHexNum,i

iHexNum = Trim(a_iNum)

If iHexNum = "" Then

Exit Function

End If

sResult = ""

If (iHexNum < 128) Then

sResult = sResult & iHexNum

ElseIf (iHexNum < 2048) Then

sResult = ChrB(&H80 + (iHexNum And &H3F))

iHexNum = iHexNum &H40

sResult = ChrB(&HC0 + (iHexNum And &H1F)) & sResult

ElseIf (iHexNum < 65536) Then

sResult = ChrB(&H80 + (iHexNum And &H3F))

iHexNum = iHexNum &H40

sResult = ChrB(&H80 + (iHexNum And &H3F)) & sResult

iHexNum = iHexNum &H40

sResult = ChrB(&HE0 + (iHexNum And &HF)) & sResult

End If

U2UTF8 = sResult

End Function

Function GB2UTF(Byval a_sStr)

Dim sGB,sResult,sTemp

Dim iLen,iUnicode,iTemp,i

sGB = Trim(a_sStr)

iLen = Len(sGB)

For i = 1 To iLen

sTemp = Mid(sGB,i,1)

iTemp = Asc(sTemp)

If (iTemp>127 OR iTemp<0) Then

iUnicode = AscW(sTemp)

If iUnicode<0 Then

iUnicode = iUnicode + 65536

End If

Else

iUnicode = iTemp

End If

sResult = sResult & U2UTF8(iUnicode)

Next

GB2UTF = sResult

End Function

'调用方法

Write(GB2UTF("中国人"))

ASP UTF-8 乱码问题的解决方法小结

这里整理下asp页面下出现乱码的问题,好多ajax读取的数据出现乱码的解决方法,

,php等语言的乱码,解决原理都是一样的。

这个是网页编码的问题。中文一般采用的是gb2312这样的话显示中文基本上不会出

现乱码。但是有时候我们用的是一种国际上通用的utf-8格式。如果utf-8格式人不是很了

解的话是容易出现乱码的。

有许多朋友问过我,为什么在ASP里指定了codepage为65001还经常显示乱码.才子

在这里将这个问题详细解释一下,以免很多朋友再走弯路,甚至排斥UTF-8.

asp网页utf8乱码如果你还不知道UTF-8是什么东东,那才子建议你先去搜索一下

UTF-8的相关资料吧.

UTF-8编码之所以被越来越多的人接受甚至喜欢,肯定是有道理的,在WEB2.0盛行的

今天,在大谈多浏览器兼容的同时,不得不想到字符编码不同所造成的乱码现象同样需要得

到很好的处理.....

在N年以前,IE6以下的所有版本,只要没有安装相应的字库,访问相关的页面都是会乱

码的,例如,我是IE5 (Windows2000默认) 的版本,在没有安装IE繁体字库的情况下,访问任

何繁体页面的网站都是会乱码的,当然前提是该页面采用了BIG5的Charset,而UTF-8作为

一种 国际编码就能很好的处理该问题,只要将页面存为UTF-8编码格式,再在页面上将

codepage及charset全部定义为utf-8就可以在任何客户 端浏览器中显示出完全正确的

内容,完全不会乱码......

好了,才子这里以ASP页面为例,以一个实例来看具体操作吧:

在这才子推荐用Editplus来写代码,才子也专门写过一篇Editplus的使用教程,有兴趣

的朋友可以点击这里 去看看.

打开新建一个ASP页面,相信玩ASP的朋友都会留意到,许多下载的源码里,页面最上方

一般都有一句:

<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>

前面的language应该不用多说了,vbscript就是ASP默认的脚本语言,其实完全可以

不用写,写了好像还会影响页面执行效率,在这里我们先不 讨论这个问题. 后面的

codepage就是关键了,目的就是告诉浏览器,此页面是何种编码,936代表是简体中文,而

950代表繁体中文,65001就是我们今天说的 UTF-8编码了.我们将936改成65001,整句

如下:

<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>

再加上输出几个中文字看看能不能正确显示吧.

<%

"第一次测试UTF-8页面"

%>

OK,直接点击"保存",执行这个页面看看,如果不出意外,大家可能看到显示出的是 "一

尾UTF-8页" 这几个字,中文有乱码的现象,什么原因呢?

OK,请大家再点击最上面的 "文件" 菜单,选择"另存为",最下面一行有个编码,默认应

该是ANSI的,请大家点下拉框,选择UTF-8,再点保存,再执行试试看,如果不出意外,乱得更厉

害 了,呵呵,晕了吧.别急,想想原因,因为我们做的页面是HTML返回的,以前我们写HTML

时,看到body前面,也就是head里都有一句meta,应 该是这样的:

也就是指定页面以gb2312编码返回结果,一定要写在有返回结果输出的前面.大家都

知道gb2312是简体中文吧,我们今天说的是UTF-8编码,我们就将gb2312改成UTF-8吧,

全部代码如下:

<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>

<%

"第一次测试UTF-8页面"

%>

再执行看看,嗯,这次正常显示了吧.......

asp网页utf8乱码结论:采用UTF-8编码,除了要将文件另存为UTF-8格式之外,还需

要同时指定codepage及charset.

保证asp叶面一定不会出现乱码的代码应该是这样的:

(假定是UTF-8的叶子)

<%@ CODEPAGE=65001 %>

<% ge=65001%>

<% t="UTF-8" %>

可以建立公共文件,所有页面都包含这个编码指定.

Asp生成UTF-8格式的文件(编码)

ASP中操作UTF-8格式的文件

注意:这里说的ASP可不是。

ASP由于是一种古老的语言,它的一些功能对UTF-8支持非常差。

比如,你想生成一个UTF-8格式的文件,使用常用的 stemObject 对

象就不行。

stemObject 对象创建文件的函数,是下面方式:

TextFile(filename[,overwrite[,unicode]])

其中的 unicode 属性是这样描述的:

可选项。Boolean 值指明是否以 Unicode 或 ASCII 文件格式创建文件。如果以

Unicode 文件格式创建文件,则该值为 True;如果以 ASCII 文件格式创建文件,则该值

为 False。如果省略此部分,则假定创建 ASCII 文件。

我们是无法用这个函数来创建UTF-8格式文件的。

这时候,我们可以使用 对象,使用方法见下面:

以下是引用片段:

Set objStream = Object("")

With objStream

.Open

.Charset = "utf-8"

.Position =

.WriteText=str

.SaveToFile h("/"),2

.Close

End With

Set objStream = Nothing

附:

ASCII 、Unicode 、 UTF-8 介绍:

ASCII 是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,

范围是 0-127。

由于 ASCII 表示的字符非常有限,各个国家或者地区在此基础上提出了自己的字符

集,比如在中国应用非常广泛的 GB2312,它为汉字提供了编码,用两个字节表示。

这些字符集之间互不兼容,相同的数字可能表示不同的字符,为信息交流带来了麻烦。

Unicode 是一种字符集,它将世界上的所有字符映射成一个唯一的数字(code point),

比如字母 a 对应的数字 0x0041。目前 Unicode 还处于发展中,它所包容的字符越来越

多。

在将 Unicode 表示的字符进行存储时,还需要一定的编码方式,比如 UCS-2,它用

两个字节来表示 Unicode 编码的字符。而 UTF-8 是 Unicode 字符集的另外一种编码

方式,它是变长度的,最多 6 个字节,小于 127 的字符用一个字节表示,与 ASCII 字

符集的结果一样,因而具有非常好的兼容性,ASCII 编码下的英语文本不需要修改就可以

当作 UTF-8 编码进行处理,应用非常广泛。

完整示例:

'================================================

'函数名:CreatedTextFiles

'作 用:创建文本文件

'参 数:filename ----文件名

' body ----主要内容

'================================================

Public Function CreatedTextFiles(ByVal FileName, ByVal body)

On Error Resume Next

If InStr(FileName, ":") = 0 Then FileName = h(FileName)

Dim oStream

Set oStream = CreateObject("")

= 2 '设置为可读可写

= 3 '设置内容为文本

t = "UTF-8"

on =

ext body

File FileName, 2

Set oStream = Nothing

If <> 0 Then

End Function

调用示例:

Dim strContent

Dim filePath

FilePath="../"

strContent = "脚本之家"

CreatedTextFiles filePath, strContent'生成UTF-8编码的文件

为了您的安全,请只打开来源可靠的网址

打开网站 取消

来自: /itgrass/blog/item/