asp里的codepage-老鄢博客

发布时间：2007-11-07 12:20:00 作者：admin 阅读：1103次

如遇乱码在页面中加入：

<%
Response.CodePage=65001
Response.Charset="utf-8"
%>

以下转自:http://hi.baidu.com/realbiu/blog/item/c20254163f39264a21a4e971.html

这几天研究UTF-8编码，太晕了，把我的看法和各位讨论讨论。
欢迎来批啊。以下都是我的想法，哪里有不对的请不吝赐教，帮忙指出来。

相关的题外话：

一、操作系统
window系统内部都是unicode的。文件夹名，文件名等都是unicode的，任何语言系统下都能正常显示。

二、输入法：
微软拼音输出的是Unicode的，智能ABC输出是简体中文的（所以智能ABC在非简体中文系统根本不能用，只能打英文）。

三、网页的textarea
网页的textarea是用unicode显示的。所以往里打什么字都能显示。而一些flash做的输入框就不行了。

四、Access2000
access里面保存的数据是unicode的，在任何语言系统下都能显示。
如果数据视图查看有些字符不正常，那是因为显示所用的字体不是Unicode字体，
换用Arial Unicode MS 字体就能全部显示了。（access帮助，搜索，输入unicode，有说明）

五、Word
word里的繁简转换，简体转换到繁体后，内码仍是简体中文的，其实只是简体中的繁体字。

六、ASP内部是Unicode的，所有文本都是Unicode存储的。需要时转换到指定字符集。

首先说下结论：
<%@ codepage=936%>简体中文
<%@ codepage=950%>繁体中文
<%@ codepage=65001%>UTF-8

codepage指定了IIS按什么编码读取传递过来的串串（表单提交，地址栏传递等）。

也指定了所有文本变量从Unicode转换到的编码，
也就指定了从数据库取出的数据从Unicode转换到的编码。（注意这个，很重要。）

关键字：
读取：一个串串，按简体读取是一些字，按繁体读取是一些字，串串本身编码没有变。

转换：系统主动的转换，比如从Unicode的“化”字到Big5的“化”字，内码变成Big5的。如果Big5没有对应的字，保留Unicode形式（&#xxxx;）

简体中文：化六个结论
Unicode16进制形式：化六个结论
Unicode10进制形式：化六个结论

下面是我推测出来的编码转换的过程：
客户端：输入法Unicode--输入框unicode--从Unicode按charset转换到对应编码()--表单发送编码

服务器端：IIS解开表单编码--按codepage指定编码读取--转换到对应的Unicode--可以用request("")读取了--进行一些处理--以Unicode编码保存到数据库

服务器端：读取数据库的Unicode数据，转换到codepage指定编码---生成源代码--IE按charset读取显示。

如有问题，可以QQ搜索群1028468525加入群聊，欢迎一起研究技术

支付宝

有疑问联系站长，请联系QQ：