之前开放了一个空间,给网友提供电台节目音频下载。由于多年节目的文件数量甚多,且分类没有特定格式,图省事,没有制作网页提供分类下载,而是直接利用 Apache 的目录浏览功能,简单直观。
不过,所在的美国服务器默认 Apache 编码设置为 ISO-8859-1,使得中文文件名出现乱码,每次浏览只能手动设置一下浏览器的编码,设置为 GB2312 就可以正常显示了。每刷新一次都要设置一次,好是麻烦。想解决这个问题,但是找了好多资料,都没有解决到。一直就拖了将近 2 年了。辛苦了需要下载的网友了。
这几天,突然有冲动,要把这个问题解决。
首先是给 DH 的 customer service 反应了(其实以前也反应过此问题),我在提问的同时,给了一个可能的解决方案给 DH,让他们协助修改 http.conf,将 "AddDefaultCharset ISO-8859-1" 修改为 "AddDefaultCharset GB2312"。迅速得到 DH 的回复,可惜答案并没有解决我的问题。DH 不允许修改系统配置,告诉我去修改 htaccess 文件,看看能否解决问题。又见 htaccess 文件 …… 我修改了几十次的配置文件,不过没有一次可以成功解决这个乱码问题。虽然如此,见 DH 热心地附上了配置参考文档(http://www.w3.org/International/questions/qa-htaccess-charset
),还是挺感激的。
之前,利用 htaccess,企图解决乱码问题,尝试过以下多种指令:
AddDefaultCharset GB2312
DefaultLanguage zh-cn
AddDefaultCharset none
AddDefaultCharset Off
AddLanguage zh-cn .cn
AddCharset gb2312 .html
AddCharset gb2312 .htm
用 W3 的检查器检查(http://validator.w3.org/detailed.html
),结果发现,对 Apache 的目录浏览是不起作用的。只对上传的文件(.html 等等)起作用。
经过分析,应该是由于默认的目录浏览方式是由 Apache 生成 index 文件的,因为只能在生成前设定编码。
再仔细看了一下 htaccess 文件配置文档,发现 Apache Module mod_autoindex(http://httpd.apache.org/docs/2.2/mod/mod_autoindex.html#indexoptions
),里面有 FancyIndexing 项目(其实之前都用过这个设置的 IndexOptions NameWidth 了),IndexOptions 竟然也有一个关于编码的设置,Charset=character-set,天啊!怎么之前没有看到?!一看到这个选项,就感觉已经接近解决乱码问题了。
立刻修改 htaccess 文件,加入
IndexOptions Charset=GB2312
重新打开网页,成功!用 W3 的检查器检查,也是显示编码为 GB2312!终于解决了!
一句简单的命令,为什么之前一直都没有看到?太不小心了!
Apache 目录浏览乱码,Apache 乱码,Apache 编码修改,htaccess 编码修改,ISO-8859-1,GB2312,UTF-8,IndexOptions Charset(加上几句关键字,好让其他遇到此问题的网友能通过搜索引擎找到此文章。^_^)