茫茫網海中的冷日 - 對這文章發表回應
茫茫網海中的冷日
         
茫茫網海中的冷日
發生過的事,不可能遺忘,只是想不起來而已!
 恭喜您是本站第 1730212 位訪客!  登入  | 註冊
主選單

Google 自訂搜尋

Goole 廣告

隨機相片
IMG_2431195.jpg

授權條款

使用者登入
使用者名稱:

密碼:


忘了密碼?

現在就註冊!

對這文章發表回應

發表限制: 非會員 可以發表

發表者: 冷日 發表時間: 2008/3/18 6:43:28
Java Server Side 中文解決方案

在網站上看了很多文章關於在Java裡面使用中文的方法,只有嘆氣搖頭。
為什麼要用getBytes然後再轉BIG5呢?這種解決方法從一開始根本就錯了。

最好的解決方法是從資料進來的時候就要正確的抓到資料。

我這一兩個月利用下班時間寫了一個用Java Servlet以及XML/XSL來作的留言板,同時支援簡體、繁體,甚至日文的輸入與顯示,這是怎麼做到的呢?很簡單,利用Unicode。

我的servlet處理中文只要兩個指令:
response.setContentType("text/html;charset=UTF-8");
request.setCharacterEncoding("UTF-8"); (此功能j2ee 1.3就有了) 


之後不管你要getParameter或是printWriter.write都可以把所有的String直接拿來用,不用再做什麼轉換。存到database裡面的資料也是直接儲存unicode。
我用的資料庫是PostgreSQL因為它是唯一支援Unicode的開放軟體資料庫(唯一要注意的是PostgreSQL在initdb要用SQL-ASCII或是UNICODE,不能用mule-internal,如果你用過PostgreSQL應該知道我在講什麼)。你如果用的是Oracle或SQLserver, DB2他們的新版應該都是支援Unicode的。mySQL雖然很快,但是它的功能實在不足(也沒有支援unicode),尤其JDBC的driver還沒有官方版,不用也罷。
我本來想移植到mySQL上,但是它竟然連resultSet.isBeforeFirst()都沒有實作,那我怎麼判斷結果有沒有資料啊?

你會說,但是user輸入的是BIG5啊?別擔心,browser早就幫你解決這個問題了。
只要你用response.setContentType("text/html;charset=UTF-8");接下來雖然你輸入的是big5,但是當browser送出來的時候,它就會根據charset來作編碼轉換。
這樣我們再設request.setCharacterEncoding("UTF-8");然後你用getParameter時它就會把UTF-8轉成真正的unicode。

這個就是系統的美妙之處了,當你在簡體的系統上看同樣的page時,因為文件的內容Java已經幫你從unicode轉成UTF-8了,所以你還是可以看到繁體字,而你在reply這篇文章時雖然用的是GB,但是當從browser送出來的時候,它又轉成UTF-8了,然後我們的程式一樣處理,當你回到繁體系統來看,又可以看到剛剛發的簡體的reply。

如果你在英文的系統下,想要copy一篇中文文章進來,絕對不能用BIG5直接貼,因為這時系統的default encoding不對,轉碼會錯。這時你要先用browser先把文章讀出來,把"中文字"(不是BIG5碼)copy,貼進來。因為當你在browser裡面看到中文字時,這個中文字已經是用unicode在顯示了。

所以這個解決方案才能真正做到: "所見即所得"。也就是說,只要你看得到你輸入的東西,你就可以看到你想要的輸出結果。這也就是你在英文環境下,貼BIG5的"亂碼",這個程式也會回big5的"亂碼"給你的原因。

Unicode是Java一個對國際化╱本土化很好的支援,我們要好好利用這個優點,做出以前想都沒辦法想的軟體。LinuxFab雖然可以顯示繁體與簡體,但我若是大陸的使用者,沒看到"簡繁"那小小的兩個字,而在繁體的網頁輸入了簡體呢?會有問題。
除了用unicode,其他解決的方法都會很複雜,現在Java對server side的國際化支援算是完整了(1.3之前沒有request.setCharaterEncoding(),總是礙手礙腳),希望大家不要在把unicode當成是不如php, perl的缺點,東拼西湊的湊到可以顯示中文;把精力放在程式本身,而不是轉碼上。

台灣用Java的人還是不多,尤其是企業;理由不外是performance, 穩定性。
但是你如果知道美國的嘉信理財(我工作的公司),擁有全世界最強大的商用超級電腦,我們的程式已經有大約20-30%轉換成Java,轉換的工作還在繼續中,那你會怎麼想?Server side的Java有絕大多數CGI無法比擬的優點:Thread執行序,在只比較一個request的時候,CGI會佔優勢,但是當成百上千個request來的時候,Thread的優勢就會出來。我們公司也是在比較過兩者的表現之後,才決定進行CGI到Java的轉換的。

我的工作是把這些Java的功能加以中文化來提供給住在美國的華裔,對於Java中文化的問題已經研究了快兩年了,期間碰過不少問題,幸而跟我們合作的IBM對於我們提出的問題都能迅速改進,所以我還能保住我的工作。其實這些問題,在apache, tomcat等等的開放原始碼都已經解決了,我真的不得不佩服這些熱心的人。所以每次我的問題提出來之後,都還會附加:Tomcat不會有這個問題。我想這多少也刺激他們迅速的改進。
內容圖示
url email imgsrc image code quote
樣本
bold italic underline linethrough   












 [詳情...]
validation picture

注意事項:
預覽不需輸入認證碼,僅真正發送文章時才會檢查驗證碼。
認證碼有效期10分鐘,若輸入資料超過10分鐘,請您備份內容後,重新整理本頁並貼回您的內容,再輸入驗證碼送出。

選項

Powered by XOOPS 2.0 © 2001-2008 The XOOPS Project|