強力鎯頭 VB BLOG

文章分類

每月文章

文章標籤

全部標籤

關於 HTML Unicode 轉換

關於 HTML Unicode 轉換

在網頁原碼中常會見到 &#XXXXX 格式的字元 , 稱為 Unicode HTML 碼
由於編碼之故 , 非 Big5 字元集中的文字 , 如 GB2312 碼或日文字元等,
無法正常的顯示,而這些對應不到的文字,就需編碼轉換成 Unicode HTML,
就如同在文字檔中使用簡體字或日文字,需存成UTF-8或Unicode等編碼格式,
對於這種 Unicode HTML 格式的字 , IE 等瀏覽器會自行解析成對應的字元
但若由程式抓取網頁內容存檔,亦或存入資料庫,則需轉換還原成正確的文字

Unicode HTML

<< VB.Net >> 

 Unicode Text

<< C# .Net >> 

編碼器參考:

http://timc.idv.tw/classic/timc.idv.tw/scripts/unicode.htm 

http://www.csie.ntu.edu.tw/~piaip/unihtml/ 

http://www.unicodetools.com/unicode/convert-to-html.php 

 

 

posted on 2008/11/7 11:27 | 1 人推薦 我要推薦 | 閱讀數 : 593 | 文章分類 [ VB.Net / C#.Net / ] 訂閱

Feedback

# re: 關於 HTML Unicode 轉換 2008/11/8 上午 01:13 cloudio 回覆

忽然覺得寫WEB真幸福@@
HttpUtility一出來就幫我們搞定了
小弟學下來
以後有機會寫winform用的到^^

標題
姓名
電子郵件 (將不會被顯示)
個人網頁
內容
登入後使用進階評論
Please add 7 and 4 and type the answer here: