กูเกิล ใช้ Unicode 5.1 แล้ว
posted on 06 May 2008 02:56 by itshee in Googleกูเกิล (Google) เริ่มประกาศใช้ Unicode 5.1 (ยูนิโค้ด 5.1) แล้วครับ โดยเขียนไว้ในบล็อกกูเกิล ภายหลังจากที่ยูนิโค้ด 5.1 ออกมาให้ใช้งานกันเมื่อเดือนที่แล้ว [เร็วจริงเชียวสมเป็นกูเกิล] ซึ่งการใช้ยูนิโค้ดนี่เองทำให้เว็บไซต์สามารถค้นหาตัวอักษรแบบแปลกๆ ได้ อย่างเช่นตอนนี้สามารถใช้ภาษามาลายาลัม (ภาษาในอินเดีย) ค้นหาผ่านกูเกิลได้โดยตรง
สำหรับคนที่ไม่คุ้นเคยกับยูนิโค้ด ตัวยูนิโค้ดนี่ช่วยทำให้เว็บไซต์สามารถแสดงตัวอักษรที่นอกเหนือจากภาษาอังกฤษได้ในหน้าเดียวกัน ตัวอย่างที่เห็นได้ชัดคือเว็บ exteen นี่ไม่ว่าจะใส่ 日本語 (ญี่ปุ่น) - Español (สเปน) - 한국어 (เกาหลี) - 漢語 (จีน) - français (ฝรั่งเศส) ก็จะแสดงผลได้หมดถ้าในเครื่องได้ติดตั้งฟอนต์แล้ว เพราะ exteen ใช้ยูนิโค้ด ซึ่งถ้าใครเป็นแฟนพันทิปก็จะเห็นว่ามีปัญหาเวลาพิมพ์ภาษาอื่นที่ไม่ใช่อังกฤษกับไทย เวลาจะพิมพ์ทีก็ต้องเซฟเป็น JPG ไปแปะ เพราะพันทิปไม่ได้ใช้ยูนิโค้ด ถ้าจำไม่ผิดคงเป็น TIS-620 ซึ่งตัวที่นิยมกันในเว็บไทยสมัยก่อน นอกจากนี้ตัวที่นิยมอีกหลายไม่ว่า ASCII, Latin-1, หรือ Windows 1252 ซึ่งหลังๆ เว็บต่างๆ ก็พยายามใช้ยูนิโค้ดเป็นหลักไม่ว่าวิกิพีเดีย หรือพวกเว็บในตระกูลกูเกิล หรือแม้แต่ hi5 ก็ใช้ยูนิโค้ด แต่ปัญหา(ที่เคยเป็นปัญหาใหญ่) ของยูนิโค้ดคือ จะใช้ความจุในการเก็บมากกว่าแบบอื่น [ถ้าจำไม่ผิดอีกแล้ว] ตัวอักษรไทยในแบบเดิมใช้ 1 ไบต์ต่อหนึ่งตัวอักษร แต่ยูนิโค้ดใช้ 3 ไบต์ต่อหนึ่งตัวอักษร หรือถ้าเป็นอักษรลาวใช้ 4 ไบต์ ซึ่งเซิร์ฟเวอร์หลายที่ค่อนข้างจำกัดเนื้อที่ก็จะไม่อยากใช้ยูนิโค้ด...อ่านเพิ่มเติมได้ที่ ยูนิโคด ในวิกิพีเดียไทย (มีอธิบายไว้หน่อย)


(เกี่ยวมั้ยเนี่ย)









#1 By - -TuMmY- - on 2008-05-06 03:24