16bit CharacterSet. 216=65536 에 대한 문자정의

http://www.unicode.org http://kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html

IsoLatin1이 대부분의 서구유럽언어를 표현하기에 충분하지만 중국어, 일본어 등 언어표현을 못한다. 유니코드는 전세계에서 사용되는 거의 모든 언어를 처리할 뿐만 아니라 수많은 사어까지도 지원한다.

처음 256개는 IsoLatin1과 동일.

유니코드는 코드체계 또는 문자집합을 명명하는 것이며 이를 표현하기 위해서는 UTF8, 16, 32등과 같은 인코딩이 필요하다

관련자료

UTF8인코딩을 사용하면, 전세계 문자를 동일 문서안에 표현할 수 있다.

Examples

Swedish

Räven raskar över isen med luva på.

Français

Il est possible d'écrire en Français : à, ç, û, ... Voir aussi TracTermsFr

Icelandic

Ævar sagði við ömmu sína: Sjáðu hvað ég er stór!

Japanese

漢字 ひらがな カタカナ ハンカクカナ

Chinese

Traditional: 繁體中文, 許功蓋會育; Simplified: 简体中文,许功盖会育

Korean

이번에는 한글로 써보겠습니다. 잘 보이나요? 한글링크

Russian

Проверка русского языка: кажется работает... See also TracTermsRu

Ukrainian

Перевірка української мови...

Bulgarian

Българският език работи ли?

Greek

Μακάρι να έτρεχε και στο Debian box μου... Bug #495

Spanish

Esto es un pequeño texto en Español, ahora una con acentó

Hebrew

אני יכול לאכול זכוכית וזה לא מזיק לי

Polish

Pchnąć w tę łódź jeża lub ośm skrzyń fig

Persian (Farsi)

این یک متن فارسی است ولی از چپ به راست

Portuguese

Indubitavelmente, é possível guardar acentuação portuguesa incluindo o símbolo da moeda europeia '€'.

Arabic

تراك يقوم بحفظ كل الكلمات باستخدام صيغة UTF-8، بما في ذلك الكلمات المستخدمة في صفحات التيكت والويكي.


SeeAlso PythonAndHangul UniCode UniCode

web biohackers.net