]> git.saurik.com Git - apple/icu.git/blame - icuSources/test/testdata/ConverterSelectorTestUTF8.txt
ICU-62135.0.1.tar.gz
[apple/icu.git] / icuSources / test / testdata / ConverterSelectorTestUTF8.txt
CommitLineData
729e4ab9
A
1Что такое Unicode?
2
3Unicode - это уникальный код для любого символа,
4независимо от платформы,
5независимо от программы,
6независимо от языка.
7
8По своей природе компьютеры могут работать лишь с числами. И для того, чтобы они могли хранить в памяти буквы или другие символы, каждому такому символу должно быть поставлено в соответствие число. До того, как появился Unicode, в мире имели хождение сотни различных схем подобного кодирования символов. Но ни одна из этих схем не была столь универсальной, чтобы описать все необходимые символы: например, только для кодирования букв, входящих в алфавиты языков Европейского Сообщества, необходимо было использовать несколько различных кодировок. По большому счёту даже и для отдельного языка, скажем, английского, не существовало единой системы кодирования, включавшей в себя все обычно используемые буквы, знаки пунктуации и технические символы.
9
10Более того, все эти схемы кодирования часто даже не были совместимы друг с другом. К примеру, две разные кодировки могли использовать один и тот же код для представления двух разных символов или присваивать разные коды одной и той же букве. В этой ситуации для любого компьютера, а особенно сервера, приходилось поддерживать несколько разных кодировок, которые могли понадобиться, но даже и тогда при передаче данных на другую платформу или при их преобразовании в другую кодировку всегда оставался риск, что эти данные окажутся повреждёнными.
11Unicode изменяет такое положение вещей!
12
13Система Unicode присваивает уникальный код любому символу, независимо от платформы, независимо от программы, независимо от языка. Unicode был принят как стандарт такими лидерами компьютерной индустрии, как Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys да и многими другими. Именно эта схема кодирования используется такими современными технологиями и стандартами, как например XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML и так далее. Именно Unicode является официальной схемой реализации ISO/IEC 10646. Наконец, эта кодировка поддерживается во множестве операционных систем, во всех современных браузерах Интернет и в большом количестве других программ. Повсеместное распространение стандарта Unicode ровно как и доступность поддерживающих его средств в настоящее время являются одними из наиболее важных направлений развития индустрии программного обеспечения.
14
15Использование Unicode в многоуровневых приложениях или программных комплексах, построенных в рамках архитектуры клиент-сервер, а также при представлении данных в сети Интернет, приводит к значительному снижению расходов на поддержку этих продуктов или сервисов по сравнению со случаем использования старых схем кодирования. Действительно, Unicode позволяет создавать единый программный продукт или сайт Интернет для множества платформ, языков и стран без каких-либо переделок. А его использование при передаче данных между различными системами предохраняет эти данные от поврежде
16
17
18#
19
20
21
22 ما هي الشفرة الموحدة "يونِكود" ؟
23
24أساسًا، تتعامل الحواسيب فقط مع الأرقام، وتقوم بتخزين الأحرف والمحارف الأخرى بعد أن تُعطي رقما معينا لكل واحد منها. وقبل اختراع "يونِكود"، كان هناك مئات الأنظمة للتشفير وتخصيص هذه الأرقام للمحارف، ولم يوجد نظام تشفير واحد يحتوي على جميع المحارف الضرورية. وعلى سبيل المثال، فإن الاتحاد الأوروبي لوحده، احتوى العديد من الشفرات المختلفة ليغطي جميع اللغات المستخدمة في الاتحاد. وحتى لو اعتبرنا لغة واحدة، كاللغة الإنجليزية، فإن جدول شفرة واحد لم يكف لاستيعاب جميع الأحرف وعلامات الترقيم والرموز الفنية والعلمية الشائعة الاستعمال.
25
26
27
28وتجدر الملاحظة أن أنظمة التشفير المختلفة تتعارض مع بعضها البعض. وبعبارة أخرى، يمكن أن يستخدِم جدولي شفرة نفس الرقم لتمثيل محرفين مختلفين، أو رقمين مختلفين لتمثيل نفس المحرف. ولو أخذنا أي جهاز حاسوب، وبخاصة جهاز النادل (server)، فيجب أن تكون لديه القدرة على التعامل مع عدد كبير من الشفرات المختلفة، ويتم تصميمه على هذا الأساس. ومع ذلك، فعندما تمر البيانات عبر أنظمة مختلفة، توجد هناك خطورة لضياع أو تحريف بعض هذه البيانات.
29
30
31
32"يونِكود" تغير هذا كليـا !
33
34تخصص الشفرة الموحدة "يونِكود" رقما وحيدا لكل محرف في جميع اللغات العالمية، وذلك بغض النظر عن نوع الحاسوب أو البرامج المستخدمة. وقد تـم تبني مواصفة "يونِكود" مــن قبـل قادة الصانعين لأنظمة الحواسيب فـي العالم، مثل شركات آي.بي.إم. (IBM)، أبـل (APPLE)، هِيـْولِـت بـاكـرد (Hewlett-Packard) ، مايكروسوفت (Microsoft)، أوراكِـل (Oracle) ، صن (Sun) وغيرها. كما أن المواصفات والمقاييس الحديثة (مثل لغة البرمجة "جافا" "JAVA" ولغة "إكس إم إل" "XML" التي تستخدم لبرمجة الانترنيت) تتطلب استخدام "يونِكود". علاوة على ذلك ، فإن "يونِكود" هي الطـريـقـة الرسـمية لتطبيق المقيـاس الـعـالـمي إيزو ١٠٦٤٦ (ISO 10646) .
35
36
37
38إن بزوغ مواصفة "يونِكود" وتوفُّر الأنظمة التي تستخدمه وتدعمه، يعتبر من أهم الاختراعات الحديثة في عولمة البرمجيات لجميع اللغات في العالم. وإن استخدام "يونِكود" في عالم الانترنيت سيؤدي إلى توفير كبير مقارنة مع استخدام المجموعات التقليدية للمحارف المشفرة. كما أن استخدام "يونِكود" سيُمكِّن المبرمج من كتابة البرنامج مرة واحدة، واستخدامه على أي نوع من الأجهزة
39
40
41
42#
43
44什麽是Unicode(統一碼/標準萬國碼)?
45
46Unicode給每個字元提供了一個唯一的數位,
47不論是什麽平臺,
48不論是什麽程式,
49不論是什麽語言。
50
51基本上,電腦只是處理數位。它們指定一個數位,來儲存字母或其他字元。在創造Unicode之前,有數百種指定這些數位的編碼系統。沒有一個編碼可以包含足夠的字元:例如,單單歐州共同體就需要好幾種不同的編碼來包括所有的語言。即使是單一種語言,例如英語,也沒有哪一個編碼可以適用於所有的字母,標點符號,和常用的技術符號。
52
53這些編碼系統也會互相衝突。也就是說,兩種編碼可能使用相同的數位代表兩個不同的字元,或使用不同的數位代表相同的字元。任何一台特定的電腦 (特別是伺服器都需要支援許多不同的編碼,但是,不論什麽時候資料通過不同的編碼或平臺之間,那些資料總會有損壞的危險。
54Unicode正在改變所有這一切!
55
56Unicode給每個字元提供了一個唯一的數位,不論是什麽平臺,不論是什麽程式,不論什麽語言。Unicode標準已經被這些工業界的領導們所採用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys 和其他許多公司。最新的標準都需要Unicode,例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等,並且,Unicode是實現ISO/IEC 10646的正規方式。許多作業系統,所有最新的瀏覽器和 許多其他産品都支援它。Unicode標準的出現和支援它工具的存在,是近來全球軟體技術最重要的發展趨勢。
57
58將Unicode與客戶伺服器或多層應用程式和網際網路結合,比使用傳統字元集節省費用。Unicode使單一軟體産品或單一網站能夠貫穿多個平臺,語言和國家,而不需要重建。它可將資料傳輸到許多不同的系統,而無損壞。
59關於Unicode學術學會
60
61Unicode學術學會
62
63
64
65#
66
67Ç'është UNICODE?
68
69Unicode siguron një numër të vetëm për çdo gërmë,
70për cilëndo platformë,
71për cilindo program,
72për cilëndo gjuhë.
73
74Në themel, kompjuterat veprojnë me anën e numrave. Ata ruajnë gërmat dhe shënjat (karakteret) e tjera duke u caktuar nga një numër (kod). Para zbulimit të Unicode-s, kishte qindra sisteme kodimi të ndryshëm për të caktuar këta numra. Por asnjë kodim i vetëm nuk mund të përmbante mjaft shënja: për shembull, vetëm Bashkimi Europian kërkon disa kodime të ndryshme për të mbuluar gjithë gjuhët e tij. Edhe për një gjuhë të vetme si Anglishtja asnjë kodim nuk ishte i mjaftueshëm për të gjitha gërmat, shënjat e pikësimit, dhe simbolet teknike në përdorim të zakonshëm.
75
76Këta sisteme kodimi gjithashtu përplasen me njëri-tjetrin. Dmth, dy kodime mundet që të përdorin të njëjtin numër për dy shënja krejt të ndryshme, ose dy numra të ndryshëm për të njëjtën shënjë. Secili kompjuter (sidomos shërbyesit - serverat) duhet të jetë i aftë të mbështesë shumë kodime, dhe megjithatë kur të dhënat kalohen përmes kodimeve të ndryshme ose platformave, është gjithmonë rreziku i korruptimit të tyre.
77Unicode po e ndryshon gjithë këtë rrëmujë!
78
79Unicode siguron një numër të vetëm për çdo gërmë, për cilëndo platformë, për cilindo program, për cilëndo gjuhë. Standarti Unicode është fëmijëruar (adaptuar) nga udhëheqës të tillë të industrisë si Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys dhe shumë të tjerë. Unicode kërkohet nga standarte moderne si XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, etj., dhe është mënyra zyrtare për të zbatuar ISO/IEC 10646. Unicode është i mbështetur nga shumë sisteme vepruese (operativë), gjithë shfletuesat (brauzerat) modernë, dhe shumë produkte të tjera. Dalja në dritë e Standartit Unicode, dhe pasja e veglave që e mbështesin, janë midis faktorëve më domethënës të kohëve të fundit të drejtimeve të zhvillimit të përgjithëshme të teknologjive të softuerëve.
80
81Përtrupëzimi i Unicode në zbatimet klient-server apo shumë-shkallësh si dhe në faqet internet, krijon mundësinë për kursime kostoje të ndjeshme në krahasim me përdorimin e kodimeve të mëparshme. Unicode bën të mundur që një produkt softuer ose një faqe interneti të përdoret për shumë platforma, gjuhë dhe vende pa re-inxhinierim. Ai lejon të dhënat të kalohen përmes shumë sistemeve të ndryshme pa korruptim.
82
83
84
85#
86यूनिकोड क्या है?
87
88यूनिकोड प्रत्येक अक्षर के लिए एक विशेष नम्बर प्रदान करता है,
89चाहे कोई भी प्लैटफॉर्म हो,
90चाहे कोई भी प्रोग्राम हो,
91चाहे कोई भी भाषा हो।
92
93कम्प्यूटर, मूल रूप से, नंबरों से सम्बंध रखते हैं। ये प्रत्येक अक्षर और वर्ण के लिए एक नंबर निर्धारित करके अक्षर और वर्ण संग्रहित करते हैं। यूनिकोड का आविष्कार होने से पहले, ऐसे नंबर देने के लिए सैंकडों विभिन्न संकेत लिपि प्रणालियां थीं। किसी एक संकेत लिपि में पर्याप्त अक्षर नहीं हो सकते हैं : उदाहरण के लिए, यूरोपिय संघ को अकेले ही, अपनी सभी भाषाऒं को कवर करने के लिए अनेक विभिन्न संकेत लिपियों की आवश्यकता होती है। अंग्रेजी जैसी भाषा के लिए भी, सभी अक्षरों, विरामचिन्हों और सामान्य प्रयोग के तकनीकी प्रतीकों हेतु एक ही संकेत लिपि पर्याप्त नहीं थी।
94
95ये संकेत लिपि प्रणालियां परस्पर विरोधी भी हैं। इसीलिए, दो संकेत लिपियां दो विभिन्न अक्षरों के लिए, एक ही नंबर प्रयोग कर सकती हैं, अथवा समान अक्षर के लिए विभिन्न नम्बरों का प्रयोग कर सकती हैं। किसी भी कम्प्यूटर (विशेष रूप से सर्वर) को विभिन्न संकेत लिपियां संभालनी पड़ती है; फिर भी जब दो विभिन्न संकेत लिपियों अथवा प्लैटफॉर्मों के बीच डाटा भेजा जाता है तो उस डाटा के हमेशा खराब होने का जोखिम रहता है।
96यूनिकोड से यह सब कुछ बदल रहा है!
97
98यूनिकोड, प्रत्येक अक्षर के लिए एक विशेष नंबर प्रदान करता है, चाहे कोई भी प्लैटफॉर्म हो, चाहे कोई भी प्रोग्राम हो, चाहे कोई भी भाषा हो। यूनिकोड स्टैंडर्ड को ऐपल, एच.पी., आई.बी.एम., जस्ट सिस्टम, माईक्रोसॉफ्ट, औरेकल, सैप, सन, साईबेस, यूनिसिस जैसी उद्योग की प्रमुख कम्पनियों और कई अन्य ने अपनाया है। यूनिकोड की आवश्यकता आधुनिक मानदंडों, जैसे एक्स.एम.एल., जावा, एकमा स्क्रिप्ट (जावा स्क्रिप्ट), एल.डी.ए.पी., कोर्बा 3.0, डब्ल्यू.एम.एल. के लिए होती है और यह आई.एस.ओ./आई.ई.सी. 10646 को लागू करने का अधिकारिक तरीका है। यह कई संचालन प्रणालियों, सभी आधुनिक ब्राउजरों और कई अन्य उत्पादों में होता है। यूनिकोड स्टैंडर्ड की उत्पति और इसके सहायक उपकरणों की उपलब्धता, हाल ही के अति महत्वपूर्ण विश्वव्यापी सॉफ्टवेयर टेक्नोलॉजी रुझानों में से हैं।
99
100यूनिकोड को ग्राहक-सर्वर अथवा बहु-आयामी उपकरणों और वेबसाइटों में शामिल करने से, परंपरागत उपकरणों के प्रयोग की अपेक्षा खर्च में अत्यधिक बचत होती है। यूनिकोड से एक ऐसा अकेला सॉफ्टवेयर उत्पाद अथवा अकेला वेबसाइट मिल जाता है, जिसे री-इंजीनियरिंग के बिना विभिन्न प्लैटफॉर्मों, भाषाओं और देशों में उपयोग किया जा सकता है। इससे डाटा को बिना किसी बाधा के विभिन्न प्रणालियों से होकर ले जाया जा सकता है।
101
102
103
104#
105
106บเรื่องของตัวเลข. คอมพิวเตอร์จัดเก็บตัวอักษรและอักขระอื่นๆ โดยการกำหนดหมายเลขให้สำหรับแต่ละตัว. ก่อนหน้าที่๊ Unicode จะถูกสร้างขึ้น, ได้มีระบบ encoding อยู่หลายร้อยระบบสำหรับการกำหนดหมายเลขเหล่านี้. ไม่มี encoding ใดที่มีจำนวนตัวอักขระมากเพียงพอ: ยกตัวอย่างเช่น, เฉพาะในกลุ่มสหภาพยุโรปเพียงแห่งเดียว ก็ต้องการหลาย encoding ในการครอบคลุมทุกภาษาในกลุ่ม. หรือแม้แต่ในภาษาเดี่ยว เช่น ภาษาอังกฤษ ก็ไม่มี encoding ใดที่เพียงพอสำหรับทุกตัวอักษร, เครื่องหมายวรรคตอน และสัญลักษณ์ทางเทคนิคที่ใช้กันอยู่ทั่วไป.
107
108ระบบ encoding เหล่านี้ยังขัดแย้งซึ่งกันและกัน. นั่นก็คือ, ในสอง encoding สามารถใช้หมายเลขเดียวกันสำหรับตัวอักขระสองตัวที่แตกต่างกัน,หรือใช้หมายเลขต่างกันสำหรับอักขระตัวเดียวกัน. ในระบบคอมพิวเตอร์ (โดยเฉพาะเซิร์ฟเวอร์) ต้องมีการสนับสนุนหลาย encoding; และเมื่อข้อมูลที่ผ่านไปมาระหว่างการเข้ารหัสหรือแพล็ตฟอร์มที่ต่างกัน, ข้อมูลนั้นจะเสี่ยงต่อการผิดพลาดเสียหาย.
109Unicode จะเปลี่ยนแปลงสิ่งเหล่านั้นทั้งหมด!
110
111Unicode กำหนดหมายเลขเฉพาะสำหรับแต่ละอักขระ, โดยไม่สนใจว่าเป็นแพล็ตฟอร์มใด, ไม่ขึ้นกับว่าจะเป็นโปรแกรมใดและไม่ว่าจะเป็นภาษาใด. มาตรฐาน Unicode ได้ถูกนำไปใช้โดยผู้นำในอุตสาหกรรม เช่น Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys และอื่นๆ อีกมาก. Unicode เป็นสิ่งที่จำเป็นสำหรับมาตรฐานใหม่ๆ เช่น XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML ฯลฯ., และเป็นแนวทางอย่างเป็นทางการในการทำ ISO/IEC 10646. Unicode ได้รับการสนับสนุนในระบบปฏิบัติการจำนวนมาก, บราวเซอร์ใหม่ๆ ทกตัว, และผลิตภัณฑ์อื่นๆ อีกมาก. การเกิดขึ้นของ Unicode Standard และทูลส์ต่างๆ ที่มีในการสนับสนุน Unicode, เป็นหนึ่งในแนวโน้มทางเทคโนโลยีซอฟต์แวร์ระดับโลกที่มีความสำค
112
113
114
115#
116
117Cos'è Unicode?
118
119Unicode assegna un numero univoco a ogni carattere,
120indipendentemente dalla piattaforma,
121indipendentemente dall'applicazione,
122indipendentemente dalla lingua.
123
124I computer, in buona sostanza, non sanno far altro che trattare numeri. Per immagazzinare in memoria lettere o altri segni è necessario che a ogni carattere venga assegnato un numero. Esistono centinaia di sistemi di codifica, preesistenti a Unicode, e ognuno di questi abbina i numeri ai caratteri in modo differente. Nessuna di queste codifiche comprende un numero di caratteri sufficiente per tutte le circostanze. Per le sole lingue dell'Unione Europea, ad esempio, è necessario utilizzare parecchi sistemi di codifica distinti. Anche considerando una solo lingua, come l'italiano, non esiste una codifica unica che comprenda tutte le lettere e tutti i segni di punteggiatura e simboli tecnici di uso comune.
125
126Questi sistemi di codifica, inoltre, sono in contraddizione l'uno con l'altro. Succede che due codifiche utilizzino lo stesso numero per due caratteri diversi o che, viceversa, adottino numeri diversi per lo stesso carattere. Qualsiasi elaboratore, e a maggior ragione un server di rete, ha bisogno di utilizzare codifiche diverse. Il problema è che, quando i dati passano da una codifica a un'altra, o da una piattaforma a un'altra, si corre il serio rischio di perdere informazioni.
127Unicode sta cambiando le cose!
128
129Unicode attribuisce un numero univoco a ogni carattere, indipendentemente dalla piattaforma, dall'applicativo, dalla lingua. Lo standard Unicode è stato adottato da leader di mercato del calibro di Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys e molti altri. Unicode è alla base di molti moderni standard, come XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML eccetera, e costituisce l'implementazione ufficiale dello standard internazionale ISO/IEC 10646. Unicode è supportato da molti sistemi operativi, da tutti i più moderni web browser e da molti altri prodotti. L'emergere dello standard Unicode, unito alla recente disponibilità di strumenti che lo supportano, è fra i più significativi sviluppi della tecnologia della globalizzazione del software.
130
131L'adozione di Unicode sui siti web e nelle applicazioni client/server o multi-tiered, rispetto all'utilizzo dei set di caratteri tradizionali, permette un significativo abbattimento dei costi di gestione. Unicode consente che un'unica versione di un software o di un sito web siano fruibili con piattaforme, lingue e paesi diversi, evitando la necessità di reingenierizzare il prodotto per ogni situazione specifica. Permette, inoltre, il trasporto del testo fra sistemi diversi senza che abbia luogo alcuna corruzione dei dati.
132
133
134#
135
136什么是Unicode(统一码)?
137
138Unicode给每个字符提供了一个唯一的数字,
139不论是什么平台,
140不论是什么程序,
141不论是什么语言。
142
143基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。
144
145这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。
146Unicode正在改变所有这一切!
147
148Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导们所采用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode,例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等,并且,Unicode是实现ISO/IEC 10646的正规方式。许多操作系统,所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在,是近来全球软件技术最重要的发展趋势。
149
150将Unicode与客户服务器或多层应用程序和网站结合,比使用传统字符集节省费用。Unicode使单一软件产品或单一网站能够贯穿多个平台,语言和国家,而不需要重建。它可将数据传输到许多不同的系统,而无损坏。
151关于Unicode学术学会
152
153Unicode学术学会是一个非盈利的组织,是为发展,扩展和推广使用Unicode标准而建立的,Unicode学术学会设立了现代软件产品和标准文本的表示法。学术学会的会员代表了广泛领域的计算机和资讯工业的公司和组织。学术学会只由会员提供资金。Unicode学术学会的会员资格开放给世界上任何支持Unicode标准和希望协助其扩展和执行的组织及个人。
154
155
156
157#
158
159
160Mikä Unicode on?
161
162Unicode määrittää jokaiselle merkille yksilöllisen arvon.
163Riippumatta käyttöjärjestelmästä
164Riippumatta ohjelmistosta
165Riippumatta kielestä
166
167Tietokoneiden toiminta perustuu numeroiden käsittelylle. Myös kirjaimet ja muut merkit ovat tietokoneiden muistissa lukusarjoina. Ennen Unicodea oli käytössä satoja eri tapoja esittää merkkejä ja kirjaimia mutta yksikään näistä koodisivuista ei kyennyt määrittämään kovin kattavaa merkistöä. Jo yksinomaan Euroopan Unionissa käytetyille kielille tarvitaan useita erilaisia merkistöjä ja koodisivuja, eikä edes englannin kaltaisen, yksinkertaisen kielen kaikkien kirjaimien, välimerkkien ja yleisten teknisten symbolien esittäminen onnistu yhdellä näistä koodisivuista.
168
169Lisäksi koodisivut ovat ristiriidassa keskenään. Eri koodisivuilla voidaan käyttää samaa arvoa kahdelle täysin erilaiselle merkille tai samalla merkillä voi olla eri arvo eri koodivulla. Jokaisen tietokoneen, varsinkin jos kyseessä on palvelin, pitää tukea lukuisia eri merkistöjä ja koodisivuja ja kun tietoa siirretään järjestelmien ja merkistöjen välillä on tiedon vääristymisen ja tuhoutumisen riski suuri.
170Unicode on ratkaisu
171
172Unicodessa jokaiselle merkille on määritetty yksilöllinen, riippumaton arvo. Alan johtavat yritykset, kuten Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys ja lukuisat muut toimijat käyttävät Unicodea. Unicode on sisällytetty vaatimuksena moniin nykyisiin standardeihin, kuten XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0 ja WML. Unicode on virallinen keino toteuttaa ISO/IEC 10646 -standardi. Useat käyttöjärjestelmät, kaikki internet-selaimet ja monet muut tuotteet käyttävät Unicodea. Unicoden syntyminen ja sitä tukevien työkalujen suuri määrä on yksi viime aikojen merkittävimmistä maailmanlaajuisen ohjelmistotuotannon suuntauksista.
173
174Unicoden käyttäminen palvelintekniikassa, vaativissa sovelluksissa ja internet-sivustoilla tuo merkittäviä kustannussäästöjä verrattuna usean eri koodisivun käytölle. Unicoden ansiosta yksittäinen sovellus tai sivusto voidaan tarjota useille eri käyttöjärjestelmille ja monilla eri kielillä maailmanlaajuisesti, ilman uudelleenohjelmoinnin tarvetta. Tieto kulkee järjestelmien välillä vailla tuhoutumisen tai vääristymisen vaaraa.
175Unicode-konsortio
176
177
178#
179
180
181Co je Unicode?
182
183Unicode přiřazuje každému znaku jedinečné číslo,
184nezávisle na platformě,
185nezávisle na programu,
186nezávisle na jazyce.
187
188Počítače, ze své podstaty, pracují pouze s čísly. Písmena a další znaky ukládají tak, že každému z nich přiřadí číslo. Před vznikem Unicode existovaly stovky rozdílných kódovacích systémů pro přiřazování těchto čísel. Žádné z těchto kódování nemohlo obsahovat dostatek znaků: například Evropská unie sama potřebuje několik různých kódování, aby pokryla všechny své jazyky. Dokonce i pro jeden jediný jazyk, jako je angličtina, nevyhovovalo žádné kódování pro všechny písmena, interpunkci a běžně používané technické symboly.
189
190Tyto kódovací systémy také byly v konfliktu jeden s druhým. To znamená, že dvě kódování mohou používat stejné číslo pro dva různé znaky, nebo používat různá čísla pro stejný znak. Jakýkoli počítač (zvláště servery) musí podporovat mnoho různých kódování; přesto, kdykoli jsou data předávána mezi různými kódováními nebo platformami, hrozí, že tato data budou poškozena.
191
192
193Unicode toto všechno mění!
194
195Unicode přiřazuje každému znaku jedinečné číslo, nezávisle na platformě, nezávisle na programu, nezávisle na jazyku. Unicode Standard byl přijat takovými průmyslovými vůdci, jako jsou Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys a mnoha dalšími. Unicode je vyžadován moderními standardy, jako jsou XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML atd. a je oficiální formou implementace ISO/IEC 10646. Je podporován v mnoha operačních systémech, všech moderních prohlížečích a mnoha dalších produktech. To, že se objevil Unicode Standard a dostupnost nástrojů, které jej podporují, patří mezi nejvýznamnější nedávné trendy v globální technologii softwaru.
196
197Začlenění Unicode do klient-server nebo vícevrstvých aplikací a webových stránek nabízí významné ušetření nákladů oproti dřívějším znakovým sadám. Unicode umožňuje, aby jediný softwarový produkt nebo jediná webová stránka byla zaměřena na mnoho platforem, jazyků a zemí beze změn návrhu. To dovoluje přenášet data přes mnoho různých systémů bez porušení.
198
199
200
201#
202
203?
204
205יוניקוד מקצה מספר ייחודי לכל תו,
206לא משנה על איזו פלטפורמה,
207לא משנה באיזו תוכנית,
208ולא משנה באיזו שפה.
209
210באופן בסיסי, מחשבים עוסקים רק במספרים. הם מאחסנים אותיות ותווים אחרים על-ידי הקצאת מספר לכל אחד מהם. בטרם הומצא היוניקוד, היו מאות מערכות קידוד שונות להקצאת המספרים הללו. אף לא אחת מהן יכלה להכיל כמות תווים מספקת. לדוגמא: רק לאיחוד האירופאי נדרשים כמה סוגי קידודים שונים על מנת לכסות את כל השפות המדוברות בו. יתירה מזאת אף לשפה בודדת, כמו אנגלית למשל, לא היה די במערכת קידוד אחת בעבור כל האותיות, סימני הפיסוק והסמלים הטכניים שבשימוש שוטף.
211
212מערכות קידוד אלו אף סותרות זו את זו. כלומר, שני קידודים יכולים להשתמש באותו מספר לשני תוים נבדלים, או להשתמש במספרים שונים לאותו תו. על כל מחשב (ובמיוחד שרתים) לתמוך במספר רב של מערכות קידוד שונות; אולם כל אימת שנתונים עוברים בין מערכות קידוד או פלטפורמות שונות קיים הסיכון שייפגמו.
213יוניקוד משנה את כל זה!
214
215יוניקוד מקצה מספר ייחודי לכל תו, ללא תלות בפלטפורמה, בתוכנית, או בשפה. תקן היוניקוד אומץ על-ידי המובילים בתעשייה כמו Apple‏, HP‏, IBM‏, JustSystem‏, Microsoft‏, Oracle‏, SAP‏, Sun‏, Sybase‏, Unisys‏ ורבים אחרים. יוניקוד נדרש על-ידי תקנים מודרניים כמו XML‏, Java‏, ECMAScript (JavaScript)‎‏, LDAP‏, CORBA 3.0‎‏, WML‏ וכדומה, ומהווה למעשה את היישום הרשמי של תקן ISO/IEC 10646. הוא נתמך על ידי מערכות הפעלה רבות, כל הדפדפנים החדישים, ומוצרים רבים אחרים. הופעת תקן היוניקוד וזמינות הכלים התומכים בו נמנות עם המגמות הכלל-עולמיות החשובות ביותר, אשר מסתמנות לאחרונה בטכנולוגיית התוכנה.
216
217שילוב יוניקוד ביישומי שרת-לקוח או ביישומים רבי-שכבות ובאתרי אינטרנט מאפשר חיסכון ניכר בעלויות לעומת השימוש בסדרות התווים המסורתיות. הודות ליוניקוד, מוצר תוכנה אחד או אתר יחיד ברשת יכול להרחיב את יעדיו למגוון פלטפורמות, ארצות ושפות ללא צורך בשינויים מרחיקים. יוניקוד מאפשר מעבר נתונים דרך מערכות רבות ושונות מבלי שייפגמו.
218פרטים אודות הקונסורציום של יוניקוד (Unicode Consortium
219
220
221#
222
223Hvað er Unicode?
224
225Unicode staðallinn úthlutar hverju skriftákni tölu,
226sem er óháð tölvugerð,
227sem er óháð forriti,
228sem er óháð tungumáli.
229
230Tölvur geta í eðli sínu aðeins unnið með tölur. Þær geyma bókstafi og önnur skriftákn með því að úthluta þeim tölu. Áður en Unicode kom til voru hundruð mismunandi túlkunarkerfa sem úthlutuðu þessum tölum. Ekkert eitt túlkunarkerfi gat innihaldið nægilegan fjölda skriftákna; t.d. þarfnast Evrópusambandið nokkurra mismunandi kerfa til að spanna öll tungumál þess. Jafnvel fyrir eitt tungumál, eins og ensku, var eitt túlkunarkerfi ekki nóg fyrir alla bókstafi, greinarmerki og algengustu einingatákn.
231
232Túlkunarkerfin hafa einnig verið í andstöðu hvert við annað, þ.e. tvö kerfi geta notað sömu tölu fyrir tvö ólík skriftákn eða notað tvær mismunandi tölur fyrir sama táknið. Sérhver tölva þarf(sérstaklega miðlarar) að styðja margs konar túlkanir á stöfum; engu að síður er alltaf hætta á stafabrenglun þegar gögn fara á milli tölva og á milli mismunandi túlkunarkerfa.
233Unicode breytir þessu öllu!
234
235Unicode gefur hverju skriftákni eigin tölu sem breytist ekki eftir tölvugerð, forriti eða tungumáli. Unicode staðallinn hefur verið tekinn upp af forkólfum tölvuiðnaðarins; Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys og mörgum öðrum. Unicode er notað af nútímastöðlum eins og XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, o.s.frv. og er hin opinbera leið til að útfæra ISO/IEC 10646. Unicode staðallinn er studdur af mörgum stýrikerfum, öllum nútímavöfrum og mörgum öðrum búnaði. Tilkoma Unicode staðalsins og búnaðar til að styðja hann eru veigamikil skref í þróun hnattrænnar tækni.
236
237Að nota Unicode í notendamiðlurum eða í forritum og vefsíðum með mörgum notendaviðmótum býður upp á umtalsverðan sparnað, í samanburði við að nota eldri stafatöflur. Unicode leyfir einum forritapakka eða einni vefslóð að ná til margra tölvugerða, tungumála og landa án endurhönnunar. Unicode gerir gögnum kleift að ferðast gegnum mörg mismunandi kerfi án brenglunar.
238Um Unicode samtökin (Consortium)
239
240Unicode Consortium samtökin stefna ekki að hagnaði. Þau voru stofnuð til að þróa, útvíkka og koma á framfæri Unicode staðlinum, sem skilgreinir framsetningu á texta í nútímaforritapökkum og stöðlum. Meðlimir samtakanna eru fulltrúar margs konar fyrirtækja og stofnana í tölvu- og upplýsingaiðnaðinum. Samtökin hafa eingöngu tekjur af aðildargjöldum sínum. Fyrirtæki, stofnanir og einstaklingar hvar sem er í heiminum sem ó
241
242
243#
244!@()*&(&@(@*(@*)(@*$$$%^^
245
246#
247+=-=`'
248#