Kontent qismiga oʻtish

Unicode kiritish

Vikipediya, ochiq ensiklopediya
KCharSelect belgilarni xaritalash vositasi Unicode matematik operatorlarining kichik toʻplamini koʻrsatadi.
Unicode logotipi

Unicode kiritish foydalanuvchi tomonidan kompyuterga maʼlum bir Unicode belgisini kiritish hisoblanadi. Unicode belgilar ularni displeydan tanlash yoki oddiy klaviaturada maʼlum bir ketma-ketlikni kiritish orqali ishlab chiqarilishi mumkin. Bundan tashqari, bitta veb-sahifada yoki hujjatda ushbu usullardan biri bilan yaratilgan belgi boshqasiga koʻchirilishi mumkin. ASCII ning 96 elementli belgilar toʻplamidan farqli oʻlaroq, Unicode dunyoning deyarli barcha yozma tillaridagi yuz minglab grafemalarni (belgilarni) va boshqa koʻplab belgilarni kodlaydi[1].Unicode kiritish tizimi belgilarning katta repertuarini, ideal holda barcha joriy Unicode kod nuqtalarini taʼminlashi kerak. Bu faqat maʼlum bir mahalliy parametrga mos keladigan cheklangan miqdordagi belgilar uchun tugmalar va ularning kombinatsiyalarini belgilaydigan klaviatura tartibidan farq qiladi.

Unicode raqamlari

[tahrir | manbasini tahrirlash]

Unicode belgilar kod nuqtalari bilan ajralib turadi, ular shartli ravishda „U+“ va keyin toʻrt, besh yoki olti oʻn oltilik raqamlar bilan ifodalanadi, masalan, U+00AE yoki U+1D310. Zamonaviy yozuv tiziminlari 4 xonali kodga ega. Tarixiy yozuvlar, shuningdek, koʻplab zamonaviy belgilar va piktogrammalarda (masalan, kulgichlar, oʻyin kartalari va koʻplab CJK belgilari) 5 xonali kodlar mavjud.

Ilova belgi uchun glifni oʻz ichiga olgan shriftga kira olsagina, belgini koʻrsatishi mumkin[2]. Juda oz sonli shriftlar toʻliq Unicode qamroviga ega. Koʻpchiligi faqat bir necha yozish tizimini qoʻllab-quvvatlash uchun zarur glifleri oʻz ichiga oladi. Biroq, koʻpgina zamonaviy brauzerlar va boshqa matnni qayta ishlash ilovalari koʻp tilli matnni koʻrsatishga qodir, chunki ular shriftni almashtirishni amalga oshiradilar, joriy shriftda qoʻllab-quvvatlanmaydigan belgilarni koʻrsatish uchun kerak boʻlganda avtomatik ravishda zaxira shriftga oʻtadilar. Unicode qamrovining puxtaligi dasturiy taʼminot va operatsion tizimga qarab farq qiladi.Baʼzi dasturlar barcha oʻrnatilgan shriftlarda mos glifni qidiradi, boshqalari faqat maʼlum shriftlar ichida qidiradi.

Agar ilovada glifga kirish imkoni boʻlmasa, belgi odatda shriftning „.notdef“ glifi[3] sifatida koʻrsatiladi. U koʻpincha boʻsh quti sifatida koʻrinadi. Zamonaviy ilovalar qoʻllab-quvvatlanmaydigan belgilar uchun „.notdef“dan foydalanadi.

Ekrandan tanlash

[tahrir | manbasini tahrirlash]
GNOME belgilar xaritasi

Koʻpgina tizimlar Unicode belgilarini vizual ravishda tanlash usulini taqdim etadi. ISO/IEC 14755 buni ekranni tanlashga kirish usuli sifatida koʻrsatadi[4].

Microsoft Windows Character Map dasturining Unicode versiyasini taqdim etdi. Bu asosiy koʻp tilli tekislikdagi (BMP) belgilar bilan cheklangan. Belgilarni Unicode belgilar nomi boʻyicha qidirish mumkin va jadval maʼlum bir kod bloki bilan cheklanishi mumkin[5]. Koʻpgina Linux ish stollarida ekvivalent vositalar;masalan, gucharmap (GNOME) yoki kcharselect (KDE) mavjud[6]

Odatda, bu vositalar foydalanuvchiga tanlangan belgilarni clipboardga „nusxalash“ imkonini beradi va keyin ularni toʻgʻridan-toʻgʻri kiritilgandek koʻrsatmasdan, ularni hujjatga joylashtirishga yordam beradi.

Oʻnlik kod kiritish

[tahrir | manbasini tahrirlash]

Microsoft Windows tizimida ishlaydigan baʼzi dasturlar, jumladan Word va Wordpadning soʻnggi versiyalari oʻnli kasr bilan ifodalangan va raqamli klaviaturada kiritilgan Unicode kod nuqtalaridan belgilar ishlab chiqishi mumkin.Alt tugmasi bosib ushlab turiladi. Misol uchun, Yevro belgisi € 20AC oʻn oltilik kod nuqtasiga ega, bu oʻnlik 8364 ni tashkil qiladi, shuning uchunAlt+8 3+6+4 belgisi paydo boʻladi. Xuddi shunday, 𝕄 .belgisini ikki marta urish Alt+1 2+0+1+3+2 belgisini hosil qiladi.

160-255 oraligʻidagi oʻnlik kod nuqtalari bosh nol bilan kiritilishi kerak (Windows kod sahifasi tanlanishi uchun) va bundan tashqari Windows kod sahifasi Unicode bilan mos keladigan qilib oʻrnatilishi kerak(CP1252dan foydalanish kerak) . Masalan,Alt+0 2+4+7 uning kod nuqtasiga mos keladigan ÷ ni beradi.

255 dan ortiq Alt kodlari ishlamaydigan dasturlarda olingan belgi odatda raqam 256 ga boʻlinganda qoldiqqa toʻgʻri keladi.

Vim matn muharriri belgilarni ikki belgili mnemonika (Vim ishlab chiquvchilari tomonidan chalkashlik bilan „digraflar“ deb ataladi) orqali aniqlash imkonini beradi. Oʻrnatilgan toʻplamni oʻnli kasrda koʻrsatilgan ixtiyoriy kod nuqtalari uchun aniqlangan maxsus mnemonika yordamida toʻldirish mumkin. Masalan, 9881 oʻnlik son 2699 ga teng boʻlgani uchun, dig Gr 9881 „Gr“ bilan bogʻlanadi.

HTMLda oʻnli kod nuqtalaridan foydalanish uchun quyida koʻring.

Microsoft Windows tizimida

[tahrir | manbasini tahrirlash]

HKEY_CURRENT_USER\Control Panel\Input Method registr kalitiga EnableHexNumpad deb nomlangan satr turi (REG_SZ) qiymatini qo‘shish orqali o‘n oltilik Unicode kiritishni yoqish mumkin. Ishni boshlash uchun ushbu kiritish usuli uchun registrni tahrir qilgandan soʻng foydalanuvchilar tizimdan chiqishlari va qaytadan kirishlari kerak boʻladi. (Vistaʼdan oldingi versiyalarda foydalanuvchilar uni ishga tushirish uchun qayta ishga tushirishlari kerak edi.)

Unicode belgilarini raqamli klaviaturada Alt va + ni bosib ushlab turish orqali kiritish mumkin.

UnicodeInput oynasi

Agar kimdir roʻyxatga olish kitobini tahrir qilishni xohlamasa yoki koʻplab noutbuklarda boʻlgani kabi, raqamli klaviatura mavjud boʻlmasa, UnicodeInput kabi uchinchi tomon dasturiy taʼminotidan foydalanish mumkin[7].

AutoHotkey skriptlari tugmalarni bosish uchun Unicode belgilarini almashtirishni qoʻllab-quvvatlaydi. Masalan, Send {U+2014} buyrugʻi faol oynadagi matn maydoniga chiziqcha qoʻyadi[8].

Baʼzi ilovalarda (Word, WordPad va LibreOffice dasturlari) oddiyroq usul qoʻllab-quvvatlanadi: birinchi navbatda belgilar kod nuqtasini (ikki va olti oʻn oltilik raqam oraligʻida) kiritadi, soʻngra yozadi.Alt+X raqamlarni Unicode belgisi bilan almashtiradi. Masalan, f1 ni kiritib, keyin kombinatsiyani bosish 'ñ' belgisini hosil qiladi.

Agar u olti oʻn oltilik raqamdan iborat boʻlmasa, kod oldidan hech qanday raqam yoki a-f harflari boʻlmasligi kerak, chunki ular konvertatsiya qilinadigan kodning bir qismi sifatida koʻrib chiqilishi mumkin. Masalan, af1 keyin kiritilishiAlt+X (yokiAlt+CAgar fransuzcha versiyadan foydalanilsa, tugmalari birikmasi „j“ (U+0AF1) hosil qiladi, lekin a0000f1 va undan keyin kiritilsa.Alt+X „añ“ („a“ keyin U+00F1 belgisi) hosil qiladi.

Word dasturida ushbu uslub yordamida kerakli belgi yaratish mumkin (masalan) va keyin uni ushbu usulni toʻgʻridan-toʻgʻri qoʻllab-quvvatlamaydigan dasturga nusxalash va joylashtirish mumkin.

HTML va XML tillarida belgi sifatida koʻrsatiladigan belgilar kodlari ampersand va raqam belgisi (& #) bilan old qoʻyiladi va undan keyin nuqtali vergul (;) qoʻyiladi. Kod nuqtasi oʻnlik yoki oʻn oltilik boʻlishi mumkin; ikkinchi holatda undan oldin „x“ qoʻyiladi. Boshlangʻich nollar qoldirilishi mumkin. Bir qator belgilar nomli obyekt tomonidan ifodalanishi mumkin.

Misol: HTML/XMLda mualliflik huquqi belgisi © (U+00A9) quyidagicha kodlanishi mumkin:

  • & #169; (oʻnlik kod nuqtasi)
  • & #xa9; (on oltilik kod nuqtasi)
  • & copy; (taʼsis nomi)

Bu Thunderbird va Vikipediya tahrirlash kabi HTML belgilarini qabul qiladigan koʻplab dasturlarda ishlaydi.

  • ASCII
  • Digraf (dasturlash)
  • AltGr kaliti
  • Yozish kaliti
  1. Lafontaine. „Unicode vs ASCII difference and benefits“. MSDN (2012-yil 17-fevral). 2022-yil 21-yanvarda asl nusxadan arxivlangan. Qaraldi: 2022-yil 23-sentyabr.
  2. Andrew Marcuse, „How to enter Unicode characters in Microsoft Windows“. Access date: September 13, 2012
  3. This is a private-use code point U+10FFEE which is unlikely to have a glyph assigned so it should display as a replacement.
  4. „ISO/IEC 14755:1997 Information technology -- Input methods to enter characters from the repertoire of ISO/IEC 10646 with a keyboard or other input device“. ISO. Qaraldi: 2017-yil 14-oktyabr.
  5. „How to Use Special Characters in Windows Documents“. support.microsoft.com (2019-yil 31-iyul). Qaraldi: 2020-yil 17-oktyabr.
  6. Peck. „Mastering Characters Sets in Linux (Weird Characters, part 2)“. LinuxPlanet (2009-yil 25-noyabr). 2019-yil 10-mayda asl nusxadan arxivlangan. Qaraldi: 2018-yil 5-dekabr.
  7. Opris. „UnicodeInput Review“. Softpedia (2018-yil 30-yanvar). Qaraldi: 2018-yil 28-noyabr.
  8. „Send Keys & Clicks“. AutoHotkey Foundation LLC.