Unicode: în spatele cortinei
Consorțiul Unicode a sărbătorit anul trecut 25 de ani. Adevărul este că, în ciuda tuturor muncii pe care unicode o face pentru a asigura textul din limbile din întreaga lume – cei mai mulți dintre noi îl cunoaștem pe Unicode ca grupul care aprobă noi emoji.
Ceea ce s -ar putea să nu fie atât de clar este de ce este necesar un consorțiu mare sau complexitatea ascunsă a Unicode. Sau modul în care emojis -urile de voma sunt prezentate în desenul animat XCKD de mai sus sunt deja considerate „valabile (dar nu sunt recomandate)”.
Mark Davis, co-fondator și președintele actual al Unicode, a căutat să clarifice modul în care emoji se încadrează în Unicode în această imagine de ansamblu la nivel înalt, care privește ce este Unicode și cum se încadrează subcomisia Unicode Emoji („Emoji SC”) aceasta.
Davis observă că emojis -ul alcătuiesc doar o fracțiune din numărul total de caractere din standardul Unicode. Abia le puteți face în acest grafic:
Personajele singure nu spun jumătate din poveste. O serie de glife trebuie să se combine atunci când sunt afișate în anumite comenzi sau combinații.
O combinație care va fi familiară pentru mulți este modul în care sunt implementate tonurile de piele emoji.
Acestea funcționează prin detectarea când este afișat un personaj modificator după emoji umani, cum ar fi 👧 fată. Acestea se combină pe platforme acceptate pentru a arăta un singur emoji:
O implementare mai complicată implică îmbinarea a două sau mai multe emoji împreună în ceea ce se numește o secvență Emoji ZWJ.
Acestea sunt folosite pentru a crea profesii precum judecătorul 👩⚖️. Acest emoji este creat folosind 👩 Woman și ⚖️ Emojis la scară de echilibru în secvență.
Un personaj „ZWJ” (Lățime de Lățime) se află între aceste două emoji și este un lipici invizibil care se alătură mai multor emoji într -unul (unde este acceptat).
Alte tipuri de secvențe ZWJ listează un emoji existent, cum ar fi detectivul 🕵️ cu un simbol de gen ♀️ Semnul feminin adăugat după acesta.
Acest tip de secvență ZWJ este utilizat în general dacă există deja un emoji. De exemplu: alergător, surfer sau multe dintre gesturi.
Și da, puteți combina modificatori și ZWJ pentru a crea o secvență mai lungă.
Unicode nu controlează secvențele ZWJ în același mod ca noile emoji care necesită propriul lor punct de cod.
Unicode Secvențe recomandate care ar trebui să fie acceptate pentru consistența multiplă platformă. Cu toate acestea, vânzătorii sunt liberi să combine orice emoji cu oricare altul, după cum consideră potrivit.
Microsoft are șase pisici Ninja disponibile în Windows, care nu fac parte din lista recomandată a Unicode. 🐱 Fața pisicii și racheta sunt combinate pe Windows 10 pentru a arăta un emoji pentru 🐱🚀 Cat Astro.
Astro Cat este valabilă (deoarece folosește o structură de secvență corectă), dar nu este recomandată ca și alte profesii și sexe.
XKCD a sugerat că vărsăturile ar trebui să fie un personaj modificator pentru a face un „cowboy de vărsături”.
Davis subliniază că 🤠 Cowboy Hat Face ar putea fi deja combinată cu 🤮 Vomiting Face pentru a crea o secvență ZWJ valabilă:
Există și alte tipuri de secvențe pentru emoji, inclusiv secvențe de pavilion, secvențe de etichete și secvențe cheie. Ar trebui să consultați întregul set de diapozitive pentru a le vedea mai detaliat.
În cele din urmă, o privire asupra cronologiei (actuale, 2017) pentru modul în care se naște un nou emoji:
🚨 Actualizare aprilie 2020: Cronologia actuală a modului în care este creat un nou emoji a fost afectat în mod semnificativ de pandemia Covid-19. Puteți citi mai multe despre programul revizuit pentru 2020 și nu numai aici.
Desigur, Unicode mai are multe de făcut în afara suportului emoji:
„Există aproximativ 7.000 de limbi umane vii, cu diferite niveluri de vitalitate. Mai puțin de 100 din aceste limbi sunt bine susținute pe calculatoare, telefoane mobile și alte dispozitive, în timp ce toate restul riscă să fie dezavantajate digital”
Unicode are un program de adoptare a unui personaj. Fondurile obținute din adopții se îndreaptă către cercetare pentru a sprijini aceste limbi defavorizate digital.
Mai mult:
Unicode emoji de Mark Davis
Unicode adoptă un personaj
Emojisuri noi pentru 2017
Hacks emoji distractive
Search Emojis: