Unicode聯盟正式發布15.0標準 添加4489個新字符

作為一個非營利性組織,Unicode Consortium 致力於開發、拓展和促進相關全球化標準的採用。聯盟成員中有許多企業和組織代表,且其中不少來自計算機和信息處理行業。而在 15.0 新標準中,Unicode 聯盟繼續實施了針對核心規範、附件和數據文件的改進 —— 為其引入了 4489 個新字符,且總數達到了 14 萬 9186 個。

Unicode聯盟正式發布15.0標準 添加4489個新字符

首先,本次新增內容包括了兩組新腳本(總計 161 個)、20 個新的表情符號(Emoji)、以及 4393 個中日韓(CJK)表意文字。

其次,Unicode 15.0 版本中的新腳本和字符增加了對更多現代語言的支持:

● 包括在印度地區使用的 Nag Mundari;

● 在印度使用的 Kannada 字符(用於書寫 Konkani、Awadhi 和 Havyaka Kannada);

● 以及由阿拉斯加卡克托維克的伊努皮亞克人設計、用於因紐特語和尤皮克語的 Kaktovik 數字。

新增的 20 個表情符號,包括髮夾(hair pick)、沙錘(maracas)、水母(jellyfish)、khanda(印度的一種古老武器)、以及粉色愛心(pink heart)。

其它新增符號還包括:

● 九顆尖白星(巴哈伊信仰者使用)

● 八個天體符號(天文學家和占星者使用)

● 29 個額外的埃及象形文字(格式控件)

針對其它語言和學術工作的支持:

● 在東南亞發現的歷史文字 Kawi(用於書寫古爪哇語和其它語言)

● 三個附加的阿拉伯文字(土耳其使用的古蘭經標記)

● 三個 Khojki 字符(在手寫和印刷文件中被發現)

● 十個梵文字符(用於表示在土耳其發現的吉祥標誌銘文和手稿)

● 六個拉丁字母(馬拉雅拉姆語的音譯使用)

● 63 個西里爾字母修飾符(音標中使用)

重要的圖表字體更新:

● 一組埃及象形文字(除了支持文本中旋轉字形的標準化變體序列外)

● 統一加拿大土著音節的字形(為 Carrier 和其它語言提供更好的支持)

● 一套 Wancho 新字體(具有改進和簡化的形狀)

● 針對中日韓(CJK)語言的更新添加:

● H 塊中的 CJK 統一表意文字擴展(4192 個字符)

● C 塊中的一個統一表意文字擴展

最後,Unicode 屬性和規範決定了文本在計算機(包括手機)上的行為,以下 15.0 版新標準的重要更新。

【UAX #9】Unicode 雙向算法,修改了 UAX9-C2 中的註釋,以強調使用更高級別的協議來減輕潛在的源代碼欺騙攻擊。

【UAX #31】Unicode 標識符與模式參數,提供更多關於默認標識符配置文件的指導,闡明標識符中默認可忽略代碼點的使用,並討論 Pattern_White_Space 與編程語言中的雙向排序問題之間的關係。

【UAX #38】Unicode Han 數據庫,增加了 kAlternateTotalStrokes 屬性。將 kCihaiT 屬性的類別變更為字典索引、擴展 kKangXi 屬性,並且加入了第 3.0、3.10 和 4.5 節。

【UTS #39】Unicode 安全機制,將零寬度連接符(ZWJ)和零寬度非連接符(ZWNJ)字符從 Identifier_Status=Allowed 變更為 Identifier_Status=Restricted,默認情況下的通用安全配置文件將不再允許。

【UAX #45】U-Source 語義符,在其數據文件中記錄了新的表意文字、添加了 ExtH 作為新狀態、改進現有 CJK 統一表意文字塊的狀態標識符、並添加了第 2.5 節。

【UTS #46】Unicode IDNA 兼容性處理,澄清了 ToASCII 中空標籤的邊緣情況、並添加了有關新 IDNA 派生屬性數據文件的文檔。

(0)
上一篇 2022-09-20 18:36
下一篇 2022-09-20 19:36

相关推荐