作為一個自媒體作者,差評君每天的日常少不了接觸電腦、鍵盤、輸入法( 和奶茶 )。
而為了能讓大家晚上早點兒睡覺,差評君也沒少琢磨打字的技巧 —— 為了打字更快,差評君還學會了雙拼打字。
不過寫了這麼久文章,差評君也發現了一些問題是打字快解決不了的:比如打一個在電腦裡根本不存在的字。
上面這個字可能有差友覺得眼熟,也可能有差友不認識,這個字念 biáng ——「 biáng biáng面 」裡面的那個 biáng 。
餓了,想吃了▼
但由于 biáng 字隻用來表示這道著名的陝西面食,用途太少太過生僻,導緻電腦的字符編碼集遲遲沒有收錄,所以電腦裡遲遲打不出來這個字。
不信的話大家可以試下,我保證評論區裡打不出這個字 ~~
然而最近網上突然有個消息說, Unicode 組織已經把 biáng 字收錄進了「 CJK 統一表意漢字 」的擴展 G 區中,從今天開始正式生效。
所以這下可以在電腦裡打出 biáng 字了嗎?陝西的小夥伴們可以在微信裡教别人寫 biángbiáng 面了嗎!
小夥伴們先冷靜,事情并不是這樣的,因為電腦裡的文字編碼和輸入法還不是一回事。
換句話說就是,電腦裡能看到的,輸入法不一定能打出來。
不過要想搞明白這件事兒,差評君得先和大家唠唠電腦裡的文字編碼是怎麼回事兒。
我們都知道,現代計算機是美國人造出來的,他們為了處理文字方便,給 26 個字母在電腦裡設置了一套編碼标準。
簡單來說,就相當于規定電腦裡的一号字符是「 A 」,二号字符是「 B 」。
隻不過這個一号和二号是二進制的「 0100 0001 」。
這就是大名鼎鼎的阿斯克( ASCII )碼 —— 又叫美國信息交換标準代碼。ASCII 碼表在當時不亞于現在的九九乘法表,是計算機處理文字的基礎。
然而 ASCII 碼有個問題:由于當時硬盤比較小,能有個 1 MB 就算不錯的了,所以整個 ASCII 表也隻能定義 256 個字符。。。
所以等到電腦飄洋過海進入其他國家之後,那些不說英語的小夥伴們憤怒了 —— ASCII 表根本就沒給其他語言預留足夠的空間。
如果我們現在還在用 ASCII 表的話,可◻用電腦◻中文字就◻這樣的。( 會缺少很多常見字符 )
一時間,各個國家都開始制定自己的文字标準,比較著名的有西歐的 ISO-8859 系列标準、微軟的 Windows-12xx 系列标準。
以及咱們中國的 GB 2312 文字編碼标準。
雖然大家自己制定的一些文字編碼标準解決了不同語言文字在電腦裡存儲的問題,但經常是在一個牌子的電腦裡能正常顯示的文檔,跑到别的電腦上就成了亂碼。
就好像是沒有 USB 充電口之前,功能機和山寨機們各自用着五花八門的充電頭一樣,誰也不兼容誰。
所以就像充電寶上附帶了好多種插頭的萬能線一樣,電腦上的排版軟件也得集成盡可能多的文字編碼規範,才能做到自動識别出來文檔的文字編碼,讓字符正确顯示出來。
不過總用萬能線也不是個辦法,要是大家都用一樣的 USB 線該多好啊。
于是上世紀 80 年代的時候,萬國碼( Unicode )組織就在微軟、蘋果、 Adobe 、惠普、 IBM 等幾個科技巨頭們的牽頭之下成立了。
以前 ASCII 碼吃虧在了序列位數不足上,搞得隻能存 256 個字。所以這次的萬國碼直接把序列位數拉到了 16 位。
如果從「 0000 0000 0000 0000 」開始,到「 1111 1111 1111 1111 」結束全都塞滿字符的話,能存上 65,536 個字。
這還不算完,後來 Unicode 又把字符編碼擴展到了 32 位,40 多億個字的存儲空間别說全世界的文字了,說不定等以後發現了外星文明的時候依舊夠用。
手頭寬裕了之後,辦起事來自然也就大方得多:在過去的 20 年裡, Unicode 不但陸續收錄了全世界所有主要的文字,還順帶手把古代漢字以及象形字一類的東西全給收錄了進去。
《 康熙字典 》和《 四庫全書 》在列▼
像我們平常用的 Emoji 表情,也屬于 Unicode 文字編碼的一部分:
在 Unicode 内部還專門有一個小組,負責和表情設計師一起讨論下次應該再加點兒什麼表情進來。
收錄的東西又好又全,操作系統和文字排版工具們自然就不再需要跟文字編碼較勁了,反正選 Unicode 編碼就對了。
而這次所謂收錄了 biáng 字的 Unicode 13 ,實際上就是 Unicode 标準的第 13 版更新 —— 除了 biáng 字之外,還新收錄了 4,939 個生僻的漢字。
反正沒一個認識的 ▼
( 這一段沒有出 Bug )
其實差評君在這段的左上角給大家複制了一個 biáng 字,不過大家現在可能隻能看到一個 “ 口 ” ,或者一個黑底的大問号。
嗯,雖然從現在開始 Unicode 13 标準已經正式發布了,不過我們還沒法馬上用到。
這是因為文字編碼是内置于操作系統當中的,所以今天隻是意味着廠商們可以開始着手集成了,距離我們能正式體驗到還有一個系統更新的距離。
等哪次大家更新完系統之後,發現上面的那個 biáng 字可以正常顯示了,就代表着操作系統已經更新到最新的 13.0 版 Unicode 文字編碼了。
不過即使是這樣,這個 biáng 字依舊是「 隻可遠觀,但打不出來 」。
因為在我們的拼音規範裡沒有 biáng 的拼音,權威字典裡也沒有收錄這個字。
實際上, biáng 是一個由 bi ( 讀 bai )和 áng 兩個音節組合而成的合音,屬于關中地區的方言發音,不能單獨作為一個拼音來使用,所以無法被拼音輸入法打出來。
而 biáng 字的性質也和「 招财進寶 」類似,屬于民間為了這個發音生造出來的一種臆造字( 野字 )。
而且 biáng 字本身更是在陝西的不同地區存在差異較大的不同寫法,把誰收錄進字典估計其他地區的朋友都不會同意,所以幹脆不費這勁,讓它繼續野着去了。
孔乙己,你知道 biáng 有幾種寫法嗎?▼
所以即使以後電腦裡可以正常顯示 biáng 字了,我們也依舊沒法通過拼音輸入法正常把它打出來,隻能跑到百科一類的地方複制粘貼。
不過今年的時候,也有陝西民俗學家在推動 biáng 字進字典的事宜了,有 Unicode 的示例在前,說不定等再過幾年這件事也許還真能迎來個大反轉。
估計到時候我們就能正常的用 biáng 打出這個字了。
如果你看完了,發現什麼收獲也沒有,但是不明覺厲的話,那就點個贊,加個關注再走呗!!
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!