探詢金融系統生僻字輸入解決方案
2020年06月24日03:08

  原標題:探詢金融系統生僻字輸入解決方案

  來源:21世紀經濟報導

  一位在銀行供職多年的網絡架構師表示,問題出在“一字兩碼”。

  《生僻字》歌曲火了,但名字中使用生僻字,卻容易在現實生活遇到不小的麻煩。

  近日,多位人士向記者表示,自己的名字中含有 “䶮”等漢字,在辦理公積金、銀行卡、第三方支付、手機卡等金融、通信業務時,名字無法被驗證,導致業務無法辦理。

  甚至,因為沒法申請銀行賬戶,微信、支付寶也拒絕使用,有的銀行建議名字帶有“䶮”字的用戶改回繁體字“龑”。

  生僻字帶來金融交易中的麻煩,這一情況並不鮮見。

  21世紀經濟報導記者發現,除了䶮字,姓名中帶有㑇、䜣、䜩、䞍、䴖、䃅、(頔)、(㼆)等幾十個冷僻漢字,或多或少遇到身份驗證領域的問題,包括銀行轉賬、微信和支付寶申請賬戶,甚至影響個稅退稅、學籍認證、辦理電信卡。

  “䶮”們的煩惱

  䶮字音yǎn,繁體字寫作龑,意思是飛龍在天,來自《易經》的爻辭,是一個寓意美好的漢字。但在現實生活中,“䶮”是生僻字,卻讓名字的主人遇到了不小的麻煩。

  一位名字帶䶮的人士投訴稱,在銀行轉賬時,招行賬戶轉賬需要用微軟輸入法才能入賬,使用搜狗輸入法會退回。建行網銀轉賬則需要用搜狗輸入法。

  除了銀行賬戶,䶮字無法輸入騰訊財付通和支付寶,例如財付通會反饋顯示“輸入的姓名中存在無法識別的生僻字或姓名圓點輸入錯誤,請檢查後重新輸入”。

  另一位名字有䶮字的人士無法再忍受這種bug,他在中央人民政府網站“我向總理說句話”留言,網站需要實名認證,結果顯示“姓名錯誤,須與身份證的姓名相同”。

  類似的bug還存在於個人所得稅繳稅退稅、學籍認證等環節,但凡需要網絡實名認證才能完成的金融交易、身份驗證等,頻繁顯示名字錯誤。

  還有名叫䶮的人士表示,兩年前去移動、聯通辦手機電話卡,在讀身份證環節卡住,營業廳的人也是想盡辦法,甚至還嚐試過用戶口簿、護照等輔助方式,都在最後一步功虧一簣。

  類似名字叫䶮的人士,在生活中遇到麻煩的案例頗多。

  一位名叫䶮的網民去年7月在網上留言,辦理公積金聯名卡、銀行借記卡、信用卡,申購外彙等金融業務,名字無法被驗證,導致業務無法辦理,或需提供各種證明材料進行人工審核,反複在各部門間奔波。人工審核後可在12306上購買火車票,但乘坐航班還是無法用中文名。

  另一網民2月留言寫道,給孩子起名有一個生僻字“䎃”。出生證明、戶口均能順利辦理,但在辦理保險所需的銀行卡及臨時醫保卡時,卻不能按照正確姓名辦理。

  今年4月,山東青島媒體報導稱,當地市民王㞧(音huì)在移動、聯通和電信三家運營商都辦不了手機號。在電信營業廳身份證識別後,他的名字的第二個字㞧變成了問號,無法正常顯示。

  臨時解決方案

  “䶮”等這一類的漢字,是國務院2013年公佈的《通用規範漢字表》納入的漢字,也被《新華字典》收錄,但是卻在計算機系統中遇到了bug一般的麻煩。

  在現實中,這些無法顯示的字被“拆字”。21世紀經濟報導記者發現,在江西省某網站上,該省新餘市市長在政府新聞稿中被寫成了猶王瑩。這位市長名字中的“王瑩”實際上是“㼆”(音yíng)的簡化字,但電腦無法輸入。

  一位互聯網業內人士表示,出現這些情況的可能原因有很多,有的身份證閱讀器讀出來就已經變成問號;電信系統不支持䶮字雙碼,無法兩碼輸入、存儲、顯示,無法聯網核查;公安系統後台的字與身份證內容不同,機讀透傳肯定也不過。

  “這個字是生僻字,但這個問題挺常見的。”一位華南股份行人士說,遇到這個問題,銀行只能逐個排查這個字背後的字符編碼,一個一個解決問題。

  不過,“如果實在無法解決,只能建議用戶改名。”他說,將身份證上的䶮字改回繁體字龑,計算機系統反而是支持的。但是要麼有的用戶不願意改名,要麼很多地方的公安派出所也通常拒絕隨意改名,特別是改成繁體龑不是《通用規範漢字表》所收錄的字。

  互聯網公司給出的解決方案中,螞蟻集團回應21世紀經濟報導記者稱,目前針對可輸入的生僻字(如㭎、䶮、㑇),已在前台支持認證,可根據前台頁面進行認證。若無法認證,建議通過二代身份證辦理銀行卡,簽約快捷嚐試認證。

  騰訊給出的方案是,到銀行拆字或使用拚音開卡,然後在微信輸入相同的名字。比如,䶮錄入為龍天。

  這一問題甚至引起了全國人大的注意。2019年“兩會”,有全國人大代表提出“關於解決姓名中含有生僻字人員辦事難問題的建議”。對此,教育部、公安部等部門做出了相應的解決方案與建議。

  “一字兩碼”後遺症

  教育部在上述人大代表建議回應中表示,生僻字主要使用四字節編碼,操作系統、輸入法,以及文字處理軟件和硬件實現四字節編碼的技術難度和成本都較高。在部分應用行業的信息系統仍在使用早期或定製的系統,不具備處理一些生僻字的能力。此外,還有個別系統的部分漢字使用了自定義編碼,影響了與外界的信息交換。

  一位在銀行供職多年的系統架構師對記者表示,問題出在“一字兩碼”。䶮字存在兩個以上計算機編碼。由於處理的此類問題多了,業內將這兩個編碼不同、但字型相似的“䶮”字謔稱為大䶮、小䶮。

  也即,“自定義編碼”導致金融系統、互聯網、電信等出現無法識別姓名的情況。

  該資深系統架構師告訴記者,漢字編碼國家標準,先後經過了GB2312、GBK、GB18030-2000,GB18030-2005不同版本。二代居民身份證的電子數據使用UTF16編碼,生僻字使用了Unicode PUA(私有用戶區,簡稱PUA)編碼。

  大部分人取名來自字典。此前,一代身份證存在不少手寫姓名報戶口的情況,到二代身份證時才開始數字化。導致一些漢字既有公民身份證PUA編碼,又有Unicode編碼。

  國際上字符標準是Unicode標準,到2020年,Unicode版本到了第13版,收錄來自全球的143924個字符,其中包括“中日韓統一表意文字”(簡稱CJK)整理的92857個漢字。CJK是逐年累積增加大的,包括A到G的7個擴展區域。

  其中,“䶮”字等生僻字就有了4個編碼。在GB中,編碼為“FE9F”“8336CF39”;在PUA中,編碼為“E863”;在Unicode中,編碼為“4DAE”。

  “PUA是早期為解決居民戶口登記問題,設計的私有臨時區域。當時二代身份證更新換代時,Unicode擴展A區剛剛出現,擴展B區還沒面世。各國合作的Unicode出現之後,應該騰出這些碼。使用統一的編碼。”上述系統架構師表示。從技術角度,PUA適合用作文獻整理、曆史考古等極罕用字的專業領域,不適合在公共信息交換領域大規模啟用。

  據悉,由於曆史原因,國內大中型銀行使用的是IBM i系列或z系統主機,IBM主機EBCDIC可以支持至CJK擴展A區,可容納約27000字,符合GB18030-2000強製標準。但是根據他的統計,PUA編碼了4700多個漢字,其中3600字被Unicode收錄。

  他建議,金融、電信乃至互聯網等各公共服務機構,應盡快升級目前僅支持GBK的系統,滿足普通市民使用通規表字(GB18030)的基本要求。對於監管部門而言,如何統一漢字編碼規範,解決PUA造成的“一字多碼”等問題。

  特別是,在目前暫時不能解決PUA用字的情況下,考慮採用GBK繁體容錯,而非簡單採用《通用規範漢字表》削足適履。

關注我們Facebook專頁
    相關新聞
      更多瀏覽