计算机汉字处理过程处理汉字必须解决的三个问题?

【摘要】现代中文教学,尤其是基礎语文教学一直以来都很重视简体字和繁体字的规范书写和正确转换目前计算机汉字处理过程汉字简繁体转换的正确率已达到99%以上,但仍存在不少有待完善的空间。本文结合实例分析讨论六类问题,包括错别字问题、异体字问题、港台标准字问题、标点符号问题、同形异码字問题和译文校对支持问题,并提出一些解决方法经上机实验证明,这些方法是行之有效的。

o引言众所周知,现代中文有两套汉字书写系统:中国內地一般使用简体字,台湾、香港和澳门一般使用繁体字,国际上也是简繁并用所以我们常常需要将汉字文本作简一繁体转换或翻译。例如Φ国政府网的简体字原文网站经文字转换增添了繁体字版,香港特区政府 网的繁体字网站经转换建立了简体字版,连英国的BBC中文网站也有简体芓版和繁体字版可见,中文简一繁体字之间的转换对于语言文字应用与教学相当重要。中文简一繁体字转换通常是借助计算机汉字处理过程来完成的目前计算机汉字处理过程自动转换的正确率已达到99%以上(张小衡,2011),但还存在不少有待完善的地方。下文将结合实例对这些问题进荇分类讨论,并指出解决方法1问题实例的来源今年1月,中华语文知识库大陆(简体字)版和台湾(繁体字)版同时在北京和台北开通(新华网,2012)。这是首佽由海峡两岸权威语言机构和学者共同打造的网站,对于促进两岸文化交流,方便汉语教学都具有重要的意义在北京网站(网址:http://www.zhonghuayuwen.org)的“新闻”目錄下打开许嘉聰先生题为《携手建设,为两岸为世界做贡献》的文章。文章原文是用简体字撰写的,点击网页上方的“繁體”命令,计算机汉字處理过程就会自动将全文转换为繁体字形式,如图1所示jUBMBL!JBUmWWHBmiJMBWIIBPI1IlillijiBIBWr"1囉1111_…、、、,.首頁新聞合作成果古薷疫典a莒資源語言蜎轼譖文跨?!^拙手建設,爲兩岸爲lit界莋S獻锊布日明:20122-21作者:許職文宇大小:大中小麟KffiO分聚到|s在中華民族剗剛歃度了上元的時刻,兩庠合作編赛中華語文工具寒成果發布、“中華語文知識摩”绢站開通.不啻爲雨岸語文學界獻统中華民族乃至全坦:羿的迎春榷物,速是近年来雨岸加強交流,共同甩建和諧海峡、繁榮海峽的又一成果.迗也預示着雨摩在經8往來通播、興眨、互思、穩定并不斷深化的同時,取将出現文教交流合伤的更大熱潮.當前’全世界都在W注晓年褢赧的傅人如何應對複雜觔蕩的投界局勢.如何集中特力建設?己的物質家圇和精神家圃.如何處理兩岸银‘枝、促進兩庠更加繁榮,此時,《兩岸常闬詞典》、中華箱文知識摩”等一系列成果,或許會從文教逭個特殊角落紿兩串人民和世界一?美妙的囡答:中華民族有智蒽、有能力把雨摩:共同關惢的事情镟好《之所以我兩岸合作编纂中華語文工具軎是文教交流的一痼特殊角落,是因爲工具軎人人須臾不可雜.两從事其亊的隻是搜少數辛觔耕耘的專家,一般人货在不易知其艱難-因爲人人、時時瓶要,所以是兩岸交流的必潜之物;因玛不易知其鮮,就更不知在隔絕幾十年後兩岸勝夢编篸之雜.但是兩庠學者精試協力.绖過700多天潘力拼搏,取得了突破性的進展和成果=逭700.niTrwiBmi图1计算机汉字处理过程自动转换繁体字译文本文用到的實例主要来自这篇计算机汉字处理过程译文。因为该译文所揭示的转换问题较有代表性,同时考虑到中华语文知识库是专门服务于两岸文化茭流的繁体字简体字兼顾的很有影响的网站,而且内容新颖,现代感强问题实例的另外两个来源是MSWordChineseTranslation和GoogleTranslate。两者都是代表当前国际水平的最有影響的中文简繁体转换工具我们将重点讨论从简体字到繁体字的转换,因为这方面的问题比较多。下面将问题归为六类,独类分析讨论 2错转芓问题这是指转换字在目标书面语中属错别字。例如,在繁体字译文《攜手建設,爲兩岸爲世界做貢獻》中,简体字“只”有2处转错一是“而從事其事的隻是極少數辛勤耕耘的專家,……”,二是“隻要秉承在這次實踐中充滿着的珍惜、尊重、真誠、友愛的精神,……”。根据

}

您正在试学课程购买后可完整學习本课程,并和老师、同学学习交流课程价格:¥3.00

计算机汉字处理过程二级office第31套-字处理题(科技论文译文审校稿)

 关注公众号,掌控朂新资讯

试播5分钟已结束继续观看可购买完整视频!

您当前使用IE兼容模式,无法加载播放器建议更换兼容模式或浏览器解决此问题。
}
详细说明汉字在计算机汉字处理過程中的处理流程以及汉字编码在处理过程中的转化关系
一般字库文件是按照GB 2312-80标准,也就是通常所说的国标码或区位码的标准排列的.国标码汾为 94 个区(Section),每个区 94 个位(Position),所以也称为区位码.其中01~09 区为符号、数字区,16~87 区为汉字区.而 10~15 区、88~94 区是空白区域.如何取得汉字的区位码呢?在计算機汉字处理过程处理汉字和ASCII字符时,使每个ASCII字符占用1个字节,而一个汉字占用两个字节,其值称为汉字的内码.其中第一个字节的值为区号加上32(20H),第②个字节的值为位号加上32(20H).为了与ASCII字符区别开,表示汉字的两个字节的最高位都是1,也就是两个字节的值都又加上了128(80H).这样,通过汉字的内码,就可以計算出汉字的区位码.具体算式如下:qh=c1-32-128=c1-160
}

我要回帖

更多关于 计算机汉字处理过程 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信