
第 四 章 文本和表格信息加工 1、理解文本和表格信息加工是人性化信息加工的两类重要应用。 2、体验和认识文本信息加工和表格信息加工的实际价值。 学习目标 第四章文本和表格信息加工 4.1 文本信息加工 1 2 4.2 表格信息加工 4.1 文本信息加工 第四章 文本和表格信息加工 汉字起源于象形文字,至今仍然保留了象形文字的特点。 汉字的造字法有四种:象形、指事、会意、形声。 一、文字及其处理技术 1.文字是人类为了更加流畅地表述意义、传递经验而发明的工具。 甲骨文 殷周时代 金文 西周、春秋 战国文字 春秋战国 小篆 秦朝 隶书 秦朝 楷书 东汉 行书 南北朝 草书 西汉 印刷字体 宋朝 汉字的发展历史 书法是一种凝结了我国民族文化精髓的特殊的艺术形式 兰亭集序(局部) 晋·王羲之 文字处理技术的发展史 历史上使用的文字处理技术,请按时间顺序排列: ①活字印刷;②机械式打字机;③手写;④雕版印刷; ⑤刻字; ⑥计算机文字处理 计算机文字处理技术发展 只能处理拉丁字母以及一些控制符号 过去 可处理包括象形文 字在内的任何文字 现在 ASCII码(美国标准信息交换码),可以表示128个字符 GB2312(1980年)一共收录了7445个字符 Big5(1984), 一共收录了13060个字符 GBK1.0 (1995),收录了21886个符号 GB18030 (2000),收录了27484个汉字和主要的少数民族文字 Unicode( 1994,统一码、万国码),它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。 小结: 从ASCII、GB2312到GBK1.0、GB18030 ,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一处理。 计算机中文处理技术发展简史 1980年代,CCDOS 我国第一个汉字操作系统 1983年,王码五笔字型(突破了汉字数字化的瓶颈) 1984年,联想汉卡 1985年,北大方正的激光照排(印刷业时代) 1988年,金山WPS文字处理软件(中国人自己的文字 处理工具) 1992年,UCDOS 1993年,中文版Windows3.2 ,(第一个简体中文版的Windows操作系统) 1999年,中国新一代国产操作系统———红旗Linux推出。 二、汉字的编码 汉字的编码: 用于输入汉字的编码--输入码(外码) 输入码:区位码、五笔字型、智能ABC等 用于存储汉字的编码--机内码(内码) 机内码:国标码、BIG5码 用于输出汉字的编码--输出码(字型码) 输出码:点阵、向量 汉字处理过程 24×24 例:“春”字在计算机中的处理过程 用于存储汉字的编码,是供计算机系统内部进行存储、加工处理、传输而统一使用的代码,如国标码(GB)和BIG5码。 汉字的编码 输出码(字型码):由汉字的字模信息组成的。 字模(点阵、向量) 储存这个字型码需要8×8=64位二进制, 即8个字节(1字节=8位二进制) 这八个字节所存放的信息就是字模。所有汉字字模信息的集合就构成汉字字库。 三、字处理软件 字处理软件的基本特征: GUI界面:简单易学 功能丰富:个性选择 变化迅速:易于迁移 文本信息的结构化和形象化 结构化:项目式、表格、结构图、流程图等 形象化:借助生动的图形、图像表达信息 Windows操作系统附带的简单文字处理软件 记事本 写字板 Word Microsoft Office套装软件之一,功能强大,国际通用性强 WPS 我国金山公司开发的,更符合中文用户的使用习惯, 具有民族特色 Dreamweaver Frontpage 网页制作工具,适用于制作在网络上流通的网页文件 Powerpoint 文稿演示工具,适用于制作方便演讲者表达信息的现场演示文稿。 …… 常用的字处理软件 体验文字处理技术 汉字的编码 文字及其处理技术 输出码(字型码)—汉字的输出 机内码(内码)———汉字的存储 输入码(外码)———汉字的输入 书法是一 ... ...
~~ 您好,已阅读到文档的结尾了 ~~