RTF是一种在不同操作系统下不同应用软件之间进行文本和图象信息交换的文件格式。下面是小编整理的什么是rtf文件,欢迎阅读。
什么是rtf文件
也称富文本格式(Rich Text Format, 一般简称为RTF),意为多文本格式是由微软公司开发的跨平台文档格式。大多数的文字处理软件都能读取和保存RTF文档。[1] rtf是一种非常流行的文件结构,很多文字编辑器都支持它,vb等开发工具甚至还提供了richtxtbox的控件。
rtf文件简介
以纯文本描述内容,能够保存各种格式信息,可以用写字板,Word等创建。
也称富文本格式(Rich Text Format, 一般简称为RTF)是由微软公司开发的跨平台文档格式。大多数的文字处理软件都能读取和保存RTF文档。
首先它是一般来写字板的默认文档之一,但除了它以外,Word、WPS Office、Excel等都可以打开RTF格式的文件。它的打开速度快,rtf是一种非常流行的文件结构,而且无损害的的一种格式。很多文字编辑器都支持它,vb等开发工具甚至还提供了richtxtbox的控件。编写通用工具的程序员应该考虑在自己的软件中加入读写rtf文件的功能,这样就需要对rtf的结构有充分的了解。而现在最重要的信息发布手段莫过于www了,在编辑软件中提供rtf到html的转换也是程序员应该考虑的事情。
rtf文件分析
结构分析
rtf的结构并不复杂,但内容繁多,本文不可能一一说明,只能从总体上讨论一下(如果想阅读详尽的rtf文档,则可在internet上寻找或与笔者联系。)每个rtf文件都是一个文本文件,显示时由rtf阅读器格式化。文件开始处是{
tf,它作为rtf文件的标志是必不可少的,rtf阅读器根据它来判断一个文件是否为rtf格式。然后是文件头和正文,文件头包括字体表、文件表、颜色表等几个数据结构,正文中的字体、表格的风格就是根据文件头的信息来格式化的。每个表用一对大括号括起来,当中包含了很多用字符“”开始的命令。例如,某个颜色表如下:
{colortbl;red0green0blue0;red0green0blue255;red0green255blue255;red0green255blue0;red255green0blue255;red255green0blue0;red255green255blue0;red255green255blue255;red0green0blue128;red0green128blue128;red0green128blue0;red128green0blue128;red128green0blue0;red128green128blue0;red128green128blue128;red192green192blue192;}
开始时用colortbl标明大括号内是颜色表,接着是red0green0blue0,登记了一种颜色,这种颜色的红绿蓝分量都为0。其它表依此类推。文件头之后是正文,正文由版面格式化命令、文字和各种特殊命令组成。其中只有特殊命令用大括号括起来,而版面格式化命令和文字是“开放式”的,从而把文字和命令分离。文件结束时有一个“}”,和第一个“{”对应。在整个文件中,“}”和“{”必须一一对应。这种格式是rtf阅读器和转换器算法的基础。
rtf格式还有一个特别之处,就是有些字符在命令中有特殊的含义,所以当它们作为文本出现时需要在它们的前面加一个“”,例如“”本身就要表示为“”。
算法分析
本节介绍的算法虽然是针对rtf的读写,但也是一般文件过滤器通用的方法,适用于各种格式文件之间的转换。具体来说就是把各种文件都转换成一种中间格式,再根据要求进行显示或转换。其中有个原则是一定要遵守的:程序必须能过滤掉不认识的格式。各种文件都有其特殊的格式,在转换过程中不可避免会出现格式损失的现象,在算法中要考虑这种情况。对于rtf这类格式化文本文件来说,最重要的是要正确地显示或转换文件的大小、颜色、字体等风格。因此,在程序中应该用一个数据结构把这些信息存起来,这个结构就是所谓的中间格式,怎样规定悉听尊便。以下是其流程图:
难点分析
一.中文的表示方式:在rtf中中文用命令的形式表示:“'内码”。内码就是汉字机内码。不过,请注意:rtf是文本文件,内码是用ascii码来储存的,必须把它转换成数字才能使用。例如,“电子与电脑”在rtf中的形式是:
'b5'e7'd7'd3'd3'eb'b5'e7'c4'd4
二.图片的问题:rtf中图片以两种方式存在:第一种方式是直接嵌入,以{pict开始;第二种方式是作为ole对象嵌入,这时以{object开始。当rtf处理器能直接使用ole时,rtf文件中提供了ole的数据;否则,文件中直接提供图片的数据,以{result开始。在使用中最常见的图片格式是内含dib bitmap的元文件(metafile),这种格式在sdk中没有说明,而且在rtf中是以压缩形式储存的,所以在转换时有一定困难。[2]
rtf文件特点
对普通用户而言,RTF格式是一个很好的文件格式转换工具,用于在不同应用程序之间进行格式化文本文档的传送。通用兼容性应该是RTF的最大优点,但同时也就具有它的缺点,比如文件一般相对较大(可能因为嵌入了兼容各种应用程序的控制符号)、WORD等应用软件特有的格式可能无法正常保存等。
rtf文件标准
作为微软公司的标准文件,早期外间需要数十美元向微软付款,才能购买一本薄薄的RTF标准文件。不过随着采用RTF格式标准的软件愈来愈多,RTF格式也愈来愈普遍,微软公司就把标准文件公开,放在网上供开发者下载。现时可供下载的各个RTF版本标准文件如下:
RTF 1.9.1 specification (March 2008)
RTF 1.8 specification (April 2004)
RTF 1.6 specification (May 1999)
RTF 1.5 specification (April 1997)
RTF 1.3 and 1.5 specifications
RTF 1.0 specification (June 1992)
rtf文件格式
rtf格式作为一个标准应该是统一的,但在某种情况下进行扩展是必要的。最明显的例子是微软的word,它有自己独有的rtf命令。如果想使自己的软件在技术上占有优势,也可以通过创造新的rtf命令来实现。例如,如果你希望在软件中支持dhtml,则可在rtf中嵌入{dhtml或{java之类的命令。由于rtf阅读器有过滤不认识命令的功能,所以这样做不会影响rtf文件的通用性。[3]
rtf文件软件
RTF格式是许多软件都能够识别的文件格式。比如Word、WPS Office、Excel等都可以打开RTF格式的文件,这说明这种格式是较为通用的。这是一种类似DOC格式(Word文档)的文件,有很好的兼容性,使用Windows“附件”中的“写字板”就能打开并进行编辑。使用“写字板”打开一个RTF格式文件时,将看到文件的内容;如果要查看RTF格式文件的源代码,只要使用“记事本”将它打开就行了。这就是说,你完全可以像编辑HTML文件一样,使用“记事本”来编辑RTF格式文件。