文件之战——一个新的希望和一个老朋友

系谱学家和历史学家都很清楚寻找和翻译旧文献的问题。当信息技术加入其中时,由于可能的不同文件格式的数量,问题变得更加困难。不幸的是,在IT世界中,“旧文档”可能只有15年的历史,通常比产品的生命周期还短。

通过丹尼斯Brandl 二七年七月一日

系谱学家和历史学家都很清楚寻找和翻译旧文献的问题。当信息技术加入其中时,由于可能的不同文件格式的数量,问题变得更加困难。不幸的是,在IT世界中,“旧文档”可能只有15年的历史,通常比产品的生命周期还短。15年前,微软Windows 3.0是最常用的操作系统,Word Perfect是一种常用的文档格式

由于这些格式问题,IT部门一直在努力更新仍然需要的存档文件,或者专利或其他法律目的可能需要的存档文件。这些文件通常包括生产文件,如配方、生产记录以及材料和人员跟踪信息。IT行业正在通过格式化标准解决文档转换问题。关于标准的IT之争通常是公开而吵闹的,但最近关于文档标准的斗争正在ISO/IEC标准领域创下新高。竞争者是开放文档格式(ODF)、微软的开放Office XML (OOXML)和Adobe的可移植文档格式(PDF)格式。所有这三种格式标准都在标准社区中艰难前行。

ODF目前在2006年发布的ISO/IEC 26300标准中定义。它为文字处理文档、电子表格、演示文稿、图形和数学方程定义了文件格式标准。ODF标准得到了几个开放源码项目的支持,ODF的主要贡献者是Sun Microsystems。尽管努力使ODF成为ISO/IEC标准,但它还没有成为广泛使用的格式。

微软在2007年1月向ISO/IEC联合技术委员会提交了长达6000页的OOXML规范,作为ISO/IEC 29500标准。OOXML为专门的基于xml的文档定义了一个文档容器,这些文档大致对应于MS-Office中可用的文件类型(例如文档、电子表格、演示文稿和图形)。OOXML标准是按照快速通道程序提交的,这引起了几个国家委员会的严重怀疑,他们是否能够在现有时间内充分审查该实质性文件。与ODF标准的重叠也被认为是一个严重问题。

虽然对存档文档具有可编辑的格式可能很重要,但它通常不如具有可打印和可搜索的格式重要。这就是为什么Adobe Systems开发的PDF格式应该作为可能的格式标准被包括在内。PDF标准已经是事实上的它是保存可打印和可搜索文件的标准,也正在成为ISO标准的过程中。PDF标准自1993年以来一直是公开可用的,是一种稳定且经过良好测试的格式。

有了所有这些选项,决定文档归档格式可能会很困难,但有三个简单的规则可以让您在很长一段时间内都能够阅读和搜索文档。规则1:如果文档只有文本,将其归档为文本文件。规则2:如果文档必须被编辑,那么将其归档到工具可用的最新版本中。规则3:否则将文档归档为PDF格式。ODF和OOXML格式还没有显示出文本和PDF的持久力。它们可能允许您保存可编辑的文档,但这通常不如拥有可打印和可搜索的文档重要,特别是对于存档的文档。

作者信息
丹尼斯·布兰德尔是北卡罗来纳州卡里BR&L咨询公司的总裁,dbrandl@brconsulting.com