XML:数据管理的未来

XML(可扩展标记语言)派生自SGML(标准通用标记语言)。SGML是在1986年作为国际标准(ISO 8879)创建的,它提供了将描述性标记嵌入文档的标准格式。描述性标记指的是定义文档表示的代码片段(通常称为“标记”)。

劳拉·祖拉斯基著 二零零零年七月一日

XML(可扩展标记语言)派生自SGML(标准通用标记语言)。SGML是在1986年作为国际标准(ISO 8879)创建的,它提供了将描述性标记嵌入文档的标准格式。描述性的标记指定义文档表示的代码片段(通常称为“标记”)。

XML通过重新定义一些内部参数使SGML更适合在万维网上使用,从而使SGML更进一步。XML与其他web语言(如HTML(超文本标记语言,SGML的另一个衍生产品)的不同之处在于标记标签不是预定义的。

XML的工作原理

HTML只适合显示文档。但是,如果需要实际利用这些文档中包含的信息,HTML就帮不上什么忙了。这就是XML可以派上用场的地方。在XML中创建的用户定义标记可以由其他web应用程序处理,并且可以以比以前使用HTML更动态的方式使用。

例如,考虑图1中的HTML:

返回的内容看起来像一个项目符号列表。如果您只想简单地显示信息,这很好,但是如果您想将其用于其他用途,该怎么办呢?也许你想把信息以不同的格式拉到服务器上的另一个网页上。然后,您将需要XML,您可以使用它来生成如图2所示的文件:

这看起来与HTML不同,其工作方式也不同。HTML文件中的标签描述了标签中包含的信息的外观。XML文件中的标记描述了信息是什么。

与XML文件关联的是文档类型定义(DTD),它描述了如何处理用户定义的标记。上面XML示例的DTD可能如图3所示:

这个DTD给出了标记的参数。元素“mailinglist”可以包含介绍,也可以不包含介绍,但必须包含姓名、地址、城市和国家。定义为“#PCDATA”的其他元素都是纯文本,由用户输入的内容定义。

DTD可用于提取XML文件中的信息并将其放置在其他地方,例如创建邮件标签的程序。

有效,结构良好的

调用具有关联DTD并符合该DTD的XML程序有效的。然而,XML与SGML的一个不同之处在于,它并不一定需要有效才能发挥作用。可以独立于DTD创建XML文件,需要注意的是,文件中定义的标记仅限于该文件。通过使用DTD,用户可以创建具有相同标记的多个文件。

无论文件是否使用DTD,它都必须是格式良好的。这意味着它必须遵循某些指导方针,以确保正确解析文件。这些指导方针包括:

  • 所有元素都必须有开始和结束标签;

  • 所有"空" HTML标签(HTML中不需要结束标签的标签)必须以" />;"

  • 如果不使用DTD,则必须将文件定义为“独立的”;

  • 所有属性元素必须用引号括起来;和

  • 标签必须按适当的顺序嵌套。

什么是未来

XML存在的时间很短,但是已经有了改进它的行动。XML爱好者正在开发超越常规dtd功能的模式。这些模式可能最终会形成行业标准。

微软(Microsoft)的研发就是其中之一。BizTalk计划,旨在为整个企业和行业实现XML模式提供一个开放的设计框架。Sequencia(菲尼克斯,亚利桑那州)是最早为流程工业开发BizTalk模式的公司之一。XML是其最新Internet项目ProcessPoint.com背后的驱动力,ProcessPoint.com是一个基于已发布的BizTalk模式的企业对企业门户,支持行业专业人员之间的交互。

有关XML和BizTalk的更多信息,请转到www.globalelove.com

作者信息
劳拉·祖拉斯基,网络编辑lzurawski@cahners.com

图1

&font face= " arial " size= " 4″>

&b>&i>这是一些信息:&/i>&/b>

ul >

&li>约翰Q.公众&/li>

&li>大街1234号&/li>

李,>任何城镇/ >

李,>美国/ >

& / ul >

& /字体>

图2

邮寄名单>

& introduction >这是一些信息:&/ introduction >

&name>John Q. Public&/name>

&address>1234 Main Street&/address>

城市>任何城镇(市)>

乡村>美国/国家>

& /邮件列表>

图3

& !文档类型mailinglist [

& !元素邮件列表(介绍?,

姓名,地址,城市,国家)>

& !element intro (#PCDATA)>

& !元素名称(#PCDATA)>

& !元素地址(#PCDATA)>

& !element city (#PCDATA)>

& !元素国家(#PCDATA)>