XML就在您的未来

通过Gary A. Mintchell,控制工程 一九九九年十一月一日

C如果你使用个人电脑并使用web技术访问数据,那么XML就是你的未来。XML是可扩展标记语言的三个字母的首字母缩写。它是一种标记元语言和语法,用于创建声明性语言。它的标准是由万维网联盟(W3C)拥有的,可以在Web上找到www.w3.org

XML基于SGML,常用的页面描述语言HTML也是如此。XML描述的不是页面,而是数据和信息对象。W3C描述的一些好处包括:

  • 实现国际化的独立媒体的电子出版;

  • 允许行业定义与平台无关的数据交换协议,特别是电子商务数据;

  • 将信息以可在接收后自动处理的形式传递给用户代理;

  • 让人们更容易使用廉价的软件来处理数据;而且

  • 提供元数据——关于信息的数据——帮助人们查找信息,并帮助信息生产者和消费者找到彼此。

XML编码有两种“风格”——格式良好的而且有效的.在格式良好的元素中,开始和结束标记匹配,空元素具有特殊的形式,没有重叠的元素,并且属性被引用。有效的XML是格式良好的,并且它遵循由文档类型定义(DTD)或模式定义的结构。

这个简单的示例演示了一个XML文档。这家公司在网上销售产品。营销描述是用HTML编写的,但客户的姓名和地址,以及价格和折扣是用XML格式化的。下面是描述客户的信息:

Acme制药公司

斯莫基大道7301号
超人前传
印第安纳州
l94571

XML语法使用匹配的开始和结束标记(如和)来标记信息。由标记标记的信息称为元素。元素可以通过附加名为属性的名称-值对(例如,在上面的例子中,country= ' US ')来进一步丰富。

词汇表定义元素。它们确定元素名称,定义属性,可以是正式的,也可以是非正式的。形式规范包括DTD或Schema。DTD是W3C下定义的标准,而Schema标准正在开发中。每个行业都可能有定义好的模式,例如,流程和数据采集行业将为可以跨应用程序边界共享的重要数据定义了数据类型和结构。

DTD中的所有数据都是字符串。DTD是一种控制数据创建的好方法,它允许程序员:

  • 定义一组彼此之间具有特定关系的特定标记;

  • 为属性定义默认值;

  • 定义额外的文本和二进制实体,以及它们相关的符号;而且

  • 指示起始(根)元素。

对于某些用途,应用程序可能需要更有信息的标记构造定义,或者文档结构的约束更紧、更松,或者与使用定义的dtd表示的约束完全不同。还有一种广泛的愿望是允许以基于XML的语法指定标记构造和约束,以便允许在规范上使用XML文档的工具。

XML模式工作组正在处理结构、数据类型和一致性的模式定义。模式结构的目标包括定义元素类型内容上的不完全约束、结构模式与原始数据类型的集成以及继承(即使kind关系显式而不是像目前所做的那样只是部分关系的机制)。基元数据类型包括基于SQL和Java基元经验的整数、日期和字节序列的定义。委员会也在调查是否符合规定的检查方法。

其思想是XML模式语言可用于为XML文档类定义、描述和编目XML词汇表。以监控和数据采集为例。网络设备的管理和使用涉及到数据和控制消息的交换。服务器可以使用Schemata来确保传出消息的有效性,客户机也可以使用Schemata来确定它能够理解消息的哪一部分。在多供应商环境中,区分由不同模式(行业标准,特定于供应商)管理的数据,并知道什么时候忽略不理解的信息是安全的,什么时候应该引发错误;提供透明度控制。

随着支持web的设备和基于浏览器的界面越来越流行,标准通信结构变得更加重要。COM、DCOM和OPC已经广泛用于多厂商应用程序通信。XML将成为另一个重要的数据通信工具。

评论?
电子邮件gmintchell@cahners.com