分析

互操作性以及如何维持它

分析时代的词汇和概念

由山姆的机会 2019年10月30日
礼貌:剑桥语义

任何数字转换的一个关键方面是互操作性。组件、设备和系统的互操作性是必要的,因为如果没有互操作性,组织将继续将宝贵的资源花费在昂贵、低效和脆弱的数据搜索、准备和聚合功能上。分析和自动化的真正价值仍然缺乏。

换句话说,定位、理解、访问和信任数据的能力是实现数字转换的关键。在这种情况下,互操作性是系统(包括组织)交换和使用信息的能力,而不知道协作系统或组织的特征或内部工作。

此外,按照惯例,我们观察到互操作性的“级别”,其中每一级别都增加了网络或社区中的互操作性。建议是,更好的互操作性会带来更大的自主权。就我们的目的而言,突出的层次是基于标准的、语义的和持续的互操作性。

基于标准的互操作性包括涵盖许多业务领域和相关申请活动的专用参考模型。从设计阶段到生产和商业化,制定标准以使组织能够根据共同模型进行交换信息。

语义互操作性计算机系统是否与明确交换数据的能力,机器可以理解的意思。语义互操作性是实现信息系统之间的机器可计算逻辑、推理、知识发现和数据联合所必需的。

图1:一个拟议的持续互操作性模型,以维持网络和谐。礼貌:剑桥语义

图1:一个拟议的持续互操作性模型,以维持网络和谐。礼貌:剑桥语义

换句话说,尽管数据格式和结构标准,收件人可能并不总是可以理解信息。可以编码明确的知识,但默认知识需要人类互动。语义互操作性添加了语义注释和知识丰富,以解决这些问题。本体代表了实现知识富集和达到语义互操作性的当代方法。

网络协调

持续的互操作性维护网络协调。作为一个研究领域,这涉及到与复杂适应系统(CAS)相关的理论。组织──和网络──必须适应才能生存。变化是不断的。模型和语义的变化,可以打破网络的和谐,引入互操作性的新维度。

因此,当一个网络成员适应一个新的需求时,就会产生一个波及整个网络的涟漪,并且网络开始遇到互操作性问题。维持互操作性的一个模型包括一个监测系统,它可以检测破坏网络和谐的行为。在发现事件后,智能集成层对变化进行解释,并设计适应变化的策略。然后,一个决策支持系统评估该策略并决定行动方针,使用通信层通知网络该行动,以恢复网络的和谐。因此,网络进化以恢复和谐。

图2:本体是一个语义互操作性启动器。礼貌:剑桥语义

图2:本体是一个语义互操作性启动器。礼貌:剑桥语义

我们相信语义互操作性是实现数字转换的关键因素。但是,我们如何实现语义互操作性呢?人们早就认识到,互操作性可以通过以机器可处理的形式提供可理解的内容而受益,而且人们普遍认为,本体将在提供支持这一目标的支持基础设施方面发挥关键作用。

本体论是关键

在最广泛的意义上,本体论是存在存在,生物及其关系的性质。在信息科学中,本体提供了一种创造明确知识的手段。“本体论是现实世界领域内的实体概念,类型,属性和相互关系的正式规范。本体提供人类和机器准确理解的背景或意义。在本体中确保了对信息的共同理解。在实践本体中描述和链接不同和复杂的数据。本体的重要架构考虑因素包括以下内容。

  • 本体使重复使用是域名的(上层)本体的基础概念,可以在域中使用。
  • 模块化本体允许根据具体需求来分离和重组本体的不同部分,而不是创建单一的常见本体。
  • 可扩展性本体允许本体的进一步增长为特定应用。
  • 可维护性在本体中有助于识别和纠正缺陷的过程,适应新的要求,并在本体中的变化中调整。
  • 本体支持设计和实现关注点的分离,确实如此灵活的变化在具体实现技术中。

值得注意的是,非正式的本体可能会导致歧义。基于非正式本体的系统比基于正式本体的系统更容易出错。正式的本体允许自动推理和一致性检查。正式的本体从包含关系相关的概念的分类法到复杂关系相关的概念的完整表示。正式的本体论包括约束其预期的概念解释的公理。

图3:作为概念化的显式规范的本体。礼貌:剑桥语义

图3:作为概念化的显式规范的本体。礼貌:剑桥语义

我们需要一种语言来创建标准的和可共享的本体。当一个人对现实世界的一部分进行建模时,即某个感兴趣的领域,一个概念化就存在于他的头脑中。这是基于领域中存在的概念和它们的显著关系。本体语言提供了一种表示概念的机制。整个领域规范都是用这种语言表达的。因此,本体是某个领域概念化的显式规范。

那么,我们如何达到一个标准的本体语言呢?

在20世纪90年代,有一种认可,诸如HTML和XML等语言的知识表示不足。HTML以人类友好的演示文稿呈现给呈现信息。XML提供了一个独立于平台的数据交换模型。

1999年,欧盟发起了本体推理层(OIL)的开发。注意,有时“信息”会用来代替“推断”。OIL是基于描述逻辑的强大的形式基础,即SHIQ。OIL与一个非常轻量级的模型Resource Description Framework Schema (RDFS)兼容,这个模型在1998年就已经标准化了。

2000年,美国国防高级研究计划局(DARPA)发起了DARPA代理标记语言(DAML)项目。DAML将成为下一代网络的基础,而下一代网络将越来越多地利用“智能”代理和程序。其中一个目标是减少对人类解释数据的严重依赖。DAML扩展了XML、RDF和RDFS的支持机器可理解.DAML包括了描述逻辑的“一些”强大的正式基础,但更侧重于实用的应用。

图4:标准本体语言的路径。礼貌:剑桥语义

图4:标准本体语言的路径。礼貌:剑桥语义

大约2001年,来自美国的小组和欧盟合作合并达摩和石油,其结果称为达摩+油。Daml + Oil提供了支持机器和人类可易理性的正式语义。这种新语言还提供了扩展机器运行的推理服务的公理化或推理规则。

2004年,万维网联盟(W3C)从Daml + Oil派生了Web本体语言(OWL),并将其作为创作本体的“标准”知识表示语言发布。初始猫头鹰规范包括三个“种类”的猫头鹰:OWL Lite,OWL DL和OWL FUNT,每个猫头鹰都是满足的,每个猫头鹰都提供了提高的表达和复杂性。2009年,W3C发布了猫头鹰2,其阐述了针对不同推理要求和应用领域的不同版本的猫头鹰。最新的W3C猫头鹰2建议于2012年12月11日。

整个发展过程可以恰当地描述为“使数据智能化而不是软件智能化”。由于数据对所有软件过程和数字转换领域都是“公共的”,我们可以更有效地实现互操作和自治系统。

标准化的推动者

在OWL最初发布之后,W3C在“语义Web”标签下阐述了一组标准和方法。在这种构造中,采用者和供应商实现的用于创建机器可理解的、丰富的上下文化知识的主要标准包括资源描述框架(RDF)、RDF模式(RDFS)、Web本体语言(OWL)和SPARQL协议和RDF查询语言(SPARQL)。

RDF提供创建,存储和交换语义数据的手段。RDF是一种定向的非循环图(DAG),即用于我们的目的,这意味着概念既不根据自己的其他概念定义,也不是间接地指的其他概念。RDFS是一组类,具有在RDF上构建的某些属性,以提供RDF数据中概念的描述的基本元素。OWL在RDF上构建,以添加更多构造以指定或模型域或应用程序。SPARQL提供了查询语义数据的方法,包括分布式源。SPARQL的“协议”部分标准化发布和通信的手段,通常为一般为“SPARQL端点”。RDF,RDF和猫头鹰在简单的三个元素结构中实现,通常称为“三重”声明或事实。现有数据源可以表示为三元组。来自其他不同数据源的三元组可以链接以创建通用和机器可理解的“数据结构”。

图5:W3C语义web标准创建了机器可理解的数据和元数据。礼貌:剑桥语义

图5:W3C语义web标准创建了机器可理解的数据和元数据。礼貌:剑桥语义

此外,支持语义Web标准机器推理从现有事实推断出新的事实的服务;也就是说,语义技术使隐式数据显式化。语义Web标准允许人和机器数据消费者明确地知道数据的含义。

语义Web标准用标准和可重复的方法创建机器可理解的上下文。正如Web是分布式和去中心化的,使用语义Web技术的数据源也是如此。这个想法是让数据生产者发布机器可理解的内容,软件和人类消费者可以以可靠和可重复的方式发现和消费这些内容。面向服务体系结构中的概念是密切相关的。随着生态系统的发展,对标准化发布、查找和调用语义数据和服务的需求也随之增加。与传统的数据标准不同,本体不需要集中管理。随着采用的增加,本体会随着时间的推移而增长、发展和适应。高级本体自然会变得更受欢迎,并获得关注。由于本体是建立在存在及其关系的基础上的,信息系统中的术语趋向于对齐。

对“自顶向下”或“高度协调的”计划和实现的数据架构的需求减少了,因为模型是分散的、分布式的,并且基于旨在以联邦方式实现语义互操作性的形式化本体。一个超出本文范围的主题,基于本体论的方法假设“一个人永远不会拥有所有的事实”。以前的方法没有做这个假设,这导致了不灵活的设计,在设计阶段就必须知道需求。

值得注意的是,语义技术用于机器与机器之间的交互。当然,利用语义技术的应用程序可能是面向用户的。但更大的愿景是实现一个“机器Web”,一个能够正确理解并更自主地操作的Web。

这篇文章发表在Iiot工程师补充的控制工程设备工程.请参阅下面补充的其他文章。


萨姆机会
作者生物:Sam Chance是波士顿剑桥语义学的首席顾问