f2h2h1.github.io

各种标记语言

什么是标记语言

“标志(markup)”这个词来源自传统出版业的“标记”一个手稿, 也就是在原稿的边缘加注一些符号来指示打印上的要求。 长久以来,这个工作都是由专门的人(”markup men”)以及校对人来进行, 对原稿标志出使用什么样的字体,字体以及字号, 然后再将原稿交给其它人进行手工的排版工作。

根据维基百科对其的解释,“Markup language” 是用标准的标记来解释纯文本文档的内容,从而提供关于文档结构或文档该如何渲染的信息。

标志语言通常可以分为三类:表示性的、过程性的以及描述性的。

标记语言的发展

XML 大致的发展关联

               ┌──────────────────────┐
               │                      │
               │          ┌───────────┼─────────┐
               │          │           │         │
               │          │           ▼         ▼
  GML ──────► SGML ────► HTML ─────► XML ────► HTML5
                          │           │         ▲
                          │           │         │
                          │           ▼         │
                          └───────► XHTML ──────┘

虽然现在提及标记语言,通常就是指 XML 和基于 XML 的其它标记语言。 但笔者认为像 JSON Yaml ini 这类基于文本的数据格式也可以归类到标记语言里。

一些常见标记语言的应用

XSL

XSL 指扩展样式表语言(EXtensible Stylesheet Language)。 CSS 是 HTML 样式表,那么 XSL 就是 XML 样式表。 W3C 开始发展 XSL 的原因是:存在着对于基于 XML 的样式表语言的需求。

XSL - 不仅仅是样式表语言, XSL 包括三部分:

Web services

Web services 平台的元素:

SOAP 是交换数据的一种协议规范, 使用在计算机网络Web服务(web service)中,交换带结构的信息。 SOAP为了简化网页服务器(Web Server)从XML数据库中提取数据时, 节省去格式化页面时间,以及不同应用程序之间按照HTTP通信协议, 遵从XML格式执行资料互换,使其抽象于语言实现、平台和硬件。

UDDI 是统一描述、发现和集成(Universal Description, Discovery, and Integration)的缩写。 UDDI 是一种目录服务,通过它,企业可注册并搜索 Web services。 它是一个基于 XML 的跨平台的描述规范,可以使世界范围内的企业在互联网上发布自己所提供的服务。

WSDL 描述Web服务的公共接口。 这是一个基于XML的关于如何与Web服务通讯和使用的服务描述; 也就是描述与目录中列出的Web服务进行交互时需要绑定的协议和信息格式。 通常采用抽象语言描述该服务支持的操作和信息,使用的时候再将实际的网络协议和信息格式绑定给该服务。

大多数语境下的 Web Services 平台是 XML + HTTP 。 HTTP 是可以替换成其它协议的。 Web Services 的关键是 XML 。 SOAP , UDDI , WSDL 等部分,本质上的区别是 XML 的格式和内容的区别。

RDF

资源描述框架(英语:Resource Description Framework,缩写:RDF), 是万维网联盟(W3C)提出的一组标记语言的技术规范,基于XML语法及XML Schema的资料类型以便更为丰富地描述和表达网络资源的内容与结构。

资源描述框架(RDF)是用于描述网络资源的 W3C 标准, 比如网页的标题、作者、修改日期、内容以及版权信息。

语义网

语义网(英语:Semantic Web)是由万维网联盟的蒂姆·伯纳斯-李(Tim Berners-Lee)在1998年提出的一个概念, 它的核心是:通过给万维网上的文档(如: HTML文档)添加能够被计算机所理解的语义(元数据), 从而使整个互联网成为一个通用的信息交换介质。 语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。 不过语意网概念实际上是基于很多已有技术的,也依赖于后来和text-and-markup与知识表现的综合。

基于 XML 的其它标记语言

各种文档格式

参考