Java XML

前言

  • XML,可扩展的标识语言(eXtensible Markup Language),其先驱是 SGML 和 HTML。

  • SGML,通用标识语言标准(Standard Generalized Markup Language),是国际上定义电子文件结构和内容描述的标准,是一种非常复杂的文档结构,主要用于大量高度结构化数据的防卫区和其它各种工业领域,便于分类和索引。

  • 同 XML 相比,SGML 定义的功能很强大,然而它不适于 Web 数据描述,而且价格非常昂贵。

  • XML 教程

  • XML DOM 教程

  • XML Schema 教程

  • Java XML 教程

1、XML

  • XML 作用

    • 丰富文件(Rich Documents)- 自定文件描述并使其更丰富;
    • 属于文件为主的 XML 技术应用;
    • 标记是用来定义一块数据应该如何呈现;
    • 解释数据(Metadata)- 描述其它文件或在线信息;
    • 属于数据为主的 XML 技术应用;
    • 标记是用来说明一块资料的意义;
    • 组态档案(Configuration Files)- 描述软件的组态参数。
  • XML 不是对 HTML 的替代

    • XML 是对 HTML 的补充。
    • XML 不会替代 HTML,理解这一点很重要。在大多数 Web 应用程序中,XML 用于传输数据,而 HTML 用于格式化并显示数据。
    • 对 XML 最好的描述是:XML 是独立于软件和硬件的信息传输工具。
  • 解析 XML 文档的方式主要有两种

    • SAX 就是逐行读取,直到找到目标数据为止。
    • DOM 是先全文档加载,然后读取。

1、XML 解析

  • Java 本身自带对 xml 的解析。在 javax.xml 这个包下,这种方式叫做 sax/dom,非常难用。

  • 因为 Java 自带的很难用,所以就出现了更方便的第三方工具 dom4j, 解析效率大大提高了。

  • 现在又出现了更方便的 Jsoup

文章目录
  1. 1. 前言
  2. 2. 1、XML
  3. 3. 1、XML 解析
隐藏目录