前言:XML听起来,看起来就是一本标记语言,但是它确实是一个很大的话题,值得我们去研究的!感谢大家对前一篇XML文章(掌握XML系列---第一章---XML基础)的关注!
   

          创建格式良好的XML文档,其实就是使得我们的XML文档能够符合W3C的XML1.0规范,相信大家也不想看W3C条条框框的规范,我们就从实际出发,来说说,怎么样写XML文档.

   

    1.XML中元素:

          前面我们说过,XML的语法要求很严格的,所有的XML标记要关闭的.包含两点:首先.每个XML的开始标记,如<person>都必须有一个XML的结束标记</person>,例子如下:
  1. <person>
  2. <name>
  3.   <firstname>xiao</firstname>
  4. <lastname>yang</lastname>
  5. </name>
  6. </person>
复制代码
其次就是,如果元素没有子元素或者数据,那么就使用空元素的语法来关闭.如:
  1. <person>
  2. <name firstname="xiao" lastname="yang"/>
  3. </person>
复制代码
所以,要关闭所有的元素,而且每个层结结构都必须在相同的级别上打开和关闭,如下就不正确:
  1. <person>
  2. <name>
  3. //---------------------
  4.   <firstname>xiao
  5. </name>
  6.   </firstname>
  7. //--------------------


  8. </person>
复制代码
大家看看中间我用两条线标记的部分,<name>是<firstname>的父元素,但是他们关闭的层次有问题,应该先关闭firstname,然后才是name.



          以上讲的只是创建良好XML文档的最基本的规则,下面我们就来详细的说下更多的规则,我会在中间穿插很多的例子,避免枯燥.



          1.1文档根的

              XML文档必须有唯一的文档根.根元素包含其余的文档数据,换言之,其余的部分就是根元素的子元素,如下就不不对:
  1. <?xml version="1.0" ?>
  2. <capitals>
  3. <country name="china">beijing</country>
  4. <country name="usa">w d.c</country>
  5. </capitals>

  6. <population>
  7. <num>12</num>
  8. </population>
复制代码
上面的文档有两个根元素<capitals>和<population>,所以格式不良好,要使得格式良好就要改改.如下(其实改的方式很多的,只要有唯一的根元素就行):
  1. <?xml version="1.0" ?>
  2. <data>
  3. <capitals>
  4.   <country name="china">beijing</country>
  5.   <country name="usa">w d.c</country>
  6. </capitals>

  7. <population>
  8.   <num>12</num>
  9. </population>
  10. </data>
复制代码
上面的就行了.
   

          1.2 合法和不合法的名称

          在XML中使用元素要遵守一些命名规范,即区分大小写等.下面的就是代表不同的元素,尽管意思一样:

          ,<person>,<PERSON>,<Person>.

          此外还有一些规则:

              (1)"<"字符之后不能存在空格,如<person name>就不行,而<personname>就可以 

              (2)  元素的名字不能以数字或者标记符号开头,可以以字母和下划线开头:如<2name>不合法,而,<_2name>合法.

              (3)第一个字符之后可以有"-"".":如<.name>不合法,而<name.firstname>合法

              (4)不要使用冒号:因为这会与以后要说的命名空间冲突,所以<name:firstname>不合法.

              (5)最好不要用任何形式的xml开头,如<xml_name><Xml_name>就不行,因为一般的xml解析器对此有要求的.



          其实XML中规则也不是那么的多,就像我们当初学习任何一门语言,如C#,都有语法的要求,大家用多了就自然明白了,也不会在乎那么多.所以,xml也一样,大家看多了,自然就认为这些规则也熟悉.



          1.3 非法的字符

          在开始和结束标记之间的文本称为解析过的字符数据或者PCDATA,,可以在数据中使用除了"<"和"&"以外的任意字符,所以下面的例子:
  1. <?xml version="1.0" ?>
  2. <person>
  3. <hello&
  4. </person>
复制代码
把上面的文件保存为person.xml,然后用浏览器打开就会看见如下:

附件: xml.jpg      



    因为在浏览器中有内置的解析器.可以检查XML文档格式良好



    1.4实体引用

      关于实体引用大家应该都熟悉的,因为在html也有,   

      & 的xml实体引用就是& 举例:如果向在xml文档中显示 xiao&yang 那么就就要在编写xml文档时用xiao&yang

    <的xml实体引用就是 <

    >的xml实体引用就是>

    '(单引号)xm实体引用是'

    "(双引号)xml实体引用是&quto;

   

    注意:上面的一些字符,当你想在PCDATA中输入时,就要用他们饿实体引用

    注意PCDATA的概念    下面我们来练习上面的知识:

    加入你想在浏览器中显示下面的效果的(我的网络不是很好,插入代码很慢,所以是手写的,大家见谅):
  1.     <?xml version="1.0"?>

  2.     <person>

  3.           <name>xiao&yang</name>

  4.           <age><30</age>

  5.           <address>"wuhan"</address>

  6.     </person>
复制代码
那么你的xml文档就如下编写:
  1.     <?xml version="1.0"?>

  2.     <person>

  3.           <name>xiao&yang</name>

  4.           <age><30</age>

  5.           <address>&quto;wuhan">&quto;</address>

  6.     </person>
复制代码
当然,那些实体是已经定义好了的,我们也可以定义自己的实体引用,称为通用实体.在DTD中,可以将实体定义为:

    <! ENTITY  personal "this is my person identify ">

    然后你就可以在你的xml文档中引用自己定义的实体引用:
  1.     <person>

  2.           <mypersonal>&personal </mypersonal>

  3.     </person>
复制代码
用浏览器看就是如下:
  1.         <person>

  2.           <mypersonal>this is my person identify </mypersonal>

  3.     </person>
复制代码
今天就到这里吧,讲的有点多,希望大家可以接受,下一篇接着讲.谢谢大家的关注!


掌握XML系列文章


文/小洋  出处/博客园
TOP