假设我可以像这样得到XML:
<Address Field="Street" Value="123 Main"/> <Address Field="StreetPartTwo" Value="Unit B"/> <Address Field="State" Value="CO"/> <Address Field="Zip" Value="80020"/> <Address Field="SomeOtherCrazyValue" Value="Foo"/>
我需要创建一个XSD架构,验证“Street”,“State”和“Zip”必须存在.但我不在乎“StreetPartTwo”和/或“SomeOtherCrazyValue”是否恰好存在.
如果我知道只有我关心的三个可以被包括(并且每个只包括一次),我可以做这样的事情:
<xs:element name="Address" type="addressType" maxOccurs="unbounded" minOccurs="3"/> <xs:complexType name="addressType"> <xs:attribute name="Field" use="required"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:enumeration value="Street"/> <xs:enumeration value="State"/> <xs:enumeration value="Zip"/> </xs:restriction> </xs:simpleType> </xs:attribute> </xs:complexType>
但是这对我的情况不起作用,因为我也可能会收到那些我不关心的其他Address元素(也有“Field”属性).
任何想法如何我可以确保我关心的东西存在,但也让其他东西?
TIA!
肖恩
根据“XML Schema Part 1: Structures” specification ……
When two or more particles contained directly or indirectly in the {particles} of a model group have identically named element declarations
as their {term},the type definitions of those declarations must be the
same.
这并不是说您无法构建将验证正确文档的模式.这意味着,您无法构建无法在某些不正确的文档上进行验证的架构.当我说“不正确”时,我指的是违反您用英语说明的限制的文件.
例如,假设您有一个包含三个Street元素的文档,如下所示:
<Address Field="Street" Value="123 Main"/> <Address Field="Street" Value="456 Main"/> <Address Field="Street" Value="789 Main"/> <Address Field="SomeOtherCrazyValue" Value="Foo"/>
根据您的架构,该文档是有效的地址.可以在模式中添加xs:unique约束,以便拒绝这些损坏的文档.但即使使用xs:unique,对这种模式进行验证也会声明其他一些不正确的文档是有效的 – 例如,一个包含三个< Address>的文档.元素,每个元素都有一个唯一的Field属性,但没有一个具有Field =“Zip”.
事实上,不可能生成一个W3C XML Schema,它正式编写了您所声明的约束. <xs:all>
元素几乎可以帮助您,但它仅适用于元素,而不适用于属性.并且,它不能与扩展一起使用,因此您无法在W3C XML Schema中说“所有这些元素以任何顺序加上任何其他元素”.
为了执行您寻求的验证,您的选择是:
>依赖XML Schema以外的东西,
>在多个步骤中执行验证,第一步使用XML Schema,第二步使用其他功能.
对于第一种选择,我认为你可以使用Relax NG来做到这一点.其缺点是,它不是一个标准,据我所知,它既没有得到广泛支持也没有增长.这就像学习盖尔语以表达思想一样.盖尔语没有错,但它有点像语言学的死胡同,I think RelaxNG is,too.
对于第二个选项,一种方法是作为第一步验证您的模式,然后,作为第二步:
A.应用一个XSL转换,它将转换< Address>元素到为其Field属性的值命名的元素.该转换的输出如下所示:
<root> <Street Value="101 Bellavista Drive"/> <State Value="Confusion"/> <Zip Value="10101"/> </root>
B.根据不同的模式验证该变换的输出,如下所示:
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified"> <xs:element name="root"> <xs:complexType> <xs:all> <xs:element maxOccurs="1" minOccurs="1" ref="Street" /> <xs:element maxOccurs="1" minOccurs="1" ref="State" /> <xs:element maxOccurs="1" minOccurs="1" ref="Zip" /> </xs:all> </xs:complexType> </xs:element> <xs:element name="Street"> <xs:complexType> <xs:attribute name="Value" use="required" type="xs:string"/> </xs:complexType> </xs:element> <xs:element name="State"> <xs:complexType> <xs:attribute name="Value" use="required" type="xs:string"/> </xs:complexType> </xs:element> <xs:element name="Zip"> <xs:complexType> <xs:attribute name="Value" use="required" type="xs:string"/> </xs:complexType> </xs:element> </xs:schema>
您需要扩展该架构以处理其他元素,例如< SomeOtherCrazyValue>在转换的输出中.或者你可以将xsl变换结构化为不发出不属于{State,Street,Zip}的元素.
为了清楚起见,我了解到您无法更改收到的XML.这种方法不需要这样做.它只使用了一个时髦的两步验证方法.第二个验证步骤完成后,您可以放弃转换的结果.
编辑 – 实际上,肖恩,再次考虑这个,你可以只使用步骤B.假设您的XSL转换只是从文档中删除<地址> Field属性值没有State,Street或Zip的元素.换句话说,没有< Address Field =“SomeOtherCrazyValue”...>.可以使用您的模式验证该变换的结果,使用maxOccurs =“3”,minOccurs =“3”和xs:unique.