]> git.sesse.net Git - xml-template/blob - tests/xml-diff.pl
Check the contents of text nodes when diffing.
[xml-template] / tests / xml-diff.pl
1 #! /usr/bin/perl
2
3 #
4 # Compare two XML files for structural and content equivalence. Used for
5 # regression testing.
6 #
7
8 use strict;
9 use warnings;
10
11 use XML::DOM;
12 use XML::Parser;
13 use XML::NamespaceSupport;
14
15 my $parser = XML::DOM::Parser->new;
16 my $d1 = $parser->parsefile($ARGV[0]);
17 my $d2 = $parser->parsefile($ARGV[1]);
18 my $nsup1 = XML::NamespaceSupport->new;
19 my $nsup2 = XML::NamespaceSupport->new;
20
21 compare($d1, $d2, $nsup1, $nsup2);
22
23 sub compare {
24         my ($n1, $n2, $nsup1, $nsup2) = @_;
25
26         if ($n1->getNodeType != $n2->getNodeType) {
27                 printf STDERR "Node types don't match (%u vs. %u)\n",
28                         $n1->getNodeType, $n2->getNodeType;
29                 exit(1);
30         }
31
32         $nsup1->push_context;
33         $nsup2->push_context;
34
35         if ($n1->getNodeType == XML::DOM::ELEMENT_NODE) {
36                 process_namespaces($n1, $nsup1);
37                 process_namespaces($n2, $nsup2);
38         }
39
40         my ($nsuri1, undef, $lname1) = $nsup1->process_element_name($n1->getNodeName);
41         my ($nsuri2, undef, $lname2) = $nsup2->process_element_name($n2->getNodeName);
42
43         $nsuri1 |= '';
44         $nsuri2 |= '';
45
46         # compare element names
47         unless ($nsuri1 eq $nsuri2 && $lname1 eq $lname2) {
48                 print STDERR "$nsuri1/$lname1 != $nsuri2/$lname2\n";
49                 exit(1);
50         }
51
52         # compare attributes
53         my $attrs1 = $n1->getAttributes;
54         my $attrs2 = $n2->getAttributes;
55
56         # this will need some special care, since we ignore xmlns= attributes; defer
57         # to its own function so it's easier to do comparison both ways
58         compare_attr_list($attrs1, $attrs2, $nsup1, $nsup2) if (defined($attrs1));
59         compare_attr_list($attrs2, $attrs1, $nsup2, $nsup1) if (defined($attrs2));
60
61         # if this is a text node, check the contents
62         if ($n1->getNodeType == XML::DOM::TEXT_NODE) {
63                 my $d1 = $n1->getData;
64                 my $d2 = $n2->getData;
65
66                 # ignore leading/trailing whitespace
67                 $d1 =~ s/^\s+//;
68                 $d2 =~ s/^\s+//;
69                 $d1 =~ s/\s+$//;
70                 $d2 =~ s/\s+$//;
71
72                 if ($d1 ne $d2) {
73                         print STDERR "$nsuri1/$lname1 has differing textual content\n";
74                         exit(1);
75                 }
76         }
77
78         # this element is ok, let's compare all children
79         my $c1 = $n1->getChildNodes;
80         my $c2 = $n2->getChildNodes;
81
82         if ($c1->getLength != $c2->getLength) {
83                 print STDERR "$nsuri1/$lname1 has differing number of children\n";
84                 exit(1);
85         }
86
87         for my $i (0..($c1->getLength-1)) {
88                 compare($c1->item($i), $c2->item($i), $nsup1, $nsup2);
89         }
90
91         $nsup1->pop_context;
92         $nsup2->pop_context;
93 }
94
95 sub process_namespaces {
96         my ($node, $nsup) = @_;
97
98         my $attrs = $node->getAttributes;
99         return unless defined($attrs);
100
101         for my $attr ($attrs->getValues) {
102                 my $name = $attr->getName;
103                 if ($name =~ /^xmlns:(.*)$/) {
104                         $nsup->declare_prefix($1, $attr->getValue);
105                 }
106         }
107 }
108
109 sub compare_attr_list {
110         my ($attrs1, $attrs2, $nsup1, $nsup2) = @_;
111
112         for my $attr1 ($attrs1->getValues) {
113                 my $name = $attr1->getName;
114                 next if ($name =~ /^xmlns:(.*)$/);
115                 
116                 my ($nsuri1, undef, $lname1) = $nsup1->process_attribute_name($attr1->getName);
117                 $nsuri1 |= '';
118
119                 if (!defined($attrs2)) {
120                         # n2 has no attributes at all
121                         print STDERR "Attribute $nsuri1/$lname1 exists on one side but not the other\n";
122                         exit(1);
123                 }
124
125                 my $attr2_found;
126                 for my $attr2 ($attrs2->getValues) {
127                         next if ($attr2->getName =~ /^xmlns:(.*)$/);
128                         my ($nsuri2, undef, $lname2) = $nsup2->process_attribute_name($attr2->getName);
129                         $nsuri2 |= '';
130                 
131                         if ($nsuri1 eq $nsuri2 && $lname1 eq $lname2) {
132                                 $attr2_found = $attr2;
133                                 last;
134                         }
135                 }
136
137                 if (!defined($attr2_found)) {
138                         print STDERR "Attribute $nsuri1/$lname1 exists on one side but not the other\n";
139                         last;
140                 }
141
142                 if ($attr1->getValue ne $attr2_found->getValue) {
143                         print STDERR "Attribute $nsuri1/$lname1 has differing values\n";
144                 }
145         }
146 }