]> git.sesse.net Git - vlc/blobdiff - modules/misc/xml/xtag.c
Removes trailing spaces. Removes tabs.
[vlc] / modules / misc / xml / xtag.c
index 8ed6e550fa65e0a15a277f28be477566df34fc94..d9b866d760f2a3b03a3220827dc2678391ec5c2b 100644 (file)
@@ -3,7 +3,7 @@
  *****************************************************************************
  * Copyright (C) 2003-2004 Commonwealth Scientific and Industrial Research
  *                         Organisation (CSIRO) Australia
- * Copyright (C) 2000-2004 VideoLAN
+ * Copyright (C) 2000-2004 the VideoLAN team
  *
  * $Id$
  *
  *
  * You should have received a copy of the GNU General Public License
  * along with this program; if not, write to the Free Software
- * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111, USA.
+ * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston MA 02110-1301, USA.
  *****************************************************************************/
 
-#include <stdlib.h>
 #include <vlc/vlc.h>
 
 #include "vlc_xml.h"
 #include "vlc_stream.h"
 
 #include <ctype.h>
-#include <string.h>
 #include <stdarg.h>
-#include <stdio.h>
-#include <stdlib.h>
 
 #undef XTAG_DEBUG
 
@@ -85,8 +81,6 @@ static int  Open ( vlc_object_t * );
 static void Close( vlc_object_t * );
 
 vlc_module_begin();
-    set_category( CAT_ADVANCED );
-    set_subcategory( SUBCAT_ADVANCED_XML );
     set_description( _("Simple XML Parser") );
     set_capability( "xml", 5 );
     set_callbacks( Open, Close );
@@ -108,6 +102,8 @@ static char *ReaderName( xml_reader_t * );
 static char *ReaderValue( xml_reader_t * );
 static int ReaderNextAttr( xml_reader_t * );
 
+static int ReaderUseDTD ( xml_reader_t *, vlc_bool_t );
+
 static void CatalogLoad( xml_t *, const char * );
 static void CatalogAdd( xml_t *, const char *, const char *, const char * );
 
@@ -163,26 +159,34 @@ static void CatalogAdd( xml_t *p_xml, const char *psz_arg1,
 static xml_reader_t *ReaderCreate( xml_t *p_xml, stream_t *s )
 {
     xml_reader_t *p_reader;
-    xml_reader_sys_t *p_sys;
-    char *p_buffer;
-    int i_size,i_buffer;
+    char *p_buffer, *p_new;
+    int i_size, i_pos = 0, i_buffer = 2048;
     XTag *p_root;
 
     /* Open and read file */
+    p_buffer = malloc( i_buffer );
+    if( p_buffer == NULL ) {
+        msg_Err( p_xml, "out of memory" );
+        return NULL;
+    }
 
-    i_size = stream_Size( s ) - stream_Tell( s );
-    p_buffer = malloc( i_size + 1 );
-    i_buffer = 0;
-    while( i_buffer < i_size )
+    while( ( i_size = stream_Read( s, &p_buffer[i_pos], 2048 ) ) == 2048 )
     {
-        msg_Dbg( p_xml, "got %d, want %d", i_buffer, i_size );
-        i_buffer += stream_Read( s, &p_buffer[i_buffer], i_size - i_buffer );
+        i_pos += i_size;
+        i_buffer += i_size;
+        p_new = realloc( p_buffer, i_buffer );
+        if (!p_new) {
+            msg_Err( p_xml, "out of memory" );
+            free( p_buffer );
+            return NULL;
+        }
+        p_buffer = p_new;
     }
-    p_buffer[ i_buffer ] = 0;
+    p_buffer[ i_pos + i_size ] = 0; /* 0 terminated string */
 
-    if( !i_buffer )
+    if( i_pos + i_size == 0 )
     {
-        msg_Dbg( p_xml, "empty xml" );
+        msg_Dbg( p_xml, "empty XML" );
         free( p_buffer );
         return 0;
     }
@@ -190,13 +194,14 @@ static xml_reader_t *ReaderCreate( xml_t *p_xml, stream_t *s )
     p_root = xtag_new_parse( p_buffer, i_buffer );
     if( !p_root )
     {
-        msg_Warn( p_xml, "couldn't parse xml" );
+        msg_Warn( p_xml, "couldn't parse XML" );
         free( p_buffer );
         return 0;
     }
 
+    free( p_buffer );
     p_reader = malloc( sizeof(xml_reader_t) );
-    p_reader->p_sys = p_sys = malloc( sizeof(xml_reader_sys_t) );
+    p_reader->p_sys = malloc( sizeof(xml_reader_sys_t) );
     p_reader->p_sys->p_root = p_root;
     p_reader->p_sys->p_curtag = NULL;
     p_reader->p_sys->p_curattr = NULL;
@@ -208,6 +213,7 @@ static xml_reader_t *ReaderCreate( xml_t *p_xml, stream_t *s )
     p_reader->pf_name = ReaderName;
     p_reader->pf_value = ReaderValue;
     p_reader->pf_next_attr = ReaderNextAttr;
+    p_reader->pf_use_dtd = ReaderUseDTD;
 
     return p_reader;
 }
@@ -219,6 +225,11 @@ static void ReaderDelete( xml_reader_t *p_reader )
     free( p_reader );
 }
 
+static int ReaderUseDTD ( xml_reader_t *p_reader, vlc_bool_t b_use )
+{
+    return VLC_EGENERIC;
+}
+
 static int ReaderRead( xml_reader_t *p_reader )
 {
     XTag *p_child;
@@ -334,7 +345,7 @@ static XList *xlist_append( XList *list, void *data )
         if( last->next == NULL ) break;
 
     if( last ) last->next = l;
-    l->prev = last; 
+    l->prev = last;
     return list;
 }
 
@@ -360,6 +371,7 @@ static void xlist_free( XList *list )
 #define X_SLASH       1<<6
 #define X_QMARK       1<<7
 #define X_DASH        1<<8
+#define X_EMARK       1<<9
 
 static int xtag_cin( char c, int char_class )
 {
@@ -370,8 +382,9 @@ static int xtag_cin( char c, int char_class )
     if( char_class & X_SQUOTE )     if( c == '\'' ) return VLC_TRUE;
     if( char_class & X_EQUAL )      if( c == '=' ) return VLC_TRUE;
     if( char_class & X_SLASH )      if( c == '/' ) return VLC_TRUE;
-    if( char_class & X_QMARK )      if( c == '!' ) return VLC_TRUE;
+    if( char_class & X_QMARK )      if( c == '?' ) return VLC_TRUE;
     if( char_class & X_DASH  )      if( c == '-' ) return VLC_TRUE;
+    if( char_class & X_EMARK )      if( c == '!' ) return VLC_TRUE;
 
     return VLC_FALSE;
 }
@@ -541,44 +554,21 @@ static XTag *xtag_parse_tag( XTagParser *parser )
     char *name;
     char *pcdata;
     char *s;
+     int xi;
 
     if( !parser->valid ) return NULL;
 
-#if 0 /* Do we really want all the whitespace pcdata ? */
-    xtag_skip_whitespace( parser );
-#endif
-
-    if( (pcdata = xtag_slurp_to( parser, X_OPENTAG, X_NONE )) != NULL )
-    {
-        tag = malloc( sizeof(*tag) );
-        tag->name = NULL;
-        tag->pcdata = pcdata;
-        tag->parent = parser->current_tag;
-        tag->attributes = NULL;
-        tag->children = NULL;
-        tag->current_child = NULL;
-
-        return tag;
-    }
-
     s = parser->start;
 
-    /* if this starts a close tag, return NULL and let the parent take it */
-    if( xtag_cin( s[0], X_OPENTAG ) && xtag_cin( s[1], X_SLASH ) )
-        return NULL;
-
     /* if this starts a comment tag, skip until end */
-    if( xtag_cin( s[0], X_OPENTAG ) && xtag_cin( s[1], X_QMARK ) &&
+    if( (parser->end - parser->start) > 7 &&
+          xtag_cin( s[0], X_OPENTAG ) && xtag_cin( s[1], X_EMARK ) &&
         xtag_cin( s[2], X_DASH ) && xtag_cin( s[3], X_DASH ) )
     {
-        int xi;
-
         parser->start = s = &s[4];
-
         while( (xi = xtag_index( parser, X_DASH )) >= 0 )
         {
             parser->start = s = &s[xi+1];
-
             if( xtag_cin( s[0], X_DASH ) && xtag_cin( s[1], X_CLOSETAG ) )
             {
                 parser->start = &s[2];
@@ -586,19 +576,79 @@ static XTag *xtag_parse_tag( XTagParser *parser )
                 return xtag_parse_tag( parser );
             }
         }
+        return NULL;
+    }
 
+    /* ignore processing instructions '<?' ... '?>' */
+    if( (parser->end - parser->start) > 4 &&
+          xtag_cin( s[0], X_OPENTAG ) && xtag_cin( s[1], X_QMARK ) )
+    {
+        parser->start = s = &s[2];
+        while ((xi = xtag_index( parser, X_QMARK )) >= 0) {
+            if (xtag_cin( s[xi+1], X_CLOSETAG )) {
+                parser->start = &s[xi+2];
+                xtag_skip_whitespace( parser );
+                return xtag_parse_tag( parser );
+            }
+        }
         return NULL;
     }
 
-    /* FIXME: if this starts a DOCTYPE tag, skip until end */
-    if( xtag_cin( s[0], X_OPENTAG ) && xtag_cin( s[1], X_QMARK ) )
+    /* ignore doctype  '<!DOCTYPE' ... '>' */
+    if ( (parser->end - parser->start) > 8 &&
+            !strncmp( s, "<!DOCTYPE", 9 ) ) {
+        xi = xtag_index( parser, X_CLOSETAG );
+        if ( xi > 0 ) {
+            parser->start = s = &s[xi+1];
+            xtag_skip_whitespace( parser );
+            return xtag_parse_tag( parser );
+        }
+        else {
+            return NULL;
+        }
+    }
+
+    if( (pcdata = xtag_slurp_to( parser, X_OPENTAG, X_NONE )) != NULL )
     {
-        int xi = xtag_index( parser, X_CLOSETAG );
-        if( xi <= 0 ) return NULL;
+        tag = malloc( sizeof(*tag) );
+        tag->name = NULL;
+        tag->pcdata = pcdata;
+        tag->parent = parser->current_tag;
+        tag->attributes = NULL;
+        tag->children = NULL;
+        tag->current_child = NULL;
 
-        parser->start = &s[xi+1];
-        xtag_skip_whitespace( parser );
-        return xtag_parse_tag( parser );
+        return tag;
+    }
+
+    /* if this starts a close tag, return NULL and let the parent take it */
+    if( xtag_cin( s[0], X_OPENTAG ) && xtag_cin( s[1], X_SLASH ) )
+        return NULL;
+
+    /* parse CDATA content */
+    if ( (parser->end - parser->start) > 8 &&
+            !strncmp( s, "<![CDATA[", 9 ) ) {
+        parser->start = s = &s[9];
+        while (parser->end - s > 2) {
+            if (strncmp( s, "]]>", 3 ) == 0) {
+                if ( !(tag = malloc( sizeof(*tag))) ) return NULL;
+                if ( !(pcdata = malloc( sizeof(char)*(s - parser->start + 1))) ) return NULL;
+                strncpy( pcdata, parser->start, s - parser->start );
+                pcdata[s - parser->start]='\0';
+                parser->start = s = &s[3];
+                tag->name = NULL;
+                tag->pcdata = pcdata;
+                tag->parent = parser->current_tag;
+                tag->attributes = NULL;
+                tag->children = NULL;
+                tag->current_child = NULL;
+                return tag;
+            }
+            else {
+                s++;
+            }
+        }
+        return NULL;
     }
 
     if( !xtag_assert_and_pass( parser, X_OPENTAG ) ) return NULL;
@@ -663,12 +713,13 @@ static XTag *xtag_parse_tag( XTagParser *parser )
 
         xtag_skip_whitespace( parser );
         xtag_assert_and_pass( parser, X_CLOSETAG );
-
+        xtag_skip_whitespace( parser );
     }
     else
     {
         xtag_assert_and_pass( parser, X_SLASH );
         xtag_assert_and_pass( parser, X_CLOSETAG );
+        xtag_skip_whitespace( parser );
     }
 
     return tag;
@@ -722,7 +773,7 @@ static XTag *xtag_new_parse( const char *s, int n )
     {
 #ifdef XTAG_DEBUG
         printf ("empty buffer");
-#endif        
+#endif
         return NULL;
     }
     else parser.end = (char *)&s[n];
@@ -895,7 +946,7 @@ static int xtag_snprints( char *buf, int n, ... )
     int len, to_copy, total = 0;
 
     va_start( ap, n );
-  
     for( s = va_arg( ap, char * ); s; s = va_arg( ap, char *) )
     {
         len = strlen (s);
@@ -949,7 +1000,7 @@ static int xtag_snprint( char *buf, int n, XTag *xtag )
         for( l = xtag->attributes; l; l = l->next )
         {
             attr = (XAttribute *)l->data;
-      
             nn = xtag_snprints( buf, n, " ", attr->name, "=\"", attr->value,
                                 "\"", NULL);
             FORWARD( nn );