]> git.sesse.net Git - vlc/blob - src/text/strings.c
ee05699631de27fdaf21a13c14f4748e574a8614
[vlc] / src / text / strings.c
1 /*****************************************************************************
2  * strings.c: String related functions
3  *****************************************************************************
4  * Copyright (C) 2006 the VideoLAN team
5  * Copyright (C) 2008-2009 Rémi Denis-Courmont
6  * $Id$
7  *
8  * Authors: Antoine Cellerier <dionoea at videolan dot org>
9  *          Daniel Stranger <vlc at schmaller dot de>
10  *          Rémi Denis-Courmont <rem # videolan org>
11  *
12  * This program is free software; you can redistribute it and/or modify
13  * it under the terms of the GNU General Public License as published by
14  * the Free Software Foundation; either version 2 of the License, or
15  * (at your option) any later version.
16  *
17  * This program is distributed in the hope that it will be useful,
18  * but WITHOUT ANY WARRANTY; without even the implied warranty of
19  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
20  * GNU General Public License for more details.
21  *
22  * You should have received a copy of the GNU General Public License
23  * along with this program; if not, write to the Free Software
24  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston MA 02110-1301, USA.
25  *****************************************************************************/
26
27 /*****************************************************************************
28  * Preamble
29  *****************************************************************************/
30 #ifdef HAVE_CONFIG_H
31 # include "config.h"
32 #endif
33
34 #include <vlc_common.h>
35 #include <assert.h>
36
37 /* Needed by str_format_time */
38 #include <time.h>
39 #include <limits.h>
40
41 /* Needed by str_format_meta */
42 #include <vlc_input.h>
43 #include <vlc_meta.h>
44 #include <vlc_playlist.h>
45 #include <vlc_aout.h>
46
47 #include <vlc_strings.h>
48 #include <vlc_url.h>
49 #include <vlc_charset.h>
50
51 /**
52  * Decode encoded URI component. See also decode_URI().
53  * \return decoded duplicated string
54  */
55 char *decode_URI_duplicate( const char *psz )
56 {
57     char *psz_dup = strdup( psz );
58     decode_URI( psz_dup );
59     return psz_dup;
60 }
61
62 /**
63  * Decode an encoded URI component in place.
64  * <b>This function does NOT decode entire URIs.</b>
65  * It decodes components (e.g. host name, directory, file name).
66  * Decoded URIs do not exist in the real world (see RFC3986 §2.4).
67  * Complete URIs are always "encoded" (or they are syntaxically invalid).
68  *
69  * Note that URI encoding is different from Javascript escaping. Especially,
70  * white spaces and Unicode non-ASCII code points are encoded differently.
71  *
72  * \return psz on success, NULL if it was not properly encoded
73  */
74 char *decode_URI( char *psz )
75 {
76     unsigned char *in = (unsigned char *)psz, *out = in, c;
77
78     if( psz == NULL )
79         return NULL;
80
81     while( ( c = *in++ ) != '\0' )
82     {
83         switch( c )
84         {
85             case '%':
86             {
87                 char hex[3];
88
89                 if( ( ( hex[0] = *in++ ) == 0 )
90                  || ( ( hex[1] = *in++ ) == 0 ) )
91                     return NULL;
92
93                 hex[2] = '\0';
94                 *out++ = (unsigned char)strtoul( hex, NULL, 0x10 );
95                 break;
96             }
97
98             case '+': /* This is HTTP forms, not URI decoding... */
99                 *out++ = ' ';
100                 break;
101
102             default:
103                 /* Inserting non-ASCII or non-printable characters is unsafe,
104                  * and no sane browser will send these unencoded */
105                 if( ( c < 32 ) || ( c > 127 ) )
106                     *out++ = '?';
107                 else
108                     *out++ = c;
109         }
110     }
111     *out = '\0';
112     return psz;
113 }
114
115 static inline bool isurisafe( int c )
116 {
117     /* These are the _unreserved_ URI characters (RFC3986 §2.3) */
118     return ( (unsigned char)( c - 'a' ) < 26 )
119             || ( (unsigned char)( c - 'A' ) < 26 )
120             || ( (unsigned char)( c - '0' ) < 10 )
121             || ( strchr( "-._~", c ) != NULL );
122 }
123
124 static char *encode_URI_bytes (const char *psz_uri, size_t len)
125 {
126     char *psz_enc = malloc (3 * len + 1), *out = psz_enc;
127     if (psz_enc == NULL)
128         return NULL;
129
130     for (size_t i = 0; i < len; i++)
131     {
132         static const char hex[16] = "0123456789ABCDEF";
133         uint8_t c = *psz_uri;
134
135         if( isurisafe( c ) )
136             *out++ = c;
137         /* This is URI encoding, not HTTP forms:
138          * Space is encoded as '%20', not '+'. */
139         else
140         {
141             *out++ = '%';
142             *out++ = hex[c >> 4];
143             *out++ = hex[c & 0xf];
144         }
145         psz_uri++;
146     }
147     *out++ = '\0';
148
149     out = realloc (psz_enc, out - psz_enc);
150     return out ? out : psz_enc; /* realloc() can fail (safe) */
151 }
152
153 /**
154  * Encodes an URI component (RFC3986 §2).
155  *
156  * @param psz_uri nul-terminated UTF-8 representation of the component.
157  * Obviously, you can't pass an URI containing a nul character, but you don't
158  * want to do that, do you?
159  *
160  * @return encoded string (must be free()'d), or NULL for ENOMEM.
161  */
162 char *encode_URI_component( const char *psz_uri )
163 {
164     return encode_URI_bytes (psz_uri, strlen (psz_uri));
165 }
166
167
168 static const struct xml_entity_s
169 {
170     char    psz_entity[8];
171     char    psz_char[4];
172 } xml_entities[] = {
173     /* Important: this list has to be in alphabetical order (psz_entity-wise) */
174     { "AElig;",  "Æ" },
175     { "Aacute;", "Á" },
176     { "Acirc;",  "Â" },
177     { "Agrave;", "À" },
178     { "Aring;",  "Å" },
179     { "Atilde;", "Ã" },
180     { "Auml;",   "Ä" },
181     { "Ccedil;", "Ç" },
182     { "Dagger;", "‡" },
183     { "ETH;",    "Ð" },
184     { "Eacute;", "É" },
185     { "Ecirc;",  "Ê" },
186     { "Egrave;", "È" },
187     { "Euml;",   "Ë" },
188     { "Iacute;", "Í" },
189     { "Icirc;",  "Î" },
190     { "Igrave;", "Ì" },
191     { "Iuml;",   "Ï" },
192     { "Ntilde;", "Ñ" },
193     { "OElig;",  "Œ" },
194     { "Oacute;", "Ó" },
195     { "Ocirc;",  "Ô" },
196     { "Ograve;", "Ò" },
197     { "Oslash;", "Ø" },
198     { "Otilde;", "Õ" },
199     { "Ouml;",   "Ö" },
200     { "Scaron;", "Š" },
201     { "THORN;",  "Þ" },
202     { "Uacute;", "Ú" },
203     { "Ucirc;",  "Û" },
204     { "Ugrave;", "Ù" },
205     { "Uuml;",   "Ü" },
206     { "Yacute;", "Ý" },
207     { "Yuml;",   "Ÿ" },
208     { "aacute;", "á" },
209     { "acirc;",  "â" },
210     { "acute;",  "´" },
211     { "aelig;",  "æ" },
212     { "agrave;", "à" },
213     { "amp;",    "&" },
214     { "apos;",   "'" },
215     { "aring;",  "å" },
216     { "atilde;", "ã" },
217     { "auml;",   "ä" },
218     { "bdquo;",  "„" },
219     { "brvbar;", "¦" },
220     { "ccedil;", "ç" },
221     { "cedil;",  "¸" },
222     { "cent;",   "¢" },
223     { "circ;",   "ˆ" },
224     { "copy;",   "©" },
225     { "curren;", "¤" },
226     { "dagger;", "†" },
227     { "deg;",    "°" },
228     { "divide;", "÷" },
229     { "eacute;", "é" },
230     { "ecirc;",  "ê" },
231     { "egrave;", "è" },
232     { "eth;",    "ð" },
233     { "euml;",   "ë" },
234     { "euro;",   "€" },
235     { "frac12;", "½" },
236     { "frac14;", "¼" },
237     { "frac34;", "¾" },
238     { "gt;",     ">" },
239     { "hellip;", "…" },
240     { "iacute;", "í" },
241     { "icirc;",  "î" },
242     { "iexcl;",  "¡" },
243     { "igrave;", "ì" },
244     { "iquest;", "¿" },
245     { "iuml;",   "ï" },
246     { "laquo;",  "«" },
247     { "ldquo;",  "“" },
248     { "lsaquo;", "‹" },
249     { "lsquo;",  "‘" },
250     { "lt;",     "<" },
251     { "macr;",   "¯" },
252     { "mdash;",  "—" },
253     { "micro;",  "µ" },
254     { "middot;", "·" },
255     { "nbsp;",   "\xc2\xa0" },
256     { "ndash;",  "–" },
257     { "not;",    "¬" },
258     { "ntilde;", "ñ" },
259     { "oacute;", "ó" },
260     { "ocirc;",  "ô" },
261     { "oelig;",  "œ" },
262     { "ograve;", "ò" },
263     { "ordf;",   "ª" },
264     { "ordm;",   "º" },
265     { "oslash;", "ø" },
266     { "otilde;", "õ" },
267     { "ouml;",   "ö" },
268     { "para;",   "¶" },
269     { "permil;", "‰" },
270     { "plusmn;", "±" },
271     { "pound;",  "£" },
272     { "quot;",   "\"" },
273     { "raquo;",  "»" },
274     { "rdquo;",  "”" },
275     { "reg;",    "®" },
276     { "rsaquo;", "›" },
277     { "rsquo;",  "’" },
278     { "sbquo;",  "‚" },
279     { "scaron;", "š" },
280     { "sect;",   "§" },
281     { "shy;",    "­" },
282     { "sup1;",   "¹" },
283     { "sup2;",   "²" },
284     { "sup3;",   "³" },
285     { "szlig;",  "ß" },
286     { "thorn;",  "þ" },
287     { "tilde;",  "˜" },
288     { "times;",  "×" },
289     { "trade;",  "™" },
290     { "uacute;", "ú" },
291     { "ucirc;",  "û" },
292     { "ugrave;", "ù" },
293     { "uml;",    "¨" },
294     { "uuml;",   "ü" },
295     { "yacute;", "ý" },
296     { "yen;",    "¥" },
297     { "yuml;",   "ÿ" },
298 };
299
300 static int cmp_entity (const void *key, const void *elem)
301 {
302     const struct xml_entity_s *ent = elem;
303     const char *name = key;
304
305     return strncmp (name, ent->psz_entity, strlen (ent->psz_entity));
306 }
307
308 /**
309  * Converts "&lt;", "&gt;" and "&amp;" to "<", ">" and "&"
310  * \param string to convert
311  */
312 void resolve_xml_special_chars( char *psz_value )
313 {
314     char *p_pos = psz_value;
315
316     while ( *psz_value )
317     {
318         if( *psz_value == '&' )
319         {
320             if( psz_value[1] == '#' )
321             {   /* &#xxx; Unicode code point */
322                 char *psz_end;
323                 unsigned long cp = strtoul( psz_value+2, &psz_end, 10 );
324                 if( *psz_end == ';' )
325                 {
326                     psz_value = psz_end + 1;
327                     if( cp == 0 )
328                         (void)0; /* skip nuls */
329                     else
330                     if( cp <= 0x7F )
331                     {
332                         *p_pos =            cp;
333                     }
334                     else
335                     /* Unicode code point outside ASCII.
336                      * &#xxx; representation is longer than UTF-8 :) */
337                     if( cp <= 0x7FF )
338                     {
339                         *p_pos++ = 0xC0 |  (cp >>  6);
340                         *p_pos   = 0x80 |  (cp        & 0x3F);
341                     }
342                     else
343                     if( cp <= 0xFFFF )
344                     {
345                         *p_pos++ = 0xE0 |  (cp >> 12);
346                         *p_pos++ = 0x80 | ((cp >>  6) & 0x3F);
347                         *p_pos   = 0x80 |  (cp        & 0x3F);
348                     }
349                     else
350                     if( cp <= 0x1FFFFF ) /* Outside the BMP */
351                     {   /* Unicode stops at 10FFFF, but who cares? */
352                         *p_pos++ = 0xF0 |  (cp >> 18);
353                         *p_pos++ = 0x80 | ((cp >> 12) & 0x3F);
354                         *p_pos++ = 0x80 | ((cp >>  6) & 0x3F);
355                         *p_pos   = 0x80 |  (cp        & 0x3F);
356                     }
357                 }
358                 else
359                 {
360                     /* Invalid entity number */
361                     *p_pos = *psz_value;
362                     psz_value++;
363                 }
364             }
365             else
366             {   /* Well-known XML entity */
367                 const struct xml_entity_s *ent;
368
369                 ent = bsearch (psz_value + 1, xml_entities,
370                                sizeof (xml_entities) / sizeof (*ent),
371                                sizeof (*ent), cmp_entity);
372                 if (ent != NULL)
373                 {
374                     size_t olen = strlen (ent->psz_char);
375                     memcpy (p_pos, ent->psz_char, olen);
376                     p_pos += olen - 1;
377                     psz_value += strlen (ent->psz_entity) + 1;
378                 }
379                 else
380                 {   /* No match */
381                     *p_pos = *psz_value;
382                     psz_value++;
383                 }
384             }
385         }
386         else
387         {
388             *p_pos = *psz_value;
389             psz_value++;
390         }
391
392         p_pos++;
393     }
394
395     *p_pos = '\0';
396 }
397
398 /**
399  * Converts '<', '>', '\"', '\'' and '&' to their html entities
400  * \param psz_content simple element content that is to be converted
401  */
402 char *convert_xml_special_chars( const char *psz_content )
403 {
404     assert( psz_content );
405
406     const size_t len = strlen( psz_content );
407     char *const psz_temp = malloc( 6 * len + 1 );
408     char *p_to   = psz_temp;
409
410     if( psz_temp == NULL )
411         return NULL;
412     for( size_t i = 0; i < len; i++ )
413     {
414         const char *str;
415         char c = psz_content[i];
416
417         switch ( c )
418         {
419             case '\"': str = "quot"; break;
420             case '&':  str = "amp";  break;
421             case '\'': str = "#39";  break;
422             case '<':  str = "lt";   break;
423             case '>':  str = "gt";   break;
424             default:
425                 *(p_to++) = c;
426                 continue;
427         }
428         p_to += sprintf( p_to, "&%s;", str );
429     }
430     *(p_to++) = '\0';
431
432     p_to = realloc( psz_temp, p_to - psz_temp );
433     return p_to ? p_to : psz_temp; /* cannot fail */
434 }
435
436 /* Base64 encoding */
437 char *vlc_b64_encode_binary( const uint8_t *src, size_t i_src )
438 {
439     static const char b64[] =
440            "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
441
442     char *ret = malloc( ( i_src + 4 ) * 4 / 3 );
443     char *dst = ret;
444
445     if( dst == NULL )
446         return NULL;
447
448     while( i_src > 0 )
449     {
450         /* pops (up to) 3 bytes of input, push 4 bytes */
451         uint32_t v;
452
453         /* 1/3 -> 1/4 */
454         v = *src++ << 24;
455         *dst++ = b64[v >> 26];
456         v = v << 6;
457
458         /* 2/3 -> 2/4 */
459         if( i_src >= 2 )
460             v |= *src++ << 22;
461         *dst++ = b64[v >> 26];
462         v = v << 6;
463
464         /* 3/3 -> 3/4 */
465         if( i_src >= 3 )
466             v |= *src++ << 20; // 3/3
467         *dst++ = ( i_src >= 2 ) ? b64[v >> 26] : '='; // 3/4
468         v = v << 6;
469
470         /* -> 4/4 */
471         *dst++ = ( i_src >= 3 ) ? b64[v >> 26] : '='; // 4/4
472
473         if( i_src <= 3 )
474             break;
475         i_src -= 3;
476     }
477
478     *dst = '\0';
479
480     return ret;
481 }
482
483 char *vlc_b64_encode( const char *src )
484 {
485     if( src )
486         return vlc_b64_encode_binary( (const uint8_t*)src, strlen(src) );
487     else
488         return vlc_b64_encode_binary( (const uint8_t*)"", 0 );
489 }
490
491 /* Base64 decoding */
492 size_t vlc_b64_decode_binary_to_buffer( uint8_t *p_dst, size_t i_dst, const char *p_src )
493 {
494     static const int b64[256] = {
495         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* 00-0F */
496         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* 10-1F */
497         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,62,-1,-1,-1,63,  /* 20-2F */
498         52,53,54,55,56,57,58,59,60,61,-1,-1,-1,-1,-1,-1,  /* 30-3F */
499         -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,10,11,12,13,14,  /* 40-4F */
500         15,16,17,18,19,20,21,22,23,24,25,-1,-1,-1,-1,-1,  /* 50-5F */
501         -1,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,  /* 60-6F */
502         41,42,43,44,45,46,47,48,49,50,51,-1,-1,-1,-1,-1,  /* 70-7F */
503         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* 80-8F */
504         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* 90-9F */
505         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* A0-AF */
506         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* B0-BF */
507         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* C0-CF */
508         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* D0-DF */
509         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,  /* E0-EF */
510         -1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1   /* F0-FF */
511     };
512     uint8_t *p_start = p_dst;
513     uint8_t *p = (uint8_t *)p_src;
514
515     int i_level;
516     int i_last;
517
518     for( i_level = 0, i_last = 0; (size_t)( p_dst - p_start ) < i_dst && *p != '\0'; p++ )
519     {
520         const int c = b64[(unsigned int)*p];
521         if( c == -1 )
522             continue;
523
524         switch( i_level )
525         {
526             case 0:
527                 i_level++;
528                 break;
529             case 1:
530                 *p_dst++ = ( i_last << 2 ) | ( ( c >> 4)&0x03 );
531                 i_level++;
532                 break;
533             case 2:
534                 *p_dst++ = ( ( i_last << 4 )&0xf0 ) | ( ( c >> 2 )&0x0f );
535                 i_level++;
536                 break;
537             case 3:
538                 *p_dst++ = ( ( i_last &0x03 ) << 6 ) | c;
539                 i_level = 0;
540         }
541         i_last = c;
542     }
543
544     return p_dst - p_start;
545 }
546 size_t vlc_b64_decode_binary( uint8_t **pp_dst, const char *psz_src )
547 {
548     const int i_src = strlen( psz_src );
549     uint8_t   *p_dst;
550
551     *pp_dst = p_dst = malloc( i_src );
552     if( !p_dst )
553         return 0;
554     return  vlc_b64_decode_binary_to_buffer( p_dst, i_src, psz_src );
555 }
556 char *vlc_b64_decode( const char *psz_src )
557 {
558     const int i_src = strlen( psz_src );
559     char *p_dst = malloc( i_src + 1 );
560     size_t i_dst;
561     if( !p_dst )
562         return NULL;
563
564     i_dst = vlc_b64_decode_binary_to_buffer( (uint8_t*)p_dst, i_src, psz_src );
565     p_dst[i_dst] = '\0';
566
567     return p_dst;
568 }
569
570 /**
571  * Formats current time into a heap-allocated string.
572  * @param tformat time format (as with C strftime())
573  * @return an allocated string (must be free()'d), or NULL on memory error.
574  */
575 char *str_format_time( const char *tformat )
576 {
577     time_t curtime;
578     struct tm loctime;
579
580     if (strcmp (tformat, "") == 0)
581         return strdup (""); /* corner case w.r.t. strftime() return value */
582
583     /* Get the current time.  */
584     time( &curtime );
585
586     /* Convert it to local time representation.  */
587     localtime_r( &curtime, &loctime );
588     for (size_t buflen = strlen (tformat) + 32;; buflen += 32)
589     {
590         char *str = malloc (buflen);
591         if (str == NULL)
592             return NULL;
593
594         size_t len = strftime (str, buflen, tformat, &loctime);
595         if (len > 0)
596         {
597             char *ret = realloc (str, len + 1);
598             return ret ? ret : str; /* <- this cannot fail */
599         }
600     }
601     assert (0);
602 }
603
604 static void format_duration (char *buf, size_t len, int64_t duration)
605 {
606     lldiv_t d;
607     int sec;
608
609     duration /= CLOCK_FREQ;
610     d = lldiv (duration, 60);
611     sec = d.rem;
612     d = lldiv (d.quot, 60);
613     snprintf (buf, len, "%02lld:%02d:%02d", d.quot, (int)d.rem, sec);
614 }
615
616 #define INSERT_STRING( string )                                     \
617                     if( string != NULL )                            \
618                     {                                               \
619                         int len = strlen( string );                 \
620                         dst = xrealloc( dst, i_size = i_size + len );\
621                         memcpy( (dst+d), string, len );             \
622                         d += len;                                   \
623                         free( string );                             \
624                     }                                               \
625                     else if( !b_empty_if_na )                       \
626                     {                                               \
627                         *(dst+d) = '-';                             \
628                         d++;                                        \
629                     }                                               \
630
631 /* same than INSERT_STRING, except that string won't be freed */
632 #define INSERT_STRING_NO_FREE( string )                             \
633                     {                                               \
634                         int len = strlen( string );                 \
635                         dst = xrealloc( dst, i_size = i_size + len );\
636                         memcpy( dst+d, string, len );               \
637                         d += len;                                   \
638                     }
639 #undef str_format_meta
640 char *str_format_meta( vlc_object_t *p_object, const char *string )
641 {
642     const char *s = string;
643     bool b_is_format = false;
644     bool b_empty_if_na = false;
645     char buf[10];
646     int i_size = strlen( string ) + 1; /* +1 to store '\0' */
647     char *dst = strdup( string );
648     if( !dst ) return NULL;
649     int d = 0;
650
651     input_thread_t *p_input = playlist_CurrentInput( pl_Get(p_object) );
652     input_item_t *p_item = NULL;
653     if( p_input )
654     {
655         p_item = input_GetItem(p_input);
656     }
657
658     while( *s )
659     {
660         if( b_is_format )
661         {
662             switch( *s )
663             {
664                 case 'a':
665                     if( p_item )
666                     {
667                         INSERT_STRING( input_item_GetArtist( p_item ) );
668                     }
669                     break;
670                 case 'b':
671                     if( p_item )
672                     {
673                         INSERT_STRING( input_item_GetAlbum( p_item ) );
674                     }
675                     break;
676                 case 'c':
677                     if( p_item )
678                     {
679                         INSERT_STRING( input_item_GetCopyright( p_item ) );
680                     }
681                     break;
682                 case 'd':
683                     if( p_item )
684                     {
685                         INSERT_STRING( input_item_GetDescription( p_item ) );
686                     }
687                     break;
688                 case 'e':
689                     if( p_item )
690                     {
691                         INSERT_STRING( input_item_GetEncodedBy( p_item ) );
692                     }
693                     break;
694                 case 'f':
695                     if( p_item && p_item->p_stats )
696                     {
697                         vlc_mutex_lock( &p_item->p_stats->lock );
698                         snprintf( buf, 10, "%d",
699                                   p_item->p_stats->i_displayed_pictures );
700                         vlc_mutex_unlock( &p_item->p_stats->lock );
701                     }
702                     else
703                     {
704                         sprintf( buf, b_empty_if_na ? "" : "-" );
705                     }
706                     INSERT_STRING_NO_FREE( buf );
707                     break;
708                 case 'g':
709                     if( p_item )
710                     {
711                         INSERT_STRING( input_item_GetGenre( p_item ) );
712                     }
713                     break;
714                 case 'l':
715                     if( p_item )
716                     {
717                         INSERT_STRING( input_item_GetLanguage( p_item ) );
718                     }
719                     break;
720                 case 'n':
721                     if( p_item )
722                     {
723                         INSERT_STRING( input_item_GetTrackNum( p_item ) );
724                     }
725                     break;
726                 case 'p':
727                     if( p_item )
728                     {
729                         INSERT_STRING( input_item_GetNowPlaying( p_item ) );
730                     }
731                     break;
732                 case 'r':
733                     if( p_item )
734                     {
735                         INSERT_STRING( input_item_GetRating( p_item ) );
736                     }
737                     break;
738                 case 's':
739                 {
740                     char *lang = NULL;
741                     if( p_input )
742                         lang = var_GetNonEmptyString( p_input, "sub-language" );
743                     if( lang == NULL )
744                         lang = strdup( b_empty_if_na ? "" : "-" );
745                     INSERT_STRING( lang );
746                     break;
747                 }
748                 case 't':
749                     if( p_item )
750                     {
751                         INSERT_STRING( input_item_GetTitle( p_item ) );
752                     }
753                     break;
754                 case 'u':
755                     if( p_item )
756                     {
757                         INSERT_STRING( input_item_GetURL( p_item ) );
758                     }
759                     break;
760                 case 'A':
761                     if( p_item )
762                     {
763                         INSERT_STRING( input_item_GetDate( p_item ) );
764                     }
765                     break;
766                 case 'B':
767                     if( p_input )
768                     {
769                         snprintf( buf, 10, "%d",
770                                   var_GetInteger( p_input, "bit-rate" )/1000 );
771                     }
772                     else
773                     {
774                         sprintf( buf, b_empty_if_na ? "" : "-" );
775                     }
776                     INSERT_STRING_NO_FREE( buf );
777                     break;
778                 case 'C':
779                     if( p_input )
780                     {
781                         snprintf( buf, 10, "%d",
782                                   var_GetInteger( p_input, "chapter" ) );
783                     }
784                     else
785                     {
786                         sprintf( buf, b_empty_if_na ? "" : "-" );
787                     }
788                     INSERT_STRING_NO_FREE( buf );
789                     break;
790                 case 'D':
791                     if( p_item )
792                     {
793                         mtime_t i_duration = input_item_GetDuration( p_item );
794                         format_duration (buf, sizeof (buf), i_duration);
795                     }
796                     else
797                     {
798                         snprintf( buf, 10, b_empty_if_na ? "" : "--:--:--" );
799                     }
800                     INSERT_STRING_NO_FREE( buf );
801                     break;
802                 case 'F':
803                     if( p_item )
804                     {
805                         INSERT_STRING( input_item_GetURI( p_item ) );
806                     }
807                     break;
808                 case 'I':
809                     if( p_input )
810                     {
811                         snprintf( buf, 10, "%d",
812                                   var_GetInteger( p_input, "title" ) );
813                     }
814                     else
815                     {
816                         sprintf( buf, b_empty_if_na ? "" : "-" );
817                     }
818                     INSERT_STRING_NO_FREE( buf );
819                     break;
820                 case 'L':
821                     if( p_item && p_input )
822                     {
823                         mtime_t i_duration = input_item_GetDuration( p_item );
824                         int64_t i_time = var_GetTime( p_input, "time" );
825                         format_duration( buf, sizeof(buf),
826                                          i_duration - i_time );
827                     }
828                     else
829                     {
830                         snprintf( buf, 10, b_empty_if_na ? "" : "--:--:--" );
831                     }
832                     INSERT_STRING_NO_FREE( buf );
833                     break;
834                 case 'N':
835                     if( p_item )
836                     {
837                         INSERT_STRING( input_item_GetName( p_item ) );
838                     }
839                     break;
840                 case 'O':
841                 {
842                     char *lang = NULL;
843                     if( p_input )
844                         lang = var_GetNonEmptyString( p_input,
845                                                       "audio-language" );
846                     if( lang == NULL )
847                         lang = strdup( b_empty_if_na ? "" : "-" );
848                     INSERT_STRING( lang );
849                     break;
850                 }
851                 case 'P':
852                     if( p_input )
853                     {
854                         snprintf( buf, 10, "%2.1lf",
855                                   var_GetFloat( p_input, "position" ) * 100. );
856                     }
857                     else
858                     {
859                         snprintf( buf, 10, b_empty_if_na ? "" : "--.-%%" );
860                     }
861                     INSERT_STRING_NO_FREE( buf );
862                     break;
863                 case 'R':
864                     if( p_input )
865                     {
866                         float f = var_GetFloat( p_input, "rate" );
867                         snprintf( buf, 10, "%.3f", f );
868                     }
869                     else
870                     {
871                         sprintf( buf, b_empty_if_na ? "" : "-" );
872                     }
873                     INSERT_STRING_NO_FREE( buf );
874                     break;
875                 case 'S':
876                     if( p_input )
877                     {
878                         int r = var_GetInteger( p_input, "sample-rate" );
879                         snprintf( buf, 10, "%d.%d", r/1000, (r/100)%10 );
880                     }
881                     else
882                     {
883                         sprintf( buf, b_empty_if_na ? "" : "-" );
884                     }
885                     INSERT_STRING_NO_FREE( buf );
886                     break;
887                 case 'T':
888                     if( p_input )
889                     {
890                         int64_t i_time = var_GetTime( p_input, "time" );
891                         format_duration( buf, sizeof(buf), i_time );
892                     }
893                     else
894                     {
895                         snprintf( buf, 10, b_empty_if_na ? "" :  "--:--:--" );
896                     }
897                     INSERT_STRING_NO_FREE( buf );
898                     break;
899                 case 'U':
900                     if( p_item )
901                     {
902                         INSERT_STRING( input_item_GetPublisher( p_item ) );
903                     }
904                     break;
905                 case 'V':
906                 {
907                     audio_volume_t volume;
908                     aout_VolumeGet( p_object, &volume );
909                     snprintf( buf, 10, "%d", volume );
910                     INSERT_STRING_NO_FREE( buf );
911                     break;
912                 }
913                 case '_':
914                     *(dst+d) = '\n';
915                     d++;
916                     break;
917
918                 case ' ':
919                     b_empty_if_na = true;
920                     break;
921
922                 default:
923                     *(dst+d) = *s;
924                     d++;
925                     break;
926             }
927             if( *s != ' ' )
928                 b_is_format = false;
929         }
930         else if( *s == '$' )
931         {
932             b_is_format = true;
933             b_empty_if_na = false;
934         }
935         else
936         {
937             *(dst+d) = *s;
938             d++;
939         }
940         s++;
941     }
942     *(dst+d) = '\0';
943
944     if( p_input )
945         vlc_object_release( p_input );
946
947     return dst;
948 }
949 #undef INSERT_STRING
950 #undef INSERT_STRING_NO_FREE
951
952 #undef str_format
953 /**
954  * Apply str format time and str format meta
955  */
956 char *str_format( vlc_object_t *p_this, const char *psz_src )
957 {
958     char *psz_buf1, *psz_buf2;
959     psz_buf1 = str_format_time( psz_src );
960     psz_buf2 = str_format_meta( p_this, psz_buf1 );
961     free( psz_buf1 );
962     return psz_buf2;
963 }
964
965 /**
966  * Remove forbidden characters from filenames (including slashes)
967  */
968 void filename_sanitize( char *str )
969 {
970 #if defined( WIN32 )
971     char *str_base = str;
972 #endif
973
974     if( *str == '.' && (str[1] == '\0' || (str[1] == '.' && str[2] == '\0' ) ) )
975     {
976         while( *str )
977         {
978             *str = '_';
979             str++;
980         }
981         return;
982     }
983
984 #if defined( WIN32 )
985     // Change leading spaces into underscores
986     while( *str && *str == ' ' )
987         *str++ = '_';
988 #endif
989
990     while( *str )
991     {
992         switch( *str )
993         {
994             case '/':
995 #if defined( __APPLE__ )
996             case ':':
997 #elif defined( WIN32 )
998             case '\\':
999             case '*':
1000             case '"':
1001             case '?':
1002             case ':':
1003             case '|':
1004             case '<':
1005             case '>':
1006 #endif
1007                 *str = '_';
1008         }
1009         str++;
1010     }
1011
1012 #if defined( WIN32 )
1013     // Change trailing spaces into underscores
1014     str--;
1015     while( str != str_base )
1016     {
1017         if( *str != ' ' )
1018             break;
1019         *str-- = '_';
1020     }
1021 #endif
1022 }
1023
1024 /**
1025  * Remove forbidden characters from full paths (leaves slashes)
1026  */
1027 void path_sanitize( char *str )
1028 {
1029 #ifdef WIN32
1030     /* check drive prefix if path is absolute */
1031     if( (((unsigned char)(str[0] - 'A') < 26)
1032       || ((unsigned char)(str[0] - 'a') < 26)) && (':' == str[1]) )
1033         str += 2;
1034 #endif
1035     while( *str )
1036     {
1037 #if defined( __APPLE__ )
1038         if( *str == ':' )
1039             *str = '_';
1040 #elif defined( WIN32 )
1041         if( strchr( "*\"?:|<>", *str ) )
1042             *str = '_';
1043         if( *str == '/' )
1044             *str = DIR_SEP_CHAR;
1045 #endif
1046         str++;
1047     }
1048 }
1049
1050 #include <vlc_url.h>
1051
1052 /**
1053  * Convert a file path to an URI.
1054  * If already an URI, return a copy of the string.
1055  * @path path path to convert (or URI to copy)
1056  * @return a nul-terminated URI string (use free() to release it),
1057  * or NULL in case of error
1058  */
1059 char *make_URI (const char *path)
1060 {
1061     if (path == NULL)
1062         return NULL;
1063     if (!strcmp (path, "-"))
1064         return strdup ("fd://0"); // standard input
1065     if (strstr (path, "://") != NULL)
1066         return strdup (path); /* Already an URI */
1067     /* Note: VLC cannot handle URI schemes without double slash after the
1068      * scheme name (such as mailto: or news:). */
1069
1070     char *buf;
1071 #ifdef WIN32
1072     if (isalpha (path[0]) && (path[1] == ':'))
1073     {
1074         if (asprintf (&buf, "file:///%c:", path[0]) == -1)
1075             buf = NULL;
1076         path += 2;
1077     }
1078     else
1079 #endif
1080     if (!strncmp (path, "\\\\", 2))
1081     {   /* Windows UNC paths */
1082 #ifndef WIN32
1083         /* \\host\share\path -> smb://host/share/path */
1084         if (strchr (path + 2, '\\') != NULL)
1085         {   /* Convert backslashes to slashes */
1086             char *dup = strdup (path);
1087             if (dup == NULL)
1088                 return NULL;
1089             for (size_t i = 2; dup[i]; i++)
1090                 if (dup[i] == '\\')
1091                     dup[i] = DIR_SEP_CHAR;
1092
1093             char *ret = make_URI (dup);
1094             free (dup);
1095             return ret;
1096         }
1097 # define SMB_SCHEME "smb"
1098 #else
1099         /* \\host\share\path -> file://host/share/path */
1100 # define SMB_SCHEME "file"
1101 #endif
1102         size_t hostlen = strcspn (path + 2, DIR_SEP);
1103
1104         buf = malloc (sizeof (SMB_SCHEME) + 3 + hostlen);
1105         if (buf != NULL)
1106             snprintf (buf, sizeof (SMB_SCHEME) + 3 + hostlen,
1107                       SMB_SCHEME"://%s", path + 2);
1108         path += 2 + hostlen;
1109     }
1110     else
1111     if (path[0] != DIR_SEP_CHAR)
1112     {   /* Relative path: prepend the current working directory */
1113         char cwd[PATH_MAX];
1114
1115         if (getcwd (cwd, sizeof (cwd)) == NULL) /* FIXME: UTF8? */
1116             return NULL;
1117         if (asprintf (&buf, "%s/%s", cwd, path) == -1)
1118             return NULL;
1119         char *ret = make_URI (buf);
1120         free (buf);
1121         return ret;
1122     }
1123     else
1124         buf = strdup ("file://");
1125     if (buf == NULL)
1126         return NULL;
1127
1128     assert (path[0] == DIR_SEP_CHAR);
1129
1130     /* Absolute file path */
1131     for (const char *ptr = path + 1;; ptr++)
1132     {
1133         size_t len = strcspn (ptr, DIR_SEP);
1134         char *component = encode_URI_bytes (ptr, len);
1135         if (component == NULL)
1136         {
1137             free (buf);
1138             return NULL;
1139         }
1140         char *uri;
1141         int val = asprintf (&uri, "%s/%s", buf, component);
1142         free (component);
1143         free (buf);
1144         if (val == -1)
1145             return NULL;
1146         buf = uri;
1147         ptr += len;
1148         if (*ptr == '\0')
1149             return buf;
1150     }
1151 }
1152
1153 /**
1154  * Tries to convert an URI to a local (UTF-8-encoded) file path.
1155  * @param url URI to convert
1156  * @return NULL on error, a nul-terminated string otherwise
1157  * (use free() to release it)
1158  */
1159 char *make_path (const char *url)
1160 {
1161     char *ret = NULL;
1162     char *end;
1163
1164     char *path = strstr (url, "://");
1165     if (path == NULL)
1166         return NULL; /* unsupported scheme or invalid syntax */
1167
1168     end = memchr (url, '/', path - url);
1169     size_t schemelen = ((end != NULL) ? end : path) - url;
1170     path += 3; /* skip "://" */
1171
1172     /* Remove HTML anchor if present */
1173     end = strchr (path, '#');
1174     if (end)
1175         path = strndup (path, end - path);
1176     else
1177         path = strdup (path);
1178     if (unlikely(path == NULL))
1179         return NULL; /* boom! */
1180
1181     /* Decode path */
1182     decode_URI (path);
1183
1184     if (schemelen == 4 && !strncasecmp (url, "file", 4))
1185     {
1186 #if (DIR_SEP_CHAR != '/')
1187         for (char *p = strchr (path, '/'); p; p = strchr (p + 1, '/'))
1188             *p = DIR_SEP_CHAR;
1189 #endif
1190         /* Leading slash => local path */
1191         if (*path == DIR_SEP_CHAR)
1192 #if !defined (WIN32) || defined (UNDER_CE)
1193             return path;
1194 #else
1195             return memmove (path, path + 1, strlen (path + 1) + 1);
1196 #endif
1197
1198         /* Local path disguised as a remote one (MacOS X) */
1199         if (!strncasecmp (path, "localhost"DIR_SEP, 10))
1200             return memmove (path, path + 9, strlen (path + 9) + 1);
1201
1202 #ifdef WIN32
1203         if (*path && asprintf (&ret, "\\\\%s", path) == -1)
1204             ret = NULL;
1205 #endif
1206         /* non-local path :-( */
1207     }
1208     else
1209     if (schemelen == 2 && !strncasecmp (url, "fd", 2))
1210     {
1211         int fd = strtol (path, &end, 0);
1212
1213         if (*end)
1214             goto out;
1215
1216 #ifndef WIN32
1217         switch (fd)
1218         {
1219             case 0:
1220                 ret = strdup ("/dev/stdin");
1221                 break;
1222             case 1:
1223                 ret = strdup ("/dev/stdout");
1224                 break;
1225             case 2:
1226                 ret = strdup ("/dev/stderr");
1227                 break;
1228             default:
1229                 if (asprintf (&ret, "/dev/fd/%d", fd) == -1)
1230                     ret = NULL;
1231         }
1232 #else
1233         /* XXX: Does this work on WinCE? */
1234         if (fd < 2)
1235             ret = strdup ("CON");
1236         else
1237             ret = NULL;
1238 #endif
1239     }
1240
1241 out:
1242     free (path);
1243     return ret; /* unknown scheme */
1244 }