]> git.sesse.net Git - ffmpeg/blob - libavformat/mp3.c
mp3: ftell() file offset for VBR tags before ID3v1 parser messes it up.
[ffmpeg] / libavformat / mp3.c
1 /*
2  * MP3 muxer and demuxer
3  * Copyright (c) 2003 Fabrice Bellard
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include <strings.h>
23 #include "libavutil/avstring.h"
24 #include "libavutil/intreadwrite.h"
25 #include "avformat.h"
26 #include "id3v2.h"
27 #include "id3v1.h"
28
29 #if CONFIG_MP3_DEMUXER
30
31 #include "libavcodec/mpegaudio.h"
32 #include "libavcodec/mpegaudiodecheader.h"
33
34 /* mp3 read */
35
36 static int mp3_read_probe(AVProbeData *p)
37 {
38     int max_frames, first_frames = 0;
39     int fsize, frames, sample_rate;
40     uint32_t header;
41     uint8_t *buf, *buf0, *buf2, *end;
42     AVCodecContext avctx;
43
44     buf0 = p->buf;
45     if(ff_id3v2_match(buf0)) {
46         buf0 += ff_id3v2_tag_len(buf0);
47     }
48
49     max_frames = 0;
50     buf = buf0;
51     end = p->buf + p->buf_size - sizeof(uint32_t);
52
53     for(; buf < end; buf= buf2+1) {
54         buf2 = buf;
55
56         for(frames = 0; buf2 < end; frames++) {
57             header = AV_RB32(buf2);
58             fsize = ff_mpa_decode_header(&avctx, header, &sample_rate, &sample_rate, &sample_rate, &sample_rate);
59             if(fsize < 0)
60                 break;
61             buf2 += fsize;
62         }
63         max_frames = FFMAX(max_frames, frames);
64         if(buf == buf0)
65             first_frames= frames;
66     }
67     // keep this in sync with ac3 probe, both need to avoid
68     // issues with MPEG-files!
69     if   (first_frames>=4) return AVPROBE_SCORE_MAX/2+1;
70     else if(max_frames>500)return AVPROBE_SCORE_MAX/2;
71     else if(max_frames>=4) return AVPROBE_SCORE_MAX/4;
72     else if(buf0!=p->buf)  return AVPROBE_SCORE_MAX/4-1;
73     else if(max_frames>=1) return 1;
74     else                   return 0;
75 //mpegps_mp3_unrecognized_format.mpg has max_frames=3
76 }
77
78 /**
79  * Try to find Xing/Info/VBRI tags and compute duration from info therein
80  */
81 static int mp3_parse_vbr_tags(AVFormatContext *s, AVStream *st, int64_t base)
82 {
83     uint32_t v, spf;
84     int frames = -1; /* Total number of frames in file */
85     const int64_t xing_offtbl[2][2] = {{32, 17}, {17,9}};
86     MPADecodeHeader c;
87     int vbrtag_size = 0;
88
89     v = get_be32(s->pb);
90     if(ff_mpa_check_header(v) < 0)
91       return -1;
92
93     if (ff_mpegaudio_decode_header(&c, v) == 0)
94         vbrtag_size = c.frame_size;
95     if(c.layer != 3)
96         return -1;
97
98     /* Check for Xing / Info tag */
99     url_fseek(s->pb, xing_offtbl[c.lsf == 1][c.nb_channels == 1], SEEK_CUR);
100     v = get_be32(s->pb);
101     if(v == MKBETAG('X', 'i', 'n', 'g') || v == MKBETAG('I', 'n', 'f', 'o')) {
102         v = get_be32(s->pb);
103         if(v & 0x1)
104             frames = get_be32(s->pb);
105     }
106
107     /* Check for VBRI tag (always 32 bytes after end of mpegaudio header) */
108     url_fseek(s->pb, base + 4 + 32, SEEK_SET);
109     v = get_be32(s->pb);
110     if(v == MKBETAG('V', 'B', 'R', 'I')) {
111         /* Check tag version */
112         if(get_be16(s->pb) == 1) {
113             /* skip delay, quality and total bytes */
114             url_fseek(s->pb, 8, SEEK_CUR);
115             frames = get_be32(s->pb);
116         }
117     }
118
119     if(frames < 0)
120         return -1;
121
122     /* Skip the vbr tag frame */
123     url_fseek(s->pb, base + vbrtag_size, SEEK_SET);
124
125     spf = c.lsf ? 576 : 1152; /* Samples per frame, layer 3 */
126     st->duration = av_rescale_q(frames, (AVRational){spf, c.sample_rate},
127                                 st->time_base);
128     return 0;
129 }
130
131 static int mp3_read_header(AVFormatContext *s,
132                            AVFormatParameters *ap)
133 {
134     AVStream *st;
135     int64_t off;
136
137     st = av_new_stream(s, 0);
138     if (!st)
139         return AVERROR(ENOMEM);
140
141     st->codec->codec_type = CODEC_TYPE_AUDIO;
142     st->codec->codec_id = CODEC_ID_MP3;
143     st->need_parsing = AVSTREAM_PARSE_FULL;
144     st->start_time = 0;
145
146     // lcm of all mp3 sample rates
147     av_set_pts_info(st, 64, 1, 14112000);
148
149     ff_id3v2_read(s);
150     off = url_ftell(s->pb);
151
152     if (!av_metadata_get(s->metadata, "", NULL, AV_METADATA_IGNORE_SUFFIX))
153         ff_id3v1_read(s);
154
155     if (mp3_parse_vbr_tags(s, st, off) < 0)
156         url_fseek(s->pb, off, SEEK_SET);
157
158     /* the parameters will be extracted from the compressed bitstream */
159     return 0;
160 }
161
162 #define MP3_PACKET_SIZE 1024
163
164 static int mp3_read_packet(AVFormatContext *s, AVPacket *pkt)
165 {
166     int ret, size;
167     //    AVStream *st = s->streams[0];
168
169     size= MP3_PACKET_SIZE;
170
171     ret= av_get_packet(s->pb, pkt, size);
172
173     pkt->stream_index = 0;
174     if (ret <= 0) {
175         return AVERROR(EIO);
176     }
177     /* note: we need to modify the packet size here to handle the last
178        packet */
179     pkt->size = ret;
180     return ret;
181 }
182
183 AVInputFormat mp3_demuxer = {
184     "mp3",
185     NULL_IF_CONFIG_SMALL("MPEG audio layer 2/3"),
186     0,
187     mp3_read_probe,
188     mp3_read_header,
189     mp3_read_packet,
190     .flags= AVFMT_GENERIC_INDEX,
191     .extensions = "mp2,mp3,m2a", /* XXX: use probe */
192     .metadata_conv = ff_id3v2_metadata_conv,
193 };
194 #endif
195
196 #if CONFIG_MP2_MUXER || CONFIG_MP3_MUXER
197 static int id3v1_set_string(AVFormatContext *s, const char *key,
198                             uint8_t *buf, int buf_size)
199 {
200     AVMetadataTag *tag;
201     if ((tag = av_metadata_get(s->metadata, key, NULL, 0)))
202         strncpy(buf, tag->value, buf_size);
203     return !!tag;
204 }
205
206 static int id3v1_create_tag(AVFormatContext *s, uint8_t *buf)
207 {
208     AVMetadataTag *tag;
209     int i, count = 0;
210
211     memset(buf, 0, ID3v1_TAG_SIZE); /* fail safe */
212     buf[0] = 'T';
213     buf[1] = 'A';
214     buf[2] = 'G';
215     count += id3v1_set_string(s, "title",   buf +  3, 30);
216     count += id3v1_set_string(s, "author",  buf + 33, 30);
217     count += id3v1_set_string(s, "album",   buf + 63, 30);
218     count += id3v1_set_string(s, "date",    buf + 93,  4);
219     count += id3v1_set_string(s, "comment", buf + 97, 30);
220     if ((tag = av_metadata_get(s->metadata, "track", NULL, 0))) {
221         buf[125] = 0;
222         buf[126] = atoi(tag->value);
223         count++;
224     }
225     buf[127] = 0xFF; /* default to unknown genre */
226     if ((tag = av_metadata_get(s->metadata, "genre", NULL, 0))) {
227         for(i = 0; i <= ID3v1_GENRE_MAX; i++) {
228             if (!strcasecmp(tag->value, ff_id3v1_genre_str[i])) {
229                 buf[127] = i;
230                 count++;
231                 break;
232             }
233         }
234     }
235     return count;
236 }
237
238 /* simple formats */
239
240 static void id3v2_put_size(AVFormatContext *s, int size)
241 {
242     put_byte(s->pb, size >> 21 & 0x7f);
243     put_byte(s->pb, size >> 14 & 0x7f);
244     put_byte(s->pb, size >> 7  & 0x7f);
245     put_byte(s->pb, size       & 0x7f);
246 }
247
248 static void id3v2_put_ttag(AVFormatContext *s, const char *buf, int len,
249                            uint32_t tag)
250 {
251     put_be32(s->pb, tag);
252     id3v2_put_size(s, len + 1);
253     put_be16(s->pb, 0);
254     put_byte(s->pb, 3); /* UTF-8 */
255     put_buffer(s->pb, buf, len);
256 }
257
258
259 static int mp3_write_packet(struct AVFormatContext *s, AVPacket *pkt)
260 {
261     put_buffer(s->pb, pkt->data, pkt->size);
262     put_flush_packet(s->pb);
263     return 0;
264 }
265
266 static int mp3_write_trailer(struct AVFormatContext *s)
267 {
268     uint8_t buf[ID3v1_TAG_SIZE];
269
270     /* write the id3v1 tag */
271     if (id3v1_create_tag(s, buf) > 0) {
272         put_buffer(s->pb, buf, ID3v1_TAG_SIZE);
273         put_flush_packet(s->pb);
274     }
275     return 0;
276 }
277 #endif /* CONFIG_MP2_MUXER || CONFIG_MP3_MUXER */
278
279 #if CONFIG_MP2_MUXER
280 AVOutputFormat mp2_muxer = {
281     "mp2",
282     NULL_IF_CONFIG_SMALL("MPEG audio layer 2"),
283     "audio/x-mpeg",
284     "mp2,m2a",
285     0,
286     CODEC_ID_MP2,
287     CODEC_ID_NONE,
288     NULL,
289     mp3_write_packet,
290     mp3_write_trailer,
291 };
292 #endif
293
294 #if CONFIG_MP3_MUXER
295 /**
296  * Write an ID3v2.4 header at beginning of stream
297  */
298
299 static int mp3_write_header(struct AVFormatContext *s)
300 {
301     AVMetadataTag *t = NULL;
302     int totlen = 0;
303     int64_t size_pos, cur_pos;
304
305     put_be32(s->pb, MKBETAG('I', 'D', '3', 0x04)); /* ID3v2.4 */
306     put_byte(s->pb, 0);
307     put_byte(s->pb, 0); /* flags */
308
309     /* reserve space for size */
310     size_pos = url_ftell(s->pb);
311     put_be32(s->pb, 0);
312
313     while ((t = av_metadata_get(s->metadata, "", t, AV_METADATA_IGNORE_SUFFIX))) {
314         uint32_t tag = 0;
315
316         if (t->key[0] == 'T' && strcmp(t->key, "TSSE")) {
317             int i;
318             for (i = 0; *ff_id3v2_tags[i]; i++)
319                 if (AV_RB32(t->key) == AV_RB32(ff_id3v2_tags[i])) {
320                     int len = strlen(t->value);
321                     tag = AV_RB32(t->key);
322                     totlen += len + ID3v2_HEADER_SIZE + 2;
323                     id3v2_put_ttag(s, t->value, len + 1, tag);
324                     break;
325                 }
326         }
327
328         if (!tag) { /* unknown tag, write as TXXX frame */
329             int   len = strlen(t->key), len1 = strlen(t->value);
330             char *buf = av_malloc(len + len1 + 2);
331             if (!buf)
332                 return AVERROR(ENOMEM);
333             tag = MKBETAG('T', 'X', 'X', 'X');
334             strcpy(buf,           t->key);
335             strcpy(buf + len + 1, t->value);
336             id3v2_put_ttag(s, buf, len + len1 + 2, tag);
337             totlen += len + len1 + ID3v2_HEADER_SIZE + 3;
338             av_free(buf);
339         }
340     }
341     if(!(s->streams[0]->codec->flags & CODEC_FLAG_BITEXACT)) {
342         totlen += strlen(LIBAVFORMAT_IDENT) + ID3v2_HEADER_SIZE + 2;
343         id3v2_put_ttag(s, LIBAVFORMAT_IDENT, strlen(LIBAVFORMAT_IDENT) + 1,
344                        MKBETAG('T', 'S', 'S', 'E'));
345     }
346
347     cur_pos = url_ftell(s->pb);
348     url_fseek(s->pb, size_pos, SEEK_SET);
349     id3v2_put_size(s, totlen);
350     url_fseek(s->pb, cur_pos, SEEK_SET);
351
352     return 0;
353 }
354
355 AVOutputFormat mp3_muxer = {
356     "mp3",
357     NULL_IF_CONFIG_SMALL("MPEG audio layer 3"),
358     "audio/x-mpeg",
359     "mp3",
360     0,
361     CODEC_ID_MP3,
362     CODEC_ID_NONE,
363     mp3_write_header,
364     mp3_write_packet,
365     mp3_write_trailer,
366     .metadata_conv = ff_id3v2_metadata_conv,
367 };
368 #endif