]> git.sesse.net Git - ffmpeg/blob - libavformat/gxfenc.c
aac_latm: reconfigure decoder on audio specific config changes
[ffmpeg] / libavformat / gxfenc.c
1 /*
2  * GXF muxer.
3  * Copyright (c) 2006 SmartJog S.A., Baptiste Coudurier <baptiste dot coudurier at smartjog dot com>
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavutil/intfloat_readwrite.h"
23 #include "libavutil/mathematics.h"
24 #include "avformat.h"
25 #include "internal.h"
26 #include "gxf.h"
27 #include "riff.h"
28 #include "audiointerleave.h"
29
30 #define GXF_AUDIO_PACKET_SIZE 65536
31
32 typedef struct GXFStreamContext {
33     AudioInterleaveContext aic;
34     uint32_t track_type;
35     uint32_t sample_size;
36     uint32_t sample_rate;
37     uint16_t media_type;
38     uint16_t media_info;
39     int frame_rate_index;
40     int lines_index;
41     int fields;
42     int iframes;
43     int pframes;
44     int bframes;
45     int p_per_gop;
46     int b_per_i_or_p; ///< number of B frames per I frame or P frame
47     int first_gop_closed;
48     unsigned order;   ///< interleaving order
49 } GXFStreamContext;
50
51 typedef struct GXFContext {
52     uint32_t nb_fields;
53     uint16_t audio_tracks;
54     uint16_t mpeg_tracks;
55     int64_t creation_time;
56     uint32_t umf_start_offset;
57     uint32_t umf_track_offset;
58     uint32_t umf_media_offset;
59     uint32_t umf_length;
60     uint16_t umf_track_size;
61     uint16_t umf_media_size;
62     AVRational time_base;
63     int flags;
64     GXFStreamContext timecode_track;
65     unsigned *flt_entries;    ///< offsets of packets /1024, starts after 2nd video field
66     unsigned flt_entries_nb;
67     uint64_t *map_offsets;    ///< offset of map packets
68     unsigned map_offsets_nb;
69     unsigned packet_count;
70 } GXFContext;
71
72 static const struct {
73     int height, index;
74 } gxf_lines_tab[] = {
75     { 480,  1 }, /* NTSC */
76     { 512,  1 }, /* NTSC + VBI */
77     { 576,  2 }, /* PAL */
78     { 608,  2 }, /* PAL + VBI */
79     { 1080, 4 },
80     { 720,  6 },
81 };
82
83 static const AVCodecTag gxf_media_types[] = {
84     { CODEC_ID_MJPEG     ,   3 }, /* NTSC */
85     { CODEC_ID_MJPEG     ,   4 }, /* PAL */
86     { CODEC_ID_PCM_S24LE ,   9 },
87     { CODEC_ID_PCM_S16LE ,  10 },
88     { CODEC_ID_MPEG2VIDEO,  11 }, /* NTSC */
89     { CODEC_ID_MPEG2VIDEO,  12 }, /* PAL */
90     { CODEC_ID_DVVIDEO   ,  13 }, /* NTSC */
91     { CODEC_ID_DVVIDEO   ,  14 }, /* PAL */
92     { CODEC_ID_DVVIDEO   ,  15 }, /* 50M NTSC */
93     { CODEC_ID_DVVIDEO   ,  16 }, /* 50M PAL */
94     { CODEC_ID_AC3       ,  17 },
95     //{ CODEC_ID_NONE,  ,   18 }, /* Non compressed 24 bit audio */
96     { CODEC_ID_MPEG2VIDEO,  20 }, /* MPEG HD */
97     { CODEC_ID_MPEG1VIDEO,  22 }, /* NTSC */
98     { CODEC_ID_MPEG1VIDEO,  23 }, /* PAL */
99     { CODEC_ID_NONE,         0 },
100 };
101
102 #define SERVER_PATH "EXT:/PDR/default/"
103 #define ES_NAME_PATTERN "EXT:/PDR/default/ES."
104
105 static int gxf_find_lines_index(AVStream *st)
106 {
107     GXFStreamContext *sc = st->priv_data;
108     int i;
109
110     for (i = 0; i < 6; ++i) {
111         if (st->codec->height == gxf_lines_tab[i].height) {
112             sc->lines_index = gxf_lines_tab[i].index;
113             return 0;
114         }
115     }
116     return -1;
117 }
118
119 static void gxf_write_padding(AVIOContext *pb, int64_t to_pad)
120 {
121     for (; to_pad > 0; to_pad--) {
122         avio_w8(pb, 0);
123     }
124 }
125
126 static int64_t updatePacketSize(AVIOContext *pb, int64_t pos)
127 {
128     int64_t curpos;
129     int size;
130
131     size = avio_tell(pb) - pos;
132     if (size % 4) {
133         gxf_write_padding(pb, 4 - size % 4);
134         size = avio_tell(pb) - pos;
135     }
136     curpos = avio_tell(pb);
137     avio_seek(pb, pos + 6, SEEK_SET);
138     avio_wb32(pb, size);
139     avio_seek(pb, curpos, SEEK_SET);
140     return curpos - pos;
141 }
142
143 static int64_t updateSize(AVIOContext *pb, int64_t pos)
144 {
145     int64_t curpos;
146
147     curpos = avio_tell(pb);
148     avio_seek(pb, pos, SEEK_SET);
149     avio_wb16(pb, curpos - pos - 2);
150     avio_seek(pb, curpos, SEEK_SET);
151     return curpos - pos;
152 }
153
154 static void gxf_write_packet_header(AVIOContext *pb, GXFPktType type)
155 {
156     avio_wb32(pb, 0);  /* packet leader for synchro */
157     avio_w8(pb, 1);
158     avio_w8(pb, type); /* map packet */
159     avio_wb32(pb, 0);  /* size */
160     avio_wb32(pb, 0);  /* reserved */
161     avio_w8(pb, 0xE1); /* trailer 1 */
162     avio_w8(pb, 0xE2); /* trailer 2 */
163 }
164
165 static int gxf_write_mpeg_auxiliary(AVIOContext *pb, AVStream *st)
166 {
167     GXFStreamContext *sc = st->priv_data;
168     char buffer[1024];
169     int size, starting_line;
170
171     if (sc->iframes) {
172         sc->p_per_gop = sc->pframes / sc->iframes;
173         if (sc->pframes % sc->iframes)
174             sc->p_per_gop++;
175         if (sc->pframes) {
176             sc->b_per_i_or_p = sc->bframes / sc->pframes;
177             if (sc->bframes % sc->pframes)
178                 sc->b_per_i_or_p++;
179         }
180         if (sc->p_per_gop > 9)
181             sc->p_per_gop = 9; /* ensure value won't take more than one char */
182         if (sc->b_per_i_or_p > 9)
183             sc->b_per_i_or_p = 9; /* ensure value won't take more than one char */
184     }
185     if (st->codec->height == 512 || st->codec->height == 608)
186         starting_line = 7; // VBI
187     else if (st->codec->height == 480)
188         starting_line = 20;
189     else
190         starting_line = 23; // default PAL
191
192     size = snprintf(buffer, 1024, "Ver 1\nBr %.6f\nIpg 1\nPpi %d\nBpiop %d\n"
193                     "Pix 0\nCf %d\nCg %d\nSl %d\nnl16 %d\nVi 1\nf1 1\n",
194                     (float)st->codec->bit_rate, sc->p_per_gop, sc->b_per_i_or_p,
195                     st->codec->pix_fmt == PIX_FMT_YUV422P ? 2 : 1, sc->first_gop_closed == 1,
196                     starting_line, (st->codec->height + 15) / 16);
197     avio_w8(pb, TRACK_MPG_AUX);
198     avio_w8(pb, size + 1);
199     avio_write(pb, (uint8_t *)buffer, size + 1);
200     return size + 3;
201 }
202
203 static int gxf_write_timecode_auxiliary(AVIOContext *pb, GXFStreamContext *sc)
204 {
205     avio_w8(pb, 0); /* fields */
206     avio_w8(pb, 0); /* seconds */
207     avio_w8(pb, 0); /* minutes */
208     avio_w8(pb, 0); /* flags + hours */
209     /* reserved */
210     avio_wb32(pb, 0);
211     return 8;
212 }
213
214 static int gxf_write_track_description(AVFormatContext *s, GXFStreamContext *sc, int index)
215 {
216     AVIOContext *pb = s->pb;
217     int64_t pos;
218     int mpeg = sc->track_type == 4 || sc->track_type == 9;
219
220     /* track description section */
221     avio_w8(pb, sc->media_type + 0x80);
222     avio_w8(pb, index + 0xC0);
223
224     pos = avio_tell(pb);
225     avio_wb16(pb, 0); /* size */
226
227     /* media file name */
228     avio_w8(pb, TRACK_NAME);
229     avio_w8(pb, strlen(ES_NAME_PATTERN) + 3);
230     avio_write(pb, ES_NAME_PATTERN, sizeof(ES_NAME_PATTERN) - 1);
231     avio_wb16(pb, sc->media_info);
232     avio_w8(pb, 0);
233
234     if (!mpeg) {
235         /* auxiliary information */
236         avio_w8(pb, TRACK_AUX);
237         avio_w8(pb, 8);
238         if (sc->track_type == 3)
239             gxf_write_timecode_auxiliary(pb, sc);
240         else
241             avio_wl64(pb, 0);
242     }
243
244     /* file system version */
245     avio_w8(pb, TRACK_VER);
246     avio_w8(pb, 4);
247     avio_wb32(pb, 0);
248
249     if (mpeg)
250         gxf_write_mpeg_auxiliary(pb, s->streams[index]);
251
252     /* frame rate */
253     avio_w8(pb, TRACK_FPS);
254     avio_w8(pb, 4);
255     avio_wb32(pb, sc->frame_rate_index);
256
257     /* lines per frame */
258     avio_w8(pb, TRACK_LINES);
259     avio_w8(pb, 4);
260     avio_wb32(pb, sc->lines_index);
261
262     /* fields per frame */
263     avio_w8(pb, TRACK_FPF);
264     avio_w8(pb, 4);
265     avio_wb32(pb, sc->fields);
266
267     return updateSize(pb, pos);
268 }
269
270 static int gxf_write_material_data_section(AVFormatContext *s)
271 {
272     GXFContext *gxf = s->priv_data;
273     AVIOContext *pb = s->pb;
274     int64_t pos;
275     int len;
276     const char *filename = strrchr(s->filename, '/');
277
278     pos = avio_tell(pb);
279     avio_wb16(pb, 0); /* size */
280
281     /* name */
282     if (filename)
283         filename++;
284     else
285         filename = s->filename;
286     len = strlen(filename);
287
288     avio_w8(pb, MAT_NAME);
289     avio_w8(pb, strlen(SERVER_PATH) + len + 1);
290     avio_write(pb, SERVER_PATH, sizeof(SERVER_PATH) - 1);
291     avio_write(pb, filename, len);
292     avio_w8(pb, 0);
293
294     /* first field */
295     avio_w8(pb, MAT_FIRST_FIELD);
296     avio_w8(pb, 4);
297     avio_wb32(pb, 0);
298
299     /* last field */
300     avio_w8(pb, MAT_LAST_FIELD);
301     avio_w8(pb, 4);
302     avio_wb32(pb, gxf->nb_fields);
303
304     /* reserved */
305     avio_w8(pb, MAT_MARK_IN);
306     avio_w8(pb, 4);
307     avio_wb32(pb, 0);
308
309     avio_w8(pb, MAT_MARK_OUT);
310     avio_w8(pb, 4);
311     avio_wb32(pb, gxf->nb_fields);
312
313     /* estimated size */
314     avio_w8(pb, MAT_SIZE);
315     avio_w8(pb, 4);
316     avio_wb32(pb, avio_size(pb) / 1024);
317
318     return updateSize(pb, pos);
319 }
320
321 static int gxf_write_track_description_section(AVFormatContext *s)
322 {
323     GXFContext *gxf = s->priv_data;
324     AVIOContext *pb = s->pb;
325     int64_t pos;
326     int i;
327
328     pos = avio_tell(pb);
329     avio_wb16(pb, 0); /* size */
330     for (i = 0; i < s->nb_streams; ++i)
331         gxf_write_track_description(s, s->streams[i]->priv_data, i);
332
333     gxf_write_track_description(s, &gxf->timecode_track, s->nb_streams);
334
335     return updateSize(pb, pos);
336 }
337
338 static int gxf_write_map_packet(AVFormatContext *s, int rewrite)
339 {
340     GXFContext *gxf = s->priv_data;
341     AVIOContext *pb = s->pb;
342     int64_t pos = avio_tell(pb);
343
344     if (!rewrite) {
345         if (!(gxf->map_offsets_nb % 30)) {
346             gxf->map_offsets = av_realloc(gxf->map_offsets,
347                                           (gxf->map_offsets_nb+30)*sizeof(*gxf->map_offsets));
348             if (!gxf->map_offsets) {
349                 av_log(s, AV_LOG_ERROR, "could not realloc map offsets\n");
350                 return -1;
351             }
352         }
353         gxf->map_offsets[gxf->map_offsets_nb++] = pos; // do not increment here
354     }
355
356     gxf_write_packet_header(pb, PKT_MAP);
357
358     /* preamble */
359     avio_w8(pb, 0xE0); /* version */
360     avio_w8(pb, 0xFF); /* reserved */
361
362     gxf_write_material_data_section(s);
363     gxf_write_track_description_section(s);
364
365     return updatePacketSize(pb, pos);
366 }
367
368 static int gxf_write_flt_packet(AVFormatContext *s)
369 {
370     GXFContext *gxf = s->priv_data;
371     AVIOContext *pb = s->pb;
372     int64_t pos = avio_tell(pb);
373     int fields_per_flt = (gxf->nb_fields+1) / 1000 + 1;
374     int flt_entries = gxf->nb_fields / fields_per_flt;
375     int i = 0;
376
377     gxf_write_packet_header(pb, PKT_FLT);
378
379     avio_wl32(pb, fields_per_flt); /* number of fields */
380     avio_wl32(pb, flt_entries); /* number of active flt entries */
381
382     if (gxf->flt_entries) {
383         for (i = 0; i < flt_entries; i++)
384             avio_wl32(pb, gxf->flt_entries[(i*fields_per_flt)>>1]);
385     }
386
387     for (; i < 1000; i++)
388         avio_wl32(pb, 0);
389
390     return updatePacketSize(pb, pos);
391 }
392
393 static int gxf_write_umf_material_description(AVFormatContext *s)
394 {
395     GXFContext *gxf = s->priv_data;
396     AVIOContext *pb = s->pb;
397     int timecode_base = gxf->time_base.den == 60000 ? 60 : 50;
398     int64_t timestamp = 0;
399     AVDictionaryEntry *t;
400     uint32_t timecode;
401
402 #if FF_API_TIMESTAMP
403     if (s->timestamp)
404         timestamp = s->timestamp;
405     else
406 #endif
407     if (t = av_dict_get(s->metadata, "creation_time", NULL, 0))
408         timestamp = ff_iso8601_to_unix_time(t->value);
409
410     // XXX drop frame
411     timecode =
412         gxf->nb_fields / (timecode_base * 3600) % 24 << 24 | // hours
413         gxf->nb_fields / (timecode_base * 60) % 60   << 16 | // minutes
414         gxf->nb_fields /  timecode_base % 60         <<  8 | // seconds
415         gxf->nb_fields %  timecode_base;                     // fields
416
417     avio_wl32(pb, gxf->flags);
418     avio_wl32(pb, gxf->nb_fields); /* length of the longest track */
419     avio_wl32(pb, gxf->nb_fields); /* length of the shortest track */
420     avio_wl32(pb, 0); /* mark in */
421     avio_wl32(pb, gxf->nb_fields); /* mark out */
422     avio_wl32(pb, 0); /* timecode mark in */
423     avio_wl32(pb, timecode); /* timecode mark out */
424     avio_wl64(pb, timestamp); /* modification time */
425     avio_wl64(pb, timestamp); /* creation time */
426     avio_wl16(pb, 0); /* reserved */
427     avio_wl16(pb, 0); /* reserved */
428     avio_wl16(pb, gxf->audio_tracks);
429     avio_wl16(pb, 1); /* timecode track count */
430     avio_wl16(pb, 0); /* reserved */
431     avio_wl16(pb, gxf->mpeg_tracks);
432     return 48;
433 }
434
435 static int gxf_write_umf_payload(AVFormatContext *s)
436 {
437     GXFContext *gxf = s->priv_data;
438     AVIOContext *pb = s->pb;
439
440     avio_wl32(pb, gxf->umf_length); /* total length of the umf data */
441     avio_wl32(pb, 3); /* version */
442     avio_wl32(pb, s->nb_streams+1);
443     avio_wl32(pb, gxf->umf_track_offset); /* umf track section offset */
444     avio_wl32(pb, gxf->umf_track_size);
445     avio_wl32(pb, s->nb_streams+1);
446     avio_wl32(pb, gxf->umf_media_offset);
447     avio_wl32(pb, gxf->umf_media_size);
448     avio_wl32(pb, gxf->umf_length); /* user data offset */
449     avio_wl32(pb, 0); /* user data size */
450     avio_wl32(pb, 0); /* reserved */
451     avio_wl32(pb, 0); /* reserved */
452     return 48;
453 }
454
455 static int gxf_write_umf_track_description(AVFormatContext *s)
456 {
457     AVIOContext *pb = s->pb;
458     GXFContext *gxf = s->priv_data;
459     int64_t pos = avio_tell(pb);
460     int i;
461
462     gxf->umf_track_offset = pos - gxf->umf_start_offset;
463     for (i = 0; i < s->nb_streams; ++i) {
464         GXFStreamContext *sc = s->streams[i]->priv_data;
465         avio_wl16(pb, sc->media_info);
466         avio_wl16(pb, 1);
467     }
468
469     avio_wl16(pb, gxf->timecode_track.media_info);
470     avio_wl16(pb, 1);
471
472     return avio_tell(pb) - pos;
473 }
474
475 static int gxf_write_umf_media_mpeg(AVIOContext *pb, AVStream *st)
476 {
477     GXFStreamContext *sc = st->priv_data;
478
479     if (st->codec->pix_fmt == PIX_FMT_YUV422P)
480         avio_wl32(pb, 2);
481     else
482         avio_wl32(pb, 1); /* default to 420 */
483     avio_wl32(pb, sc->first_gop_closed == 1); /* closed = 1, open = 0, unknown = 255 */
484     avio_wl32(pb, 3); /* top = 1, bottom = 2, frame = 3, unknown = 0 */
485     avio_wl32(pb, 1); /* I picture per GOP */
486     avio_wl32(pb, sc->p_per_gop);
487     avio_wl32(pb, sc->b_per_i_or_p);
488     if (st->codec->codec_id == CODEC_ID_MPEG2VIDEO)
489         avio_wl32(pb, 2);
490     else if (st->codec->codec_id == CODEC_ID_MPEG1VIDEO)
491         avio_wl32(pb, 1);
492     else
493         avio_wl32(pb, 0);
494     avio_wl32(pb, 0); /* reserved */
495     return 32;
496 }
497
498 static int gxf_write_umf_media_timecode(AVIOContext *pb, GXFStreamContext *sc)
499 {
500     avio_wl32(pb, 1); /* non drop frame */
501     avio_wl32(pb, 0); /* reserved */
502     avio_wl32(pb, 0); /* reserved */
503     avio_wl32(pb, 0); /* reserved */
504     avio_wl32(pb, 0); /* reserved */
505     avio_wl32(pb, 0); /* reserved */
506     avio_wl32(pb, 0); /* reserved */
507     avio_wl32(pb, 0); /* reserved */
508     return 32;
509 }
510
511 static int gxf_write_umf_media_dv(AVIOContext *pb, GXFStreamContext *sc)
512 {
513     int i;
514
515     for (i = 0; i < 8; i++) {
516         avio_wb32(pb, 0);
517     }
518     return 32;
519 }
520
521 static int gxf_write_umf_media_audio(AVIOContext *pb, GXFStreamContext *sc)
522 {
523     avio_wl64(pb, av_dbl2int(1)); /* sound level to begin to */
524     avio_wl64(pb, av_dbl2int(1)); /* sound level to begin to */
525     avio_wl32(pb, 0); /* number of fields over which to ramp up sound level */
526     avio_wl32(pb, 0); /* number of fields over which to ramp down sound level */
527     avio_wl32(pb, 0); /* reserved */
528     avio_wl32(pb, 0); /* reserved */
529     return 32;
530 }
531
532 #if 0
533 static int gxf_write_umf_media_mjpeg(AVIOContext *pb, GXFStreamContext *sc)
534 {
535     avio_wb64(pb, 0); /* FIXME FLOAT max chroma quant level */
536     avio_wb64(pb, 0); /* FIXME FLOAT max luma quant level */
537     avio_wb64(pb, 0); /* FIXME FLOAT min chroma quant level */
538     avio_wb64(pb, 0); /* FIXME FLOAT min luma quant level */
539     return 32;
540 }
541 #endif
542
543 static int gxf_write_umf_media_description(AVFormatContext *s)
544 {
545     GXFContext *gxf = s->priv_data;
546     AVIOContext *pb = s->pb;
547     int64_t pos;
548     int i, j;
549
550     pos = avio_tell(pb);
551     gxf->umf_media_offset = pos - gxf->umf_start_offset;
552     for (i = 0; i <= s->nb_streams; ++i) {
553         GXFStreamContext *sc;
554         int64_t startpos, curpos;
555
556         if (i == s->nb_streams)
557             sc = &gxf->timecode_track;
558         else
559             sc = s->streams[i]->priv_data;
560
561         startpos = avio_tell(pb);
562         avio_wl16(pb, 0); /* length */
563         avio_wl16(pb, sc->media_info);
564         avio_wl16(pb, 0); /* reserved */
565         avio_wl16(pb, 0); /* reserved */
566         avio_wl32(pb, gxf->nb_fields);
567         avio_wl32(pb, 0); /* attributes rw, ro */
568         avio_wl32(pb, 0); /* mark in */
569         avio_wl32(pb, gxf->nb_fields); /* mark out */
570         avio_write(pb, ES_NAME_PATTERN, strlen(ES_NAME_PATTERN));
571         avio_wb16(pb, sc->media_info);
572         for (j = strlen(ES_NAME_PATTERN)+2; j < 88; j++)
573             avio_w8(pb, 0);
574         avio_wl32(pb, sc->track_type);
575         avio_wl32(pb, sc->sample_rate);
576         avio_wl32(pb, sc->sample_size);
577         avio_wl32(pb, 0); /* reserved */
578
579         if (sc == &gxf->timecode_track)
580             gxf_write_umf_media_timecode(pb, sc); /* 8 0bytes */
581         else {
582             AVStream *st = s->streams[i];
583             switch (st->codec->codec_id) {
584             case CODEC_ID_MPEG1VIDEO:
585             case CODEC_ID_MPEG2VIDEO:
586                 gxf_write_umf_media_mpeg(pb, st);
587                 break;
588             case CODEC_ID_PCM_S16LE:
589                 gxf_write_umf_media_audio(pb, sc);
590                 break;
591             case CODEC_ID_DVVIDEO:
592                 gxf_write_umf_media_dv(pb, sc);
593                 break;
594             }
595         }
596
597         curpos = avio_tell(pb);
598         avio_seek(pb, startpos, SEEK_SET);
599         avio_wl16(pb, curpos - startpos);
600         avio_seek(pb, curpos, SEEK_SET);
601     }
602     return avio_tell(pb) - pos;
603 }
604
605 static int gxf_write_umf_packet(AVFormatContext *s)
606 {
607     GXFContext *gxf = s->priv_data;
608     AVIOContext *pb = s->pb;
609     int64_t pos = avio_tell(pb);
610
611     gxf_write_packet_header(pb, PKT_UMF);
612
613     /* preamble */
614     avio_w8(pb, 3); /* first and last (only) packet */
615     avio_wb32(pb, gxf->umf_length); /* data length */
616
617     gxf->umf_start_offset = avio_tell(pb);
618     gxf_write_umf_payload(s);
619     gxf_write_umf_material_description(s);
620     gxf->umf_track_size = gxf_write_umf_track_description(s);
621     gxf->umf_media_size = gxf_write_umf_media_description(s);
622     gxf->umf_length = avio_tell(pb) - gxf->umf_start_offset;
623     return updatePacketSize(pb, pos);
624 }
625
626 static const int GXF_samples_per_frame[] = { 32768, 0 };
627
628 static void gxf_init_timecode_track(GXFStreamContext *sc, GXFStreamContext *vsc)
629 {
630     if (!vsc)
631         return;
632
633     sc->media_type = vsc->sample_rate == 60 ? 7 : 8;
634     sc->sample_rate = vsc->sample_rate;
635     sc->media_info = ('T'<<8) | '0';
636     sc->track_type = 3;
637     sc->frame_rate_index = vsc->frame_rate_index;
638     sc->lines_index = vsc->lines_index;
639     sc->sample_size = 16;
640     sc->fields = vsc->fields;
641 }
642
643 static int gxf_write_header(AVFormatContext *s)
644 {
645     AVIOContext *pb = s->pb;
646     GXFContext *gxf = s->priv_data;
647     GXFStreamContext *vsc = NULL;
648     uint8_t tracks[255] = {0};
649     int i, media_info = 0;
650
651     if (!pb->seekable) {
652         av_log(s, AV_LOG_ERROR, "gxf muxer does not support streamed output, patch welcome");
653         return -1;
654     }
655
656     gxf->flags |= 0x00080000; /* material is simple clip */
657     for (i = 0; i < s->nb_streams; ++i) {
658         AVStream *st = s->streams[i];
659         GXFStreamContext *sc = av_mallocz(sizeof(*sc));
660         if (!sc)
661             return AVERROR(ENOMEM);
662         st->priv_data = sc;
663
664         sc->media_type = ff_codec_get_tag(gxf_media_types, st->codec->codec_id);
665         if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
666             if (st->codec->codec_id != CODEC_ID_PCM_S16LE) {
667                 av_log(s, AV_LOG_ERROR, "only 16 BIT PCM LE allowed for now\n");
668                 return -1;
669             }
670             if (st->codec->sample_rate != 48000) {
671                 av_log(s, AV_LOG_ERROR, "only 48000hz sampling rate is allowed\n");
672                 return -1;
673             }
674             if (st->codec->channels != 1) {
675                 av_log(s, AV_LOG_ERROR, "only mono tracks are allowed\n");
676                 return -1;
677             }
678             sc->track_type = 2;
679             sc->sample_rate = st->codec->sample_rate;
680             avpriv_set_pts_info(st, 64, 1, sc->sample_rate);
681             sc->sample_size = 16;
682             sc->frame_rate_index = -2;
683             sc->lines_index = -2;
684             sc->fields = -2;
685             gxf->audio_tracks++;
686             gxf->flags |= 0x04000000; /* audio is 16 bit pcm */
687             media_info = 'A';
688         } else if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
689             if (i != 0) {
690                 av_log(s, AV_LOG_ERROR, "video stream must be the first track\n");
691                 return -1;
692             }
693             /* FIXME check from time_base ? */
694             if (st->codec->height == 480 || st->codec->height == 512) { /* NTSC or NTSC+VBI */
695                 sc->frame_rate_index = 5;
696                 sc->sample_rate = 60;
697                 gxf->flags |= 0x00000080;
698                 gxf->time_base = (AVRational){ 1001, 60000 };
699             } else if (st->codec->height == 576 || st->codec->height == 608) { /* PAL or PAL+VBI */
700                 sc->frame_rate_index = 6;
701                 sc->media_type++;
702                 sc->sample_rate = 50;
703                 gxf->flags |= 0x00000040;
704                 gxf->time_base = (AVRational){ 1, 50 };
705             } else {
706                 av_log(s, AV_LOG_ERROR, "unsupported video resolution, "
707                        "gxf muxer only accepts PAL or NTSC resolutions currently\n");
708                 return -1;
709             }
710             avpriv_set_pts_info(st, 64, gxf->time_base.num, gxf->time_base.den);
711             if (gxf_find_lines_index(st) < 0)
712                 sc->lines_index = -1;
713             sc->sample_size = st->codec->bit_rate;
714             sc->fields = 2; /* interlaced */
715
716             vsc = sc;
717
718             switch (st->codec->codec_id) {
719             case CODEC_ID_MJPEG:
720                 sc->track_type = 1;
721                 gxf->flags |= 0x00004000;
722                 media_info = 'J';
723                 break;
724             case CODEC_ID_MPEG1VIDEO:
725                 sc->track_type = 9;
726                 gxf->mpeg_tracks++;
727                 media_info = 'L';
728                 break;
729             case CODEC_ID_MPEG2VIDEO:
730                 sc->first_gop_closed = -1;
731                 sc->track_type = 4;
732                 gxf->mpeg_tracks++;
733                 gxf->flags |= 0x00008000;
734                 media_info = 'M';
735                 break;
736             case CODEC_ID_DVVIDEO:
737                 if (st->codec->pix_fmt == PIX_FMT_YUV422P) {
738                     sc->media_type += 2;
739                     sc->track_type = 6;
740                     gxf->flags |= 0x00002000;
741                     media_info = 'E';
742                 } else {
743                     sc->track_type = 5;
744                     gxf->flags |= 0x00001000;
745                     media_info = 'D';
746                 }
747                 break;
748             default:
749                 av_log(s, AV_LOG_ERROR, "video codec not supported\n");
750                 return -1;
751             }
752         }
753         /* FIXME first 10 audio tracks are 0 to 9 next 22 are A to V */
754         sc->media_info = media_info<<8 | ('0'+tracks[media_info]++);
755         sc->order = s->nb_streams - st->index;
756     }
757
758     if (ff_audio_interleave_init(s, GXF_samples_per_frame, (AVRational){ 1, 48000 }) < 0)
759         return -1;
760
761     gxf_init_timecode_track(&gxf->timecode_track, vsc);
762     gxf->flags |= 0x200000; // time code track is non-drop frame
763
764     gxf_write_map_packet(s, 0);
765     gxf_write_flt_packet(s);
766     gxf_write_umf_packet(s);
767
768     gxf->packet_count = 3;
769
770     avio_flush(pb);
771     return 0;
772 }
773
774 static int gxf_write_eos_packet(AVIOContext *pb)
775 {
776     int64_t pos = avio_tell(pb);
777
778     gxf_write_packet_header(pb, PKT_EOS);
779     return updatePacketSize(pb, pos);
780 }
781
782 static int gxf_write_trailer(AVFormatContext *s)
783 {
784     GXFContext *gxf = s->priv_data;
785     AVIOContext *pb = s->pb;
786     int64_t end;
787     int i;
788
789     ff_audio_interleave_close(s);
790
791     gxf_write_eos_packet(pb);
792     end = avio_tell(pb);
793     avio_seek(pb, 0, SEEK_SET);
794     /* overwrite map, flt and umf packets with new values */
795     gxf_write_map_packet(s, 1);
796     gxf_write_flt_packet(s);
797     gxf_write_umf_packet(s);
798     avio_flush(pb);
799     /* update duration in all map packets */
800     for (i = 1; i < gxf->map_offsets_nb; i++) {
801         avio_seek(pb, gxf->map_offsets[i], SEEK_SET);
802         gxf_write_map_packet(s, 1);
803         avio_flush(pb);
804     }
805
806     avio_seek(pb, end, SEEK_SET);
807
808     av_freep(&gxf->flt_entries);
809     av_freep(&gxf->map_offsets);
810
811     return 0;
812 }
813
814 static int gxf_parse_mpeg_frame(GXFStreamContext *sc, const uint8_t *buf, int size)
815 {
816     uint32_t c=-1;
817     int i;
818     for(i=0; i<size-4 && c!=0x100; i++){
819         c = (c<<8) + buf[i];
820         if(c == 0x1B8 && sc->first_gop_closed == -1) /* GOP start code */
821             sc->first_gop_closed= (buf[i+4]>>6)&1;
822     }
823     return (buf[i+1]>>3)&7;
824 }
825
826 static int gxf_write_media_preamble(AVFormatContext *s, AVPacket *pkt, int size)
827 {
828     GXFContext *gxf = s->priv_data;
829     AVIOContext *pb = s->pb;
830     AVStream *st = s->streams[pkt->stream_index];
831     GXFStreamContext *sc = st->priv_data;
832     unsigned field_nb;
833     /* If the video is frame-encoded, the frame numbers shall be represented by
834      * even field numbers.
835      * see SMPTE360M-2004  6.4.2.1.3 Media field number */
836     if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
837         field_nb = gxf->nb_fields;
838     } else {
839         field_nb = av_rescale_rnd(pkt->dts, gxf->time_base.den,
840                                   (int64_t)48000*gxf->time_base.num, AV_ROUND_UP);
841     }
842
843     avio_w8(pb, sc->media_type);
844     avio_w8(pb, st->index);
845     avio_wb32(pb, field_nb);
846     if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
847         avio_wb16(pb, 0);
848         avio_wb16(pb, size / 2);
849     } else if (st->codec->codec_id == CODEC_ID_MPEG2VIDEO) {
850         int frame_type = gxf_parse_mpeg_frame(sc, pkt->data, pkt->size);
851         if (frame_type == AV_PICTURE_TYPE_I) {
852             avio_w8(pb, 0x0d);
853             sc->iframes++;
854         } else if (frame_type == AV_PICTURE_TYPE_B) {
855             avio_w8(pb, 0x0f);
856             sc->bframes++;
857         } else {
858             avio_w8(pb, 0x0e);
859             sc->pframes++;
860         }
861         avio_wb24(pb, size);
862     } else if (st->codec->codec_id == CODEC_ID_DVVIDEO) {
863         avio_w8(pb, size / 4096);
864         avio_wb24(pb, 0);
865     } else
866         avio_wb32(pb, size);
867     avio_wb32(pb, field_nb);
868     avio_w8(pb, 1); /* flags */
869     avio_w8(pb, 0); /* reserved */
870     return 16;
871 }
872
873 static int gxf_write_packet(AVFormatContext *s, AVPacket *pkt)
874 {
875     GXFContext *gxf = s->priv_data;
876     AVIOContext *pb = s->pb;
877     AVStream *st = s->streams[pkt->stream_index];
878     int64_t pos = avio_tell(pb);
879     int padding = 0;
880     int packet_start_offset = avio_tell(pb) / 1024;
881
882     gxf_write_packet_header(pb, PKT_MEDIA);
883     if (st->codec->codec_id == CODEC_ID_MPEG2VIDEO && pkt->size % 4) /* MPEG-2 frames must be padded */
884         padding = 4 - pkt->size % 4;
885     else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO)
886         padding = GXF_AUDIO_PACKET_SIZE - pkt->size;
887     gxf_write_media_preamble(s, pkt, pkt->size + padding);
888     avio_write(pb, pkt->data, pkt->size);
889     gxf_write_padding(pb, padding);
890
891     if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
892         if (!(gxf->flt_entries_nb % 500)) {
893             gxf->flt_entries = av_realloc(gxf->flt_entries,
894                                           (gxf->flt_entries_nb+500)*sizeof(*gxf->flt_entries));
895             if (!gxf->flt_entries) {
896                 av_log(s, AV_LOG_ERROR, "could not reallocate flt entries\n");
897                 return -1;
898             }
899         }
900         gxf->flt_entries[gxf->flt_entries_nb++] = packet_start_offset;
901         gxf->nb_fields += 2; // count fields
902     }
903
904     updatePacketSize(pb, pos);
905
906     gxf->packet_count++;
907     if (gxf->packet_count == 100) {
908         gxf_write_map_packet(s, 0);
909         gxf->packet_count = 0;
910     }
911
912     avio_flush(pb);
913
914     return 0;
915 }
916
917 static int gxf_compare_field_nb(AVFormatContext *s, AVPacket *next, AVPacket *cur)
918 {
919     GXFContext *gxf = s->priv_data;
920     AVPacket *pkt[2] = { cur, next };
921     int i, field_nb[2];
922     GXFStreamContext *sc[2];
923
924     for (i = 0; i < 2; i++) {
925         AVStream *st = s->streams[pkt[i]->stream_index];
926         sc[i] = st->priv_data;
927         if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
928             field_nb[i] = av_rescale_rnd(pkt[i]->dts, gxf->time_base.den,
929                                          (int64_t)48000*gxf->time_base.num, AV_ROUND_UP);
930             field_nb[i] &= ~1; // compare against even field number because audio must be before video
931         } else
932             field_nb[i] = pkt[i]->dts; // dts are field based
933     }
934
935     return field_nb[1] > field_nb[0] ||
936         (field_nb[1] == field_nb[0] && sc[1]->order > sc[0]->order);
937 }
938
939 static int gxf_interleave_packet(AVFormatContext *s, AVPacket *out, AVPacket *pkt, int flush)
940 {
941     if (pkt && s->streams[pkt->stream_index]->codec->codec_type == AVMEDIA_TYPE_VIDEO)
942         pkt->duration = 2; // enforce 2 fields
943     return ff_audio_rechunk_interleave(s, out, pkt, flush,
944                                av_interleave_packet_per_dts, gxf_compare_field_nb);
945 }
946
947 AVOutputFormat ff_gxf_muxer = {
948     .name              = "gxf",
949     .long_name         = NULL_IF_CONFIG_SMALL("GXF format"),
950     .extensions        = "gxf",
951     .priv_data_size    = sizeof(GXFContext),
952     .audio_codec       = CODEC_ID_PCM_S16LE,
953     .video_codec       = CODEC_ID_MPEG2VIDEO,
954     .write_header      = gxf_write_header,
955     .write_packet      = gxf_write_packet,
956     .write_trailer     = gxf_write_trailer,
957     .interleave_packet = gxf_interleave_packet,
958 };