]> git.sesse.net Git - ffmpeg/blob - libavformat/rtpenc.c
avconv: get output pixel format from lavfi.
[ffmpeg] / libavformat / rtpenc.c
1 /*
2  * RTP output format
3  * Copyright (c) 2002 Fabrice Bellard
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "avformat.h"
23 #include "mpegts.h"
24 #include "internal.h"
25 #include "libavutil/mathematics.h"
26 #include "libavutil/random_seed.h"
27 #include "libavutil/opt.h"
28
29 #include "rtpenc.h"
30
31 //#define DEBUG
32
33 static const AVOption options[] = {
34     FF_RTP_FLAG_OPTS(RTPMuxContext, flags)
35     { "payload_type", "Specify RTP payload type", offsetof(RTPMuxContext, payload_type), AV_OPT_TYPE_INT, {.dbl = -1 }, -1, 127, AV_OPT_FLAG_ENCODING_PARAM },
36     { NULL },
37 };
38
39 static const AVClass rtp_muxer_class = {
40     .class_name = "RTP muxer",
41     .item_name  = av_default_item_name,
42     .option     = options,
43     .version    = LIBAVUTIL_VERSION_INT,
44 };
45
46 #define RTCP_SR_SIZE 28
47
48 static int is_supported(enum CodecID id)
49 {
50     switch(id) {
51     case CODEC_ID_H263:
52     case CODEC_ID_H263P:
53     case CODEC_ID_H264:
54     case CODEC_ID_MPEG1VIDEO:
55     case CODEC_ID_MPEG2VIDEO:
56     case CODEC_ID_MPEG4:
57     case CODEC_ID_AAC:
58     case CODEC_ID_MP2:
59     case CODEC_ID_MP3:
60     case CODEC_ID_PCM_ALAW:
61     case CODEC_ID_PCM_MULAW:
62     case CODEC_ID_PCM_S8:
63     case CODEC_ID_PCM_S16BE:
64     case CODEC_ID_PCM_S16LE:
65     case CODEC_ID_PCM_U16BE:
66     case CODEC_ID_PCM_U16LE:
67     case CODEC_ID_PCM_U8:
68     case CODEC_ID_MPEG2TS:
69     case CODEC_ID_AMR_NB:
70     case CODEC_ID_AMR_WB:
71     case CODEC_ID_VORBIS:
72     case CODEC_ID_THEORA:
73     case CODEC_ID_VP8:
74     case CODEC_ID_ADPCM_G722:
75     case CODEC_ID_ADPCM_G726:
76         return 1;
77     default:
78         return 0;
79     }
80 }
81
82 static int rtp_write_header(AVFormatContext *s1)
83 {
84     RTPMuxContext *s = s1->priv_data;
85     int n;
86     AVStream *st;
87
88     if (s1->nb_streams != 1) {
89         av_log(s1, AV_LOG_ERROR, "Only one stream supported in the RTP muxer\n");
90         return AVERROR(EINVAL);
91     }
92     st = s1->streams[0];
93     if (!is_supported(st->codec->codec_id)) {
94         av_log(s1, AV_LOG_ERROR, "Unsupported codec %x\n", st->codec->codec_id);
95
96         return -1;
97     }
98
99     if (s->payload_type < 0)
100         s->payload_type = ff_rtp_get_payload_type(s1, st->codec);
101     s->base_timestamp = av_get_random_seed();
102     s->timestamp = s->base_timestamp;
103     s->cur_timestamp = 0;
104     s->ssrc = av_get_random_seed();
105     s->first_packet = 1;
106     s->first_rtcp_ntp_time = ff_ntp_time();
107     if (s1->start_time_realtime)
108         /* Round the NTP time to whole milliseconds. */
109         s->first_rtcp_ntp_time = (s1->start_time_realtime / 1000) * 1000 +
110                                  NTP_OFFSET_US;
111
112     if (s1->packet_size) {
113         if (s1->pb->max_packet_size)
114             s1->packet_size = FFMIN(s1->packet_size,
115                                     s1->pb->max_packet_size);
116     } else
117         s1->packet_size = s1->pb->max_packet_size;
118     if (s1->packet_size <= 12) {
119         av_log(s1, AV_LOG_ERROR, "Max packet size %d too low\n", s1->packet_size);
120         return AVERROR(EIO);
121     }
122     s->buf = av_malloc(s1->packet_size);
123     if (s->buf == NULL) {
124         return AVERROR(ENOMEM);
125     }
126     s->max_payload_size = s1->packet_size - 12;
127
128     s->max_frames_per_packet = 0;
129     if (s1->max_delay > 0) {
130         if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
131             int frame_size = av_get_audio_frame_duration(st->codec, 0);
132             if (!frame_size)
133                 frame_size = st->codec->frame_size;
134             if (frame_size == 0) {
135                 av_log(s1, AV_LOG_ERROR, "Cannot respect max delay: frame size = 0\n");
136             } else {
137                 s->max_frames_per_packet =
138                         av_rescale_q_rnd(s1->max_delay,
139                                          AV_TIME_BASE_Q,
140                                          (AVRational){ frame_size, st->codec->sample_rate },
141                                          AV_ROUND_DOWN);
142             }
143         }
144         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
145             /* FIXME: We should round down here... */
146             s->max_frames_per_packet = av_rescale_q(s1->max_delay, (AVRational){1, 1000000}, st->codec->time_base);
147         }
148     }
149
150     avpriv_set_pts_info(st, 32, 1, 90000);
151     switch(st->codec->codec_id) {
152     case CODEC_ID_MP2:
153     case CODEC_ID_MP3:
154         s->buf_ptr = s->buf + 4;
155         break;
156     case CODEC_ID_MPEG1VIDEO:
157     case CODEC_ID_MPEG2VIDEO:
158         break;
159     case CODEC_ID_MPEG2TS:
160         n = s->max_payload_size / TS_PACKET_SIZE;
161         if (n < 1)
162             n = 1;
163         s->max_payload_size = n * TS_PACKET_SIZE;
164         s->buf_ptr = s->buf;
165         break;
166     case CODEC_ID_H264:
167         /* check for H.264 MP4 syntax */
168         if (st->codec->extradata_size > 4 && st->codec->extradata[0] == 1) {
169             s->nal_length_size = (st->codec->extradata[4] & 0x03) + 1;
170         }
171         break;
172     case CODEC_ID_VORBIS:
173     case CODEC_ID_THEORA:
174         if (!s->max_frames_per_packet) s->max_frames_per_packet = 15;
175         s->max_frames_per_packet = av_clip(s->max_frames_per_packet, 1, 15);
176         s->max_payload_size -= 6; // ident+frag+tdt/vdt+pkt_num+pkt_length
177         s->num_frames = 0;
178         goto defaultcase;
179     case CODEC_ID_VP8:
180         av_log(s1, AV_LOG_ERROR, "RTP VP8 payload implementation is "
181                                  "incompatible with the latest spec drafts.\n");
182         break;
183     case CODEC_ID_ADPCM_G722:
184         /* Due to a historical error, the clock rate for G722 in RTP is
185          * 8000, even if the sample rate is 16000. See RFC 3551. */
186         avpriv_set_pts_info(st, 32, 1, 8000);
187         break;
188     case CODEC_ID_AMR_NB:
189     case CODEC_ID_AMR_WB:
190         if (!s->max_frames_per_packet)
191             s->max_frames_per_packet = 12;
192         if (st->codec->codec_id == CODEC_ID_AMR_NB)
193             n = 31;
194         else
195             n = 61;
196         /* max_header_toc_size + the largest AMR payload must fit */
197         if (1 + s->max_frames_per_packet + n > s->max_payload_size) {
198             av_log(s1, AV_LOG_ERROR, "RTP max payload size too small for AMR\n");
199             return -1;
200         }
201         if (st->codec->channels != 1) {
202             av_log(s1, AV_LOG_ERROR, "Only mono is supported\n");
203             return -1;
204         }
205     case CODEC_ID_AAC:
206         s->num_frames = 0;
207     default:
208 defaultcase:
209         if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
210             avpriv_set_pts_info(st, 32, 1, st->codec->sample_rate);
211         }
212         s->buf_ptr = s->buf;
213         break;
214     }
215
216     return 0;
217 }
218
219 /* send an rtcp sender report packet */
220 static void rtcp_send_sr(AVFormatContext *s1, int64_t ntp_time)
221 {
222     RTPMuxContext *s = s1->priv_data;
223     uint32_t rtp_ts;
224
225     av_dlog(s1, "RTCP: %02x %"PRIx64" %x\n", s->payload_type, ntp_time, s->timestamp);
226
227     s->last_rtcp_ntp_time = ntp_time;
228     rtp_ts = av_rescale_q(ntp_time - s->first_rtcp_ntp_time, (AVRational){1, 1000000},
229                           s1->streams[0]->time_base) + s->base_timestamp;
230     avio_w8(s1->pb, (RTP_VERSION << 6));
231     avio_w8(s1->pb, RTCP_SR);
232     avio_wb16(s1->pb, 6); /* length in words - 1 */
233     avio_wb32(s1->pb, s->ssrc);
234     avio_wb32(s1->pb, ntp_time / 1000000);
235     avio_wb32(s1->pb, ((ntp_time % 1000000) << 32) / 1000000);
236     avio_wb32(s1->pb, rtp_ts);
237     avio_wb32(s1->pb, s->packet_count);
238     avio_wb32(s1->pb, s->octet_count);
239     avio_flush(s1->pb);
240 }
241
242 /* send an rtp packet. sequence number is incremented, but the caller
243    must update the timestamp itself */
244 void ff_rtp_send_data(AVFormatContext *s1, const uint8_t *buf1, int len, int m)
245 {
246     RTPMuxContext *s = s1->priv_data;
247
248     av_dlog(s1, "rtp_send_data size=%d\n", len);
249
250     /* build the RTP header */
251     avio_w8(s1->pb, (RTP_VERSION << 6));
252     avio_w8(s1->pb, (s->payload_type & 0x7f) | ((m & 0x01) << 7));
253     avio_wb16(s1->pb, s->seq);
254     avio_wb32(s1->pb, s->timestamp);
255     avio_wb32(s1->pb, s->ssrc);
256
257     avio_write(s1->pb, buf1, len);
258     avio_flush(s1->pb);
259
260     s->seq++;
261     s->octet_count += len;
262     s->packet_count++;
263 }
264
265 /* send an integer number of samples and compute time stamp and fill
266    the rtp send buffer before sending. */
267 static void rtp_send_samples(AVFormatContext *s1,
268                              const uint8_t *buf1, int size, int sample_size_bits)
269 {
270     RTPMuxContext *s = s1->priv_data;
271     int len, max_packet_size, n;
272     /* Calculate the number of bytes to get samples aligned on a byte border */
273     int aligned_samples_size = sample_size_bits/av_gcd(sample_size_bits, 8);
274
275     max_packet_size = (s->max_payload_size / aligned_samples_size) * aligned_samples_size;
276     /* Not needed, but who knows. Don't check if samples aren't an even number of bytes. */
277     if ((sample_size_bits % 8) == 0 && ((8 * size) % sample_size_bits) != 0)
278         av_abort();
279     n = 0;
280     while (size > 0) {
281         s->buf_ptr = s->buf;
282         len = FFMIN(max_packet_size, size);
283
284         /* copy data */
285         memcpy(s->buf_ptr, buf1, len);
286         s->buf_ptr += len;
287         buf1 += len;
288         size -= len;
289         s->timestamp = s->cur_timestamp + n * 8 / sample_size_bits;
290         ff_rtp_send_data(s1, s->buf, s->buf_ptr - s->buf, 0);
291         n += (s->buf_ptr - s->buf);
292     }
293 }
294
295 static void rtp_send_mpegaudio(AVFormatContext *s1,
296                                const uint8_t *buf1, int size)
297 {
298     RTPMuxContext *s = s1->priv_data;
299     int len, count, max_packet_size;
300
301     max_packet_size = s->max_payload_size;
302
303     /* test if we must flush because not enough space */
304     len = (s->buf_ptr - s->buf);
305     if ((len + size) > max_packet_size) {
306         if (len > 4) {
307             ff_rtp_send_data(s1, s->buf, s->buf_ptr - s->buf, 0);
308             s->buf_ptr = s->buf + 4;
309         }
310     }
311     if (s->buf_ptr == s->buf + 4) {
312         s->timestamp = s->cur_timestamp;
313     }
314
315     /* add the packet */
316     if (size > max_packet_size) {
317         /* big packet: fragment */
318         count = 0;
319         while (size > 0) {
320             len = max_packet_size - 4;
321             if (len > size)
322                 len = size;
323             /* build fragmented packet */
324             s->buf[0] = 0;
325             s->buf[1] = 0;
326             s->buf[2] = count >> 8;
327             s->buf[3] = count;
328             memcpy(s->buf + 4, buf1, len);
329             ff_rtp_send_data(s1, s->buf, len + 4, 0);
330             size -= len;
331             buf1 += len;
332             count += len;
333         }
334     } else {
335         if (s->buf_ptr == s->buf + 4) {
336             /* no fragmentation possible */
337             s->buf[0] = 0;
338             s->buf[1] = 0;
339             s->buf[2] = 0;
340             s->buf[3] = 0;
341         }
342         memcpy(s->buf_ptr, buf1, size);
343         s->buf_ptr += size;
344     }
345 }
346
347 static void rtp_send_raw(AVFormatContext *s1,
348                          const uint8_t *buf1, int size)
349 {
350     RTPMuxContext *s = s1->priv_data;
351     int len, max_packet_size;
352
353     max_packet_size = s->max_payload_size;
354
355     while (size > 0) {
356         len = max_packet_size;
357         if (len > size)
358             len = size;
359
360         s->timestamp = s->cur_timestamp;
361         ff_rtp_send_data(s1, buf1, len, (len == size));
362
363         buf1 += len;
364         size -= len;
365     }
366 }
367
368 /* NOTE: size is assumed to be an integer multiple of TS_PACKET_SIZE */
369 static void rtp_send_mpegts_raw(AVFormatContext *s1,
370                                 const uint8_t *buf1, int size)
371 {
372     RTPMuxContext *s = s1->priv_data;
373     int len, out_len;
374
375     while (size >= TS_PACKET_SIZE) {
376         len = s->max_payload_size - (s->buf_ptr - s->buf);
377         if (len > size)
378             len = size;
379         memcpy(s->buf_ptr, buf1, len);
380         buf1 += len;
381         size -= len;
382         s->buf_ptr += len;
383
384         out_len = s->buf_ptr - s->buf;
385         if (out_len >= s->max_payload_size) {
386             ff_rtp_send_data(s1, s->buf, out_len, 0);
387             s->buf_ptr = s->buf;
388         }
389     }
390 }
391
392 static int rtp_write_packet(AVFormatContext *s1, AVPacket *pkt)
393 {
394     RTPMuxContext *s = s1->priv_data;
395     AVStream *st = s1->streams[0];
396     int rtcp_bytes;
397     int size= pkt->size;
398
399     av_dlog(s1, "%d: write len=%d\n", pkt->stream_index, size);
400
401     rtcp_bytes = ((s->octet_count - s->last_octet_count) * RTCP_TX_RATIO_NUM) /
402         RTCP_TX_RATIO_DEN;
403     if ((s->first_packet || ((rtcp_bytes >= RTCP_SR_SIZE) &&
404                             (ff_ntp_time() - s->last_rtcp_ntp_time > 5000000))) &&
405         !(s->flags & FF_RTP_FLAG_SKIP_RTCP)) {
406         rtcp_send_sr(s1, ff_ntp_time());
407         s->last_octet_count = s->octet_count;
408         s->first_packet = 0;
409     }
410     s->cur_timestamp = s->base_timestamp + pkt->pts;
411
412     switch(st->codec->codec_id) {
413     case CODEC_ID_PCM_MULAW:
414     case CODEC_ID_PCM_ALAW:
415     case CODEC_ID_PCM_U8:
416     case CODEC_ID_PCM_S8:
417         rtp_send_samples(s1, pkt->data, size, 8 * st->codec->channels);
418         break;
419     case CODEC_ID_PCM_U16BE:
420     case CODEC_ID_PCM_U16LE:
421     case CODEC_ID_PCM_S16BE:
422     case CODEC_ID_PCM_S16LE:
423         rtp_send_samples(s1, pkt->data, size, 16 * st->codec->channels);
424         break;
425     case CODEC_ID_ADPCM_G722:
426         /* The actual sample size is half a byte per sample, but since the
427          * stream clock rate is 8000 Hz while the sample rate is 16000 Hz,
428          * the correct parameter for send_samples_bits is 8 bits per stream
429          * clock. */
430         rtp_send_samples(s1, pkt->data, size, 8 * st->codec->channels);
431         break;
432     case CODEC_ID_ADPCM_G726:
433         rtp_send_samples(s1, pkt->data, size,
434                          st->codec->bits_per_coded_sample * st->codec->channels);
435         break;
436     case CODEC_ID_MP2:
437     case CODEC_ID_MP3:
438         rtp_send_mpegaudio(s1, pkt->data, size);
439         break;
440     case CODEC_ID_MPEG1VIDEO:
441     case CODEC_ID_MPEG2VIDEO:
442         ff_rtp_send_mpegvideo(s1, pkt->data, size);
443         break;
444     case CODEC_ID_AAC:
445         if (s->flags & FF_RTP_FLAG_MP4A_LATM)
446             ff_rtp_send_latm(s1, pkt->data, size);
447         else
448             ff_rtp_send_aac(s1, pkt->data, size);
449         break;
450     case CODEC_ID_AMR_NB:
451     case CODEC_ID_AMR_WB:
452         ff_rtp_send_amr(s1, pkt->data, size);
453         break;
454     case CODEC_ID_MPEG2TS:
455         rtp_send_mpegts_raw(s1, pkt->data, size);
456         break;
457     case CODEC_ID_H264:
458         ff_rtp_send_h264(s1, pkt->data, size);
459         break;
460     case CODEC_ID_H263:
461         if (s->flags & FF_RTP_FLAG_RFC2190) {
462             int mb_info_size = 0;
463             const uint8_t *mb_info =
464                 av_packet_get_side_data(pkt, AV_PKT_DATA_H263_MB_INFO,
465                                         &mb_info_size);
466             ff_rtp_send_h263_rfc2190(s1, pkt->data, size, mb_info, mb_info_size);
467             break;
468         }
469         /* Fallthrough */
470     case CODEC_ID_H263P:
471         ff_rtp_send_h263(s1, pkt->data, size);
472         break;
473     case CODEC_ID_VORBIS:
474     case CODEC_ID_THEORA:
475         ff_rtp_send_xiph(s1, pkt->data, size);
476         break;
477     case CODEC_ID_VP8:
478         ff_rtp_send_vp8(s1, pkt->data, size);
479         break;
480     default:
481         /* better than nothing : send the codec raw data */
482         rtp_send_raw(s1, pkt->data, size);
483         break;
484     }
485     return 0;
486 }
487
488 static int rtp_write_trailer(AVFormatContext *s1)
489 {
490     RTPMuxContext *s = s1->priv_data;
491
492     av_freep(&s->buf);
493
494     return 0;
495 }
496
497 AVOutputFormat ff_rtp_muxer = {
498     .name              = "rtp",
499     .long_name         = NULL_IF_CONFIG_SMALL("RTP output format"),
500     .priv_data_size    = sizeof(RTPMuxContext),
501     .audio_codec       = CODEC_ID_PCM_MULAW,
502     .video_codec       = CODEC_ID_MPEG4,
503     .write_header      = rtp_write_header,
504     .write_packet      = rtp_write_packet,
505     .write_trailer     = rtp_write_trailer,
506     .priv_class        = &rtp_muxer_class,
507 };