]> git.sesse.net Git - ffmpeg/blob - libavformat/rtpenc.c
override mov fourcc for pcm audio, this is safer when stream copying
[ffmpeg] / libavformat / rtpenc.c
1 /*
2  * RTP output format
3  * Copyright (c) 2002 Fabrice Bellard
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavcodec/bitstream.h"
23 #include "avformat.h"
24 #include "mpegts.h"
25
26 #include <unistd.h>
27 #include "network.h"
28
29 #include "rtpenc.h"
30
31 //#define DEBUG
32
33 #define RTCP_SR_SIZE 28
34 #define NTP_OFFSET 2208988800ULL
35 #define NTP_OFFSET_US (NTP_OFFSET * 1000000ULL)
36
37 static uint64_t ntp_time(void)
38 {
39   return (av_gettime() / 1000) * 1000 + NTP_OFFSET_US;
40 }
41
42 static int is_supported(enum CodecID id)
43 {
44     switch(id) {
45     case CODEC_ID_H263:
46     case CODEC_ID_H263P:
47     case CODEC_ID_H264:
48     case CODEC_ID_MPEG1VIDEO:
49     case CODEC_ID_MPEG2VIDEO:
50     case CODEC_ID_MPEG4:
51     case CODEC_ID_AAC:
52     case CODEC_ID_MP2:
53     case CODEC_ID_MP3:
54     case CODEC_ID_PCM_ALAW:
55     case CODEC_ID_PCM_MULAW:
56     case CODEC_ID_PCM_S8:
57     case CODEC_ID_PCM_S16BE:
58     case CODEC_ID_PCM_S16LE:
59     case CODEC_ID_PCM_U16BE:
60     case CODEC_ID_PCM_U16LE:
61     case CODEC_ID_PCM_U8:
62     case CODEC_ID_MPEG2TS:
63         return 1;
64     default:
65         return 0;
66     }
67 }
68
69 static int rtp_write_header(AVFormatContext *s1)
70 {
71     RTPMuxContext *s = s1->priv_data;
72     int payload_type, max_packet_size, n;
73     AVStream *st;
74
75     if (s1->nb_streams != 1)
76         return -1;
77     st = s1->streams[0];
78     if (!is_supported(st->codec->codec_id)) {
79         av_log(s1, AV_LOG_ERROR, "Unsupported codec %x\n", st->codec->codec_id);
80
81         return -1;
82     }
83
84     payload_type = ff_rtp_get_payload_type(st->codec);
85     if (payload_type < 0)
86         payload_type = RTP_PT_PRIVATE; /* private payload type */
87     s->payload_type = payload_type;
88
89 // following 2 FIXMEs could be set based on the current time, there is normally no info leak, as RTP will likely be transmitted immediately
90     s->base_timestamp = 0; /* FIXME: was random(), what should this be? */
91     s->timestamp = s->base_timestamp;
92     s->cur_timestamp = 0;
93     s->ssrc = 0; /* FIXME: was random(), what should this be? */
94     s->first_packet = 1;
95     s->first_rtcp_ntp_time = AV_NOPTS_VALUE;
96
97     max_packet_size = url_fget_max_packet_size(s1->pb);
98     if (max_packet_size <= 12)
99         return AVERROR(EIO);
100     s->buf = av_malloc(max_packet_size);
101     if (s->buf == NULL) {
102         return AVERROR(ENOMEM);
103     }
104     s->max_payload_size = max_packet_size - 12;
105
106     s->max_frames_per_packet = 0;
107     if (s1->max_delay) {
108         if (st->codec->codec_type == CODEC_TYPE_AUDIO) {
109             if (st->codec->frame_size == 0) {
110                 av_log(s1, AV_LOG_ERROR, "Cannot respect max delay: frame size = 0\n");
111             } else {
112                 s->max_frames_per_packet = av_rescale_rnd(s1->max_delay, st->codec->sample_rate, AV_TIME_BASE * st->codec->frame_size, AV_ROUND_DOWN);
113             }
114         }
115         if (st->codec->codec_type == CODEC_TYPE_VIDEO) {
116             /* FIXME: We should round down here... */
117             s->max_frames_per_packet = av_rescale_q(s1->max_delay, (AVRational){1, 1000000}, st->codec->time_base);
118         }
119     }
120
121     av_set_pts_info(st, 32, 1, 90000);
122     switch(st->codec->codec_id) {
123     case CODEC_ID_MP2:
124     case CODEC_ID_MP3:
125         s->buf_ptr = s->buf + 4;
126         break;
127     case CODEC_ID_MPEG1VIDEO:
128     case CODEC_ID_MPEG2VIDEO:
129         break;
130     case CODEC_ID_MPEG2TS:
131         n = s->max_payload_size / TS_PACKET_SIZE;
132         if (n < 1)
133             n = 1;
134         s->max_payload_size = n * TS_PACKET_SIZE;
135         s->buf_ptr = s->buf;
136         break;
137     case CODEC_ID_AAC:
138         s->num_frames = 0;
139     default:
140         if (st->codec->codec_type == CODEC_TYPE_AUDIO) {
141             av_set_pts_info(st, 32, 1, st->codec->sample_rate);
142         }
143         s->buf_ptr = s->buf;
144         break;
145     }
146
147     return 0;
148 }
149
150 /* send an rtcp sender report packet */
151 static void rtcp_send_sr(AVFormatContext *s1, int64_t ntp_time)
152 {
153     RTPMuxContext *s = s1->priv_data;
154     uint32_t rtp_ts;
155
156     dprintf(s1, "RTCP: %02x %"PRIx64" %x\n", s->payload_type, ntp_time, s->timestamp);
157
158     if (s->first_rtcp_ntp_time == AV_NOPTS_VALUE) s->first_rtcp_ntp_time = ntp_time;
159     s->last_rtcp_ntp_time = ntp_time;
160     rtp_ts = av_rescale_q(ntp_time - s->first_rtcp_ntp_time, (AVRational){1, 1000000},
161                           s1->streams[0]->time_base) + s->base_timestamp;
162     put_byte(s1->pb, (RTP_VERSION << 6));
163     put_byte(s1->pb, 200);
164     put_be16(s1->pb, 6); /* length in words - 1 */
165     put_be32(s1->pb, s->ssrc);
166     put_be32(s1->pb, ntp_time / 1000000);
167     put_be32(s1->pb, ((ntp_time % 1000000) << 32) / 1000000);
168     put_be32(s1->pb, rtp_ts);
169     put_be32(s1->pb, s->packet_count);
170     put_be32(s1->pb, s->octet_count);
171     put_flush_packet(s1->pb);
172 }
173
174 /* send an rtp packet. sequence number is incremented, but the caller
175    must update the timestamp itself */
176 void ff_rtp_send_data(AVFormatContext *s1, const uint8_t *buf1, int len, int m)
177 {
178     RTPMuxContext *s = s1->priv_data;
179
180     dprintf(s1, "rtp_send_data size=%d\n", len);
181
182     /* build the RTP header */
183     put_byte(s1->pb, (RTP_VERSION << 6));
184     put_byte(s1->pb, (s->payload_type & 0x7f) | ((m & 0x01) << 7));
185     put_be16(s1->pb, s->seq);
186     put_be32(s1->pb, s->timestamp);
187     put_be32(s1->pb, s->ssrc);
188
189     put_buffer(s1->pb, buf1, len);
190     put_flush_packet(s1->pb);
191
192     s->seq++;
193     s->octet_count += len;
194     s->packet_count++;
195 }
196
197 /* send an integer number of samples and compute time stamp and fill
198    the rtp send buffer before sending. */
199 static void rtp_send_samples(AVFormatContext *s1,
200                              const uint8_t *buf1, int size, int sample_size)
201 {
202     RTPMuxContext *s = s1->priv_data;
203     int len, max_packet_size, n;
204
205     max_packet_size = (s->max_payload_size / sample_size) * sample_size;
206     /* not needed, but who nows */
207     if ((size % sample_size) != 0)
208         av_abort();
209     n = 0;
210     while (size > 0) {
211         s->buf_ptr = s->buf;
212         len = FFMIN(max_packet_size, size);
213
214         /* copy data */
215         memcpy(s->buf_ptr, buf1, len);
216         s->buf_ptr += len;
217         buf1 += len;
218         size -= len;
219         s->timestamp = s->cur_timestamp + n / sample_size;
220         ff_rtp_send_data(s1, s->buf, s->buf_ptr - s->buf, 0);
221         n += (s->buf_ptr - s->buf);
222     }
223 }
224
225 /* NOTE: we suppose that exactly one frame is given as argument here */
226 /* XXX: test it */
227 static void rtp_send_mpegaudio(AVFormatContext *s1,
228                                const uint8_t *buf1, int size)
229 {
230     RTPMuxContext *s = s1->priv_data;
231     int len, count, max_packet_size;
232
233     max_packet_size = s->max_payload_size;
234
235     /* test if we must flush because not enough space */
236     len = (s->buf_ptr - s->buf);
237     if ((len + size) > max_packet_size) {
238         if (len > 4) {
239             ff_rtp_send_data(s1, s->buf, s->buf_ptr - s->buf, 0);
240             s->buf_ptr = s->buf + 4;
241         }
242     }
243     if (s->buf_ptr == s->buf + 4) {
244         s->timestamp = s->cur_timestamp;
245     }
246
247     /* add the packet */
248     if (size > max_packet_size) {
249         /* big packet: fragment */
250         count = 0;
251         while (size > 0) {
252             len = max_packet_size - 4;
253             if (len > size)
254                 len = size;
255             /* build fragmented packet */
256             s->buf[0] = 0;
257             s->buf[1] = 0;
258             s->buf[2] = count >> 8;
259             s->buf[3] = count;
260             memcpy(s->buf + 4, buf1, len);
261             ff_rtp_send_data(s1, s->buf, len + 4, 0);
262             size -= len;
263             buf1 += len;
264             count += len;
265         }
266     } else {
267         if (s->buf_ptr == s->buf + 4) {
268             /* no fragmentation possible */
269             s->buf[0] = 0;
270             s->buf[1] = 0;
271             s->buf[2] = 0;
272             s->buf[3] = 0;
273         }
274         memcpy(s->buf_ptr, buf1, size);
275         s->buf_ptr += size;
276     }
277 }
278
279 static void rtp_send_raw(AVFormatContext *s1,
280                          const uint8_t *buf1, int size)
281 {
282     RTPMuxContext *s = s1->priv_data;
283     int len, max_packet_size;
284
285     max_packet_size = s->max_payload_size;
286
287     while (size > 0) {
288         len = max_packet_size;
289         if (len > size)
290             len = size;
291
292         s->timestamp = s->cur_timestamp;
293         ff_rtp_send_data(s1, buf1, len, (len == size));
294
295         buf1 += len;
296         size -= len;
297     }
298 }
299
300 /* NOTE: size is assumed to be an integer multiple of TS_PACKET_SIZE */
301 static void rtp_send_mpegts_raw(AVFormatContext *s1,
302                                 const uint8_t *buf1, int size)
303 {
304     RTPMuxContext *s = s1->priv_data;
305     int len, out_len;
306
307     while (size >= TS_PACKET_SIZE) {
308         len = s->max_payload_size - (s->buf_ptr - s->buf);
309         if (len > size)
310             len = size;
311         memcpy(s->buf_ptr, buf1, len);
312         buf1 += len;
313         size -= len;
314         s->buf_ptr += len;
315
316         out_len = s->buf_ptr - s->buf;
317         if (out_len >= s->max_payload_size) {
318             ff_rtp_send_data(s1, s->buf, out_len, 0);
319             s->buf_ptr = s->buf;
320         }
321     }
322 }
323
324 /* write an RTP packet. 'buf1' must contain a single specific frame. */
325 static int rtp_write_packet(AVFormatContext *s1, AVPacket *pkt)
326 {
327     RTPMuxContext *s = s1->priv_data;
328     AVStream *st = s1->streams[0];
329     int rtcp_bytes;
330     int size= pkt->size;
331     uint8_t *buf1= pkt->data;
332
333     dprintf(s1, "%d: write len=%d\n", pkt->stream_index, size);
334
335     rtcp_bytes = ((s->octet_count - s->last_octet_count) * RTCP_TX_RATIO_NUM) /
336         RTCP_TX_RATIO_DEN;
337     if (s->first_packet || ((rtcp_bytes >= RTCP_SR_SIZE) &&
338                            (ntp_time() - s->last_rtcp_ntp_time > 5000000))) {
339         rtcp_send_sr(s1, ntp_time());
340         s->last_octet_count = s->octet_count;
341         s->first_packet = 0;
342     }
343     s->cur_timestamp = s->base_timestamp + pkt->pts;
344
345     switch(st->codec->codec_id) {
346     case CODEC_ID_PCM_MULAW:
347     case CODEC_ID_PCM_ALAW:
348     case CODEC_ID_PCM_U8:
349     case CODEC_ID_PCM_S8:
350         rtp_send_samples(s1, buf1, size, 1 * st->codec->channels);
351         break;
352     case CODEC_ID_PCM_U16BE:
353     case CODEC_ID_PCM_U16LE:
354     case CODEC_ID_PCM_S16BE:
355     case CODEC_ID_PCM_S16LE:
356         rtp_send_samples(s1, buf1, size, 2 * st->codec->channels);
357         break;
358     case CODEC_ID_MP2:
359     case CODEC_ID_MP3:
360         rtp_send_mpegaudio(s1, buf1, size);
361         break;
362     case CODEC_ID_MPEG1VIDEO:
363     case CODEC_ID_MPEG2VIDEO:
364         ff_rtp_send_mpegvideo(s1, buf1, size);
365         break;
366     case CODEC_ID_AAC:
367         ff_rtp_send_aac(s1, buf1, size);
368         break;
369     case CODEC_ID_MPEG2TS:
370         rtp_send_mpegts_raw(s1, buf1, size);
371         break;
372     case CODEC_ID_H264:
373         ff_rtp_send_h264(s1, buf1, size);
374         break;
375     case CODEC_ID_H263:
376     case CODEC_ID_H263P:
377         ff_rtp_send_h263(s1, buf1, size);
378         break;
379     default:
380         /* better than nothing : send the codec raw data */
381         rtp_send_raw(s1, buf1, size);
382         break;
383     }
384     return 0;
385 }
386
387 static int rtp_write_trailer(AVFormatContext *s1)
388 {
389     RTPMuxContext *s = s1->priv_data;
390
391     av_freep(&s->buf);
392
393     return 0;
394 }
395
396 AVOutputFormat rtp_muxer = {
397     "rtp",
398     NULL_IF_CONFIG_SMALL("RTP output format"),
399     NULL,
400     NULL,
401     sizeof(RTPMuxContext),
402     CODEC_ID_PCM_MULAW,
403     CODEC_ID_NONE,
404     rtp_write_header,
405     rtp_write_packet,
406     rtp_write_trailer,
407 };