]> git.sesse.net Git - ffmpeg/blob - libavfilter/vf_v360.c
avfilter/vf_v360: simplify xyz_to_ball() calculations
[ffmpeg] / libavfilter / vf_v360.c
1 /*
2  * Copyright (c) 2019 Eugene Lyapustin
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 /**
22  * @file
23  * 360 video conversion filter.
24  * Principle of operation:
25  *
26  * (for each pixel in output frame)
27  * 1) Calculate OpenGL-like coordinates (x, y, z) for pixel position (i, j)
28  * 2) Apply 360 operations (rotation, mirror) to (x, y, z)
29  * 3) Calculate pixel position (u, v) in input frame
30  * 4) Calculate interpolation window and weight for each pixel
31  *
32  * (for each frame)
33  * 5) Remap input frame to output frame using precalculated data
34  */
35
36 #include <math.h>
37
38 #include "libavutil/avassert.h"
39 #include "libavutil/imgutils.h"
40 #include "libavutil/pixdesc.h"
41 #include "libavutil/opt.h"
42 #include "avfilter.h"
43 #include "formats.h"
44 #include "internal.h"
45 #include "video.h"
46 #include "v360.h"
47
48 typedef struct ThreadData {
49     AVFrame *in;
50     AVFrame *out;
51 } ThreadData;
52
53 #define OFFSET(x) offsetof(V360Context, x)
54 #define FLAGS AV_OPT_FLAG_FILTERING_PARAM|AV_OPT_FLAG_VIDEO_PARAM
55
56 static const AVOption v360_options[] = {
57     {     "input", "set input projection",              OFFSET(in), AV_OPT_TYPE_INT,    {.i64=EQUIRECTANGULAR}, 0,    NB_PROJECTIONS-1, FLAGS, "in" },
58     {         "e", "equirectangular",                            0, AV_OPT_TYPE_CONST,  {.i64=EQUIRECTANGULAR}, 0,                   0, FLAGS, "in" },
59     {  "equirect", "equirectangular",                            0, AV_OPT_TYPE_CONST,  {.i64=EQUIRECTANGULAR}, 0,                   0, FLAGS, "in" },
60     {      "c3x2", "cubemap 3x2",                                0, AV_OPT_TYPE_CONST,  {.i64=CUBEMAP_3_2},     0,                   0, FLAGS, "in" },
61     {      "c6x1", "cubemap 6x1",                                0, AV_OPT_TYPE_CONST,  {.i64=CUBEMAP_6_1},     0,                   0, FLAGS, "in" },
62     {       "eac", "equi-angular cubemap",                       0, AV_OPT_TYPE_CONST,  {.i64=EQUIANGULAR},     0,                   0, FLAGS, "in" },
63     {  "dfisheye", "dual fisheye",                               0, AV_OPT_TYPE_CONST,  {.i64=DUAL_FISHEYE},    0,                   0, FLAGS, "in" },
64     {    "barrel", "barrel facebook's 360 format",               0, AV_OPT_TYPE_CONST,  {.i64=BARREL},          0,                   0, FLAGS, "in" },
65     {        "fb", "barrel facebook's 360 format",               0, AV_OPT_TYPE_CONST,  {.i64=BARREL},          0,                   0, FLAGS, "in" },
66     {      "c1x6", "cubemap 1x6",                                0, AV_OPT_TYPE_CONST,  {.i64=CUBEMAP_1_6},     0,                   0, FLAGS, "in" },
67     {        "sg", "stereographic",                              0, AV_OPT_TYPE_CONST,  {.i64=STEREOGRAPHIC},   0,                   0, FLAGS, "in" },
68     {  "mercator", "mercator",                                   0, AV_OPT_TYPE_CONST,  {.i64=MERCATOR},        0,                   0, FLAGS, "in" },
69     {      "ball", "ball",                                       0, AV_OPT_TYPE_CONST,  {.i64=BALL},            0,                   0, FLAGS, "in" },
70     {    "hammer", "hammer",                                     0, AV_OPT_TYPE_CONST,  {.i64=HAMMER},          0,                   0, FLAGS, "in" },
71     {    "output", "set output projection",            OFFSET(out), AV_OPT_TYPE_INT,    {.i64=CUBEMAP_3_2},     0,    NB_PROJECTIONS-1, FLAGS, "out" },
72     {         "e", "equirectangular",                            0, AV_OPT_TYPE_CONST,  {.i64=EQUIRECTANGULAR}, 0,                   0, FLAGS, "out" },
73     {  "equirect", "equirectangular",                            0, AV_OPT_TYPE_CONST,  {.i64=EQUIRECTANGULAR}, 0,                   0, FLAGS, "out" },
74     {      "c3x2", "cubemap 3x2",                                0, AV_OPT_TYPE_CONST,  {.i64=CUBEMAP_3_2},     0,                   0, FLAGS, "out" },
75     {      "c6x1", "cubemap 6x1",                                0, AV_OPT_TYPE_CONST,  {.i64=CUBEMAP_6_1},     0,                   0, FLAGS, "out" },
76     {       "eac", "equi-angular cubemap",                       0, AV_OPT_TYPE_CONST,  {.i64=EQUIANGULAR},     0,                   0, FLAGS, "out" },
77     {  "dfisheye", "dual fisheye",                               0, AV_OPT_TYPE_CONST,  {.i64=DUAL_FISHEYE},    0,                   0, FLAGS, "out" },
78     {      "flat", "regular video",                              0, AV_OPT_TYPE_CONST,  {.i64=FLAT},            0,                   0, FLAGS, "out" },
79     {"rectilinear", "regular video",                             0, AV_OPT_TYPE_CONST,  {.i64=FLAT},            0,                   0, FLAGS, "out" },
80     {  "gnomonic", "regular video",                              0, AV_OPT_TYPE_CONST,  {.i64=FLAT},            0,                   0, FLAGS, "out" },
81     {    "barrel", "barrel facebook's 360 format",               0, AV_OPT_TYPE_CONST,  {.i64=BARREL},          0,                   0, FLAGS, "out" },
82     {        "fb", "barrel facebook's 360 format",               0, AV_OPT_TYPE_CONST,  {.i64=BARREL},          0,                   0, FLAGS, "out" },
83     {      "c1x6", "cubemap 1x6",                                0, AV_OPT_TYPE_CONST,  {.i64=CUBEMAP_1_6},     0,                   0, FLAGS, "out" },
84     {        "sg", "stereographic",                              0, AV_OPT_TYPE_CONST,  {.i64=STEREOGRAPHIC},   0,                   0, FLAGS, "out" },
85     {  "mercator", "mercator",                                   0, AV_OPT_TYPE_CONST,  {.i64=MERCATOR},        0,                   0, FLAGS, "out" },
86     {      "ball", "ball",                                       0, AV_OPT_TYPE_CONST,  {.i64=BALL},            0,                   0, FLAGS, "out" },
87     {    "hammer", "hammer",                                     0, AV_OPT_TYPE_CONST,  {.i64=HAMMER},          0,                   0, FLAGS, "out" },
88     {    "interp", "set interpolation method",      OFFSET(interp), AV_OPT_TYPE_INT,    {.i64=BILINEAR},        0, NB_INTERP_METHODS-1, FLAGS, "interp" },
89     {      "near", "nearest neighbour",                          0, AV_OPT_TYPE_CONST,  {.i64=NEAREST},         0,                   0, FLAGS, "interp" },
90     {   "nearest", "nearest neighbour",                          0, AV_OPT_TYPE_CONST,  {.i64=NEAREST},         0,                   0, FLAGS, "interp" },
91     {      "line", "bilinear interpolation",                     0, AV_OPT_TYPE_CONST,  {.i64=BILINEAR},        0,                   0, FLAGS, "interp" },
92     {    "linear", "bilinear interpolation",                     0, AV_OPT_TYPE_CONST,  {.i64=BILINEAR},        0,                   0, FLAGS, "interp" },
93     {      "cube", "bicubic interpolation",                      0, AV_OPT_TYPE_CONST,  {.i64=BICUBIC},         0,                   0, FLAGS, "interp" },
94     {     "cubic", "bicubic interpolation",                      0, AV_OPT_TYPE_CONST,  {.i64=BICUBIC},         0,                   0, FLAGS, "interp" },
95     {      "lanc", "lanczos interpolation",                      0, AV_OPT_TYPE_CONST,  {.i64=LANCZOS},         0,                   0, FLAGS, "interp" },
96     {   "lanczos", "lanczos interpolation",                      0, AV_OPT_TYPE_CONST,  {.i64=LANCZOS},         0,                   0, FLAGS, "interp" },
97     {         "w", "output width",                   OFFSET(width), AV_OPT_TYPE_INT,    {.i64=0},               0,           INT16_MAX, FLAGS, "w"},
98     {         "h", "output height",                 OFFSET(height), AV_OPT_TYPE_INT,    {.i64=0},               0,           INT16_MAX, FLAGS, "h"},
99     { "in_stereo", "input stereo format",        OFFSET(in_stereo), AV_OPT_TYPE_INT,    {.i64=STEREO_2D},       0,    NB_STEREO_FMTS-1, FLAGS, "stereo" },
100     {"out_stereo", "output stereo format",      OFFSET(out_stereo), AV_OPT_TYPE_INT,    {.i64=STEREO_2D},       0,    NB_STEREO_FMTS-1, FLAGS, "stereo" },
101     {        "2d", "2d mono",                                    0, AV_OPT_TYPE_CONST,  {.i64=STEREO_2D},       0,                   0, FLAGS, "stereo" },
102     {       "sbs", "side by side",                               0, AV_OPT_TYPE_CONST,  {.i64=STEREO_SBS},      0,                   0, FLAGS, "stereo" },
103     {        "tb", "top bottom",                                 0, AV_OPT_TYPE_CONST,  {.i64=STEREO_TB},       0,                   0, FLAGS, "stereo" },
104     { "in_forder", "input cubemap face order",   OFFSET(in_forder), AV_OPT_TYPE_STRING, {.str="rludfb"},        0,     NB_DIRECTIONS-1, FLAGS, "in_forder"},
105     {"out_forder", "output cubemap face order", OFFSET(out_forder), AV_OPT_TYPE_STRING, {.str="rludfb"},        0,     NB_DIRECTIONS-1, FLAGS, "out_forder"},
106     {   "in_frot", "input cubemap face rotation",  OFFSET(in_frot), AV_OPT_TYPE_STRING, {.str="000000"},        0,     NB_DIRECTIONS-1, FLAGS, "in_frot"},
107     {  "out_frot", "output cubemap face rotation",OFFSET(out_frot), AV_OPT_TYPE_STRING, {.str="000000"},        0,     NB_DIRECTIONS-1, FLAGS, "out_frot"},
108     {    "in_pad", "input cubemap pads",            OFFSET(in_pad), AV_OPT_TYPE_FLOAT,  {.dbl=0.f},           0.f,                 1.f, FLAGS, "in_pad"},
109     {   "out_pad", "output cubemap pads",          OFFSET(out_pad), AV_OPT_TYPE_FLOAT,  {.dbl=0.f},           0.f,                 1.f, FLAGS, "out_pad"},
110     {       "yaw", "yaw rotation",                     OFFSET(yaw), AV_OPT_TYPE_FLOAT,  {.dbl=0.f},        -180.f,               180.f, FLAGS, "yaw"},
111     {     "pitch", "pitch rotation",                 OFFSET(pitch), AV_OPT_TYPE_FLOAT,  {.dbl=0.f},        -180.f,               180.f, FLAGS, "pitch"},
112     {      "roll", "roll rotation",                   OFFSET(roll), AV_OPT_TYPE_FLOAT,  {.dbl=0.f},        -180.f,               180.f, FLAGS, "roll"},
113     {    "rorder", "rotation order",                OFFSET(rorder), AV_OPT_TYPE_STRING, {.str="ypr"},           0,                   0, FLAGS, "rorder"},
114     {     "h_fov", "horizontal field of view",       OFFSET(h_fov), AV_OPT_TYPE_FLOAT,  {.dbl=90.f},     0.00001f,               360.f, FLAGS, "h_fov"},
115     {     "v_fov", "vertical field of view",         OFFSET(v_fov), AV_OPT_TYPE_FLOAT,  {.dbl=45.f},     0.00001f,               360.f, FLAGS, "v_fov"},
116     {     "d_fov", "diagonal field of view",         OFFSET(d_fov), AV_OPT_TYPE_FLOAT,  {.dbl=0.f},           0.f,               360.f, FLAGS, "d_fov"},
117     {    "h_flip", "flip out video horizontally",   OFFSET(h_flip), AV_OPT_TYPE_BOOL,   {.i64=0},               0,                   1, FLAGS, "h_flip"},
118     {    "v_flip", "flip out video vertically",     OFFSET(v_flip), AV_OPT_TYPE_BOOL,   {.i64=0},               0,                   1, FLAGS, "v_flip"},
119     {    "d_flip", "flip out video indepth",        OFFSET(d_flip), AV_OPT_TYPE_BOOL,   {.i64=0},               0,                   1, FLAGS, "d_flip"},
120     {   "ih_flip", "flip in video horizontally",   OFFSET(ih_flip), AV_OPT_TYPE_BOOL,   {.i64=0},               0,                   1, FLAGS, "ih_flip"},
121     {   "iv_flip", "flip in video vertically",     OFFSET(iv_flip), AV_OPT_TYPE_BOOL,   {.i64=0},               0,                   1, FLAGS, "iv_flip"},
122     {  "in_trans", "transpose video input",   OFFSET(in_transpose), AV_OPT_TYPE_BOOL,   {.i64=0},               0,                   1, FLAGS, "in_transpose"},
123     { "out_trans", "transpose video output", OFFSET(out_transpose), AV_OPT_TYPE_BOOL,   {.i64=0},               0,                   1, FLAGS, "out_transpose"},
124     { NULL }
125 };
126
127 AVFILTER_DEFINE_CLASS(v360);
128
129 static int query_formats(AVFilterContext *ctx)
130 {
131     static const enum AVPixelFormat pix_fmts[] = {
132         // YUVA444
133         AV_PIX_FMT_YUVA444P,   AV_PIX_FMT_YUVA444P9,
134         AV_PIX_FMT_YUVA444P10, AV_PIX_FMT_YUVA444P12,
135         AV_PIX_FMT_YUVA444P16,
136
137         // YUVA422
138         AV_PIX_FMT_YUVA422P,   AV_PIX_FMT_YUVA422P9,
139         AV_PIX_FMT_YUVA422P10, AV_PIX_FMT_YUVA422P12,
140         AV_PIX_FMT_YUVA422P16,
141
142         // YUVA420
143         AV_PIX_FMT_YUVA420P,   AV_PIX_FMT_YUVA420P9,
144         AV_PIX_FMT_YUVA420P10, AV_PIX_FMT_YUVA420P16,
145
146         // YUVJ
147         AV_PIX_FMT_YUVJ444P, AV_PIX_FMT_YUVJ440P,
148         AV_PIX_FMT_YUVJ422P, AV_PIX_FMT_YUVJ420P,
149         AV_PIX_FMT_YUVJ411P,
150
151         // YUV444
152         AV_PIX_FMT_YUV444P,   AV_PIX_FMT_YUV444P9,
153         AV_PIX_FMT_YUV444P10, AV_PIX_FMT_YUV444P12,
154         AV_PIX_FMT_YUV444P14, AV_PIX_FMT_YUV444P16,
155
156         // YUV440
157         AV_PIX_FMT_YUV440P, AV_PIX_FMT_YUV440P10,
158         AV_PIX_FMT_YUV440P12,
159
160         // YUV422
161         AV_PIX_FMT_YUV422P,   AV_PIX_FMT_YUV422P9,
162         AV_PIX_FMT_YUV422P10, AV_PIX_FMT_YUV422P12,
163         AV_PIX_FMT_YUV422P14, AV_PIX_FMT_YUV422P16,
164
165         // YUV420
166         AV_PIX_FMT_YUV420P,   AV_PIX_FMT_YUV420P9,
167         AV_PIX_FMT_YUV420P10, AV_PIX_FMT_YUV420P12,
168         AV_PIX_FMT_YUV420P14, AV_PIX_FMT_YUV420P16,
169
170         // YUV411
171         AV_PIX_FMT_YUV411P,
172
173         // YUV410
174         AV_PIX_FMT_YUV410P,
175
176         // GBR
177         AV_PIX_FMT_GBRP,   AV_PIX_FMT_GBRP9,
178         AV_PIX_FMT_GBRP10, AV_PIX_FMT_GBRP12,
179         AV_PIX_FMT_GBRP14, AV_PIX_FMT_GBRP16,
180
181         // GBRA
182         AV_PIX_FMT_GBRAP,   AV_PIX_FMT_GBRAP10,
183         AV_PIX_FMT_GBRAP12, AV_PIX_FMT_GBRAP16,
184
185         // GRAY
186         AV_PIX_FMT_GRAY8,  AV_PIX_FMT_GRAY9,
187         AV_PIX_FMT_GRAY10, AV_PIX_FMT_GRAY12,
188         AV_PIX_FMT_GRAY14, AV_PIX_FMT_GRAY16,
189
190         AV_PIX_FMT_NONE
191     };
192
193     AVFilterFormats *fmts_list = ff_make_format_list(pix_fmts);
194     if (!fmts_list)
195         return AVERROR(ENOMEM);
196     return ff_set_common_formats(ctx, fmts_list);
197 }
198
199 #define DEFINE_REMAP1_LINE(bits, div)                                                           \
200 static void remap1_##bits##bit_line_c(uint8_t *dst, int width, const uint8_t *src,              \
201                                       ptrdiff_t in_linesize,                                    \
202                                       const uint16_t *u, const uint16_t *v, const int16_t *ker) \
203 {                                                                                               \
204     const uint##bits##_t *s = (const uint##bits##_t *)src;                                      \
205     uint##bits##_t *d = (uint##bits##_t *)dst;                                                  \
206                                                                                                 \
207     in_linesize /= div;                                                                         \
208                                                                                                 \
209     for (int x = 0; x < width; x++)                                                             \
210         d[x] = s[v[x] * in_linesize + u[x]];                                                    \
211 }
212
213 DEFINE_REMAP1_LINE( 8, 1)
214 DEFINE_REMAP1_LINE(16, 2)
215
216 /**
217  * Generate remapping function with a given window size and pixel depth.
218  *
219  * @param ws size of interpolation window
220  * @param bits number of bits per pixel
221  */
222 #define DEFINE_REMAP(ws, bits)                                                                             \
223 static int remap##ws##_##bits##bit_slice(AVFilterContext *ctx, void *arg, int jobnr, int nb_jobs)          \
224 {                                                                                                          \
225     ThreadData *td = (ThreadData*)arg;                                                                     \
226     const V360Context *s = ctx->priv;                                                                      \
227     const AVFrame *in = td->in;                                                                            \
228     AVFrame *out = td->out;                                                                                \
229                                                                                                            \
230     for (int stereo = 0; stereo < 1 + s->out_stereo > STEREO_2D; stereo++) {                               \
231         for (int plane = 0; plane < s->nb_planes; plane++) {                                               \
232             const int in_linesize  = in->linesize[plane];                                                  \
233             const int out_linesize = out->linesize[plane];                                                 \
234             const int uv_linesize = s->uv_linesize[plane];                                                 \
235             const int in_offset_w = stereo ? s->in_offset_w[plane] : 0;                                    \
236             const int in_offset_h = stereo ? s->in_offset_h[plane] : 0;                                    \
237             const int out_offset_w = stereo ? s->out_offset_w[plane] : 0;                                  \
238             const int out_offset_h = stereo ? s->out_offset_h[plane] : 0;                                  \
239             const uint8_t *src = in->data[plane] + in_offset_h * in_linesize + in_offset_w * (bits >> 3);  \
240             uint8_t *dst = out->data[plane] + out_offset_h * out_linesize + out_offset_w * (bits >> 3);    \
241             const int width = s->pr_width[plane];                                                          \
242             const int height = s->pr_height[plane];                                                        \
243                                                                                                            \
244             const int slice_start = (height *  jobnr     ) / nb_jobs;                                      \
245             const int slice_end   = (height * (jobnr + 1)) / nb_jobs;                                      \
246                                                                                                            \
247             for (int y = slice_start; y < slice_end; y++) {                                                \
248                 const unsigned map = s->map[plane];                                                        \
249                 const uint16_t *u = s->u[map] + y * uv_linesize * ws * ws;                                 \
250                 const uint16_t *v = s->v[map] + y * uv_linesize * ws * ws;                                 \
251                 const int16_t *ker = s->ker[map] + y * uv_linesize * ws * ws;                              \
252                                                                                                            \
253                 s->remap_line(dst + y * out_linesize, width, src, in_linesize, u, v, ker);                 \
254             }                                                                                              \
255         }                                                                                                  \
256     }                                                                                                      \
257                                                                                                            \
258     return 0;                                                                                              \
259 }
260
261 DEFINE_REMAP(1,  8)
262 DEFINE_REMAP(2,  8)
263 DEFINE_REMAP(4,  8)
264 DEFINE_REMAP(1, 16)
265 DEFINE_REMAP(2, 16)
266 DEFINE_REMAP(4, 16)
267
268 #define DEFINE_REMAP_LINE(ws, bits, div)                                                                   \
269 static void remap##ws##_##bits##bit_line_c(uint8_t *dst, int width, const uint8_t *src,                    \
270                                            ptrdiff_t in_linesize,                                          \
271                                            const uint16_t *u, const uint16_t *v, const int16_t *ker)       \
272 {                                                                                                          \
273     const uint##bits##_t *s = (const uint##bits##_t *)src;                                                 \
274     uint##bits##_t *d = (uint##bits##_t *)dst;                                                             \
275                                                                                                            \
276     in_linesize /= div;                                                                                    \
277                                                                                                            \
278     for (int x = 0; x < width; x++) {                                                                      \
279         const uint16_t *uu = u + x * ws * ws;                                                              \
280         const uint16_t *vv = v + x * ws * ws;                                                              \
281         const int16_t *kker = ker + x * ws * ws;                                                           \
282         int tmp = 0;                                                                                       \
283                                                                                                            \
284         for (int i = 0; i < ws; i++) {                                                                     \
285             for (int j = 0; j < ws; j++) {                                                                 \
286                 tmp += kker[i * ws + j] * s[vv[i * ws + j] * in_linesize + uu[i * ws + j]];                \
287             }                                                                                              \
288         }                                                                                                  \
289                                                                                                            \
290         d[x] = av_clip_uint##bits(tmp >> 14);                                                              \
291     }                                                                                                      \
292 }
293
294 DEFINE_REMAP_LINE(2,  8, 1)
295 DEFINE_REMAP_LINE(4,  8, 1)
296 DEFINE_REMAP_LINE(2, 16, 2)
297 DEFINE_REMAP_LINE(4, 16, 2)
298
299 void ff_v360_init(V360Context *s, int depth)
300 {
301     switch (s->interp) {
302     case NEAREST:
303         s->remap_line = depth <= 8 ? remap1_8bit_line_c : remap1_16bit_line_c;
304         break;
305     case BILINEAR:
306         s->remap_line = depth <= 8 ? remap2_8bit_line_c : remap2_16bit_line_c;
307         break;
308     case BICUBIC:
309     case LANCZOS:
310         s->remap_line = depth <= 8 ? remap4_8bit_line_c : remap4_16bit_line_c;
311         break;
312     }
313
314     if (ARCH_X86)
315         ff_v360_init_x86(s, depth);
316 }
317
318 /**
319  * Save nearest pixel coordinates for remapping.
320  *
321  * @param du horizontal relative coordinate
322  * @param dv vertical relative coordinate
323  * @param rmap calculated 4x4 window
324  * @param u u remap data
325  * @param v v remap data
326  * @param ker ker remap data
327  */
328 static void nearest_kernel(float du, float dv, const XYRemap *rmap,
329                            uint16_t *u, uint16_t *v, int16_t *ker)
330 {
331     const int i = roundf(dv) + 1;
332     const int j = roundf(du) + 1;
333
334     u[0] = rmap->u[i][j];
335     v[0] = rmap->v[i][j];
336 }
337
338 /**
339  * Calculate kernel for bilinear interpolation.
340  *
341  * @param du horizontal relative coordinate
342  * @param dv vertical relative coordinate
343  * @param rmap calculated 4x4 window
344  * @param u u remap data
345  * @param v v remap data
346  * @param ker ker remap data
347  */
348 static void bilinear_kernel(float du, float dv, const XYRemap *rmap,
349                             uint16_t *u, uint16_t *v, int16_t *ker)
350 {
351     for (int i = 0; i < 2; i++) {
352         for (int j = 0; j < 2; j++) {
353             u[i * 2 + j] = rmap->u[i + 1][j + 1];
354             v[i * 2 + j] = rmap->v[i + 1][j + 1];
355         }
356     }
357
358     ker[0] = lrintf((1.f - du) * (1.f - dv) * 16385.f);
359     ker[1] = lrintf(       du  * (1.f - dv) * 16385.f);
360     ker[2] = lrintf((1.f - du) *        dv  * 16385.f);
361     ker[3] = lrintf(       du  *        dv  * 16385.f);
362 }
363
364 /**
365  * Calculate 1-dimensional cubic coefficients.
366  *
367  * @param t relative coordinate
368  * @param coeffs coefficients
369  */
370 static inline void calculate_bicubic_coeffs(float t, float *coeffs)
371 {
372     const float tt  = t * t;
373     const float ttt = t * t * t;
374
375     coeffs[0] =     - t / 3.f + tt / 2.f - ttt / 6.f;
376     coeffs[1] = 1.f - t / 2.f - tt       + ttt / 2.f;
377     coeffs[2] =       t       + tt / 2.f - ttt / 2.f;
378     coeffs[3] =     - t / 6.f            + ttt / 6.f;
379 }
380
381 /**
382  * Calculate kernel for bicubic interpolation.
383  *
384  * @param du horizontal relative coordinate
385  * @param dv vertical relative coordinate
386  * @param rmap calculated 4x4 window
387  * @param u u remap data
388  * @param v v remap data
389  * @param ker ker remap data
390  */
391 static void bicubic_kernel(float du, float dv, const XYRemap *rmap,
392                            uint16_t *u, uint16_t *v, int16_t *ker)
393 {
394     float du_coeffs[4];
395     float dv_coeffs[4];
396
397     calculate_bicubic_coeffs(du, du_coeffs);
398     calculate_bicubic_coeffs(dv, dv_coeffs);
399
400     for (int i = 0; i < 4; i++) {
401         for (int j = 0; j < 4; j++) {
402             u[i * 4 + j] = rmap->u[i][j];
403             v[i * 4 + j] = rmap->v[i][j];
404             ker[i * 4 + j] = lrintf(du_coeffs[j] * dv_coeffs[i] * 16385.f);
405         }
406     }
407 }
408
409 /**
410  * Calculate 1-dimensional lanczos coefficients.
411  *
412  * @param t relative coordinate
413  * @param coeffs coefficients
414  */
415 static inline void calculate_lanczos_coeffs(float t, float *coeffs)
416 {
417     float sum = 0.f;
418
419     for (int i = 0; i < 4; i++) {
420         const float x = M_PI * (t - i + 1);
421         if (x == 0.f) {
422             coeffs[i] = 1.f;
423         } else {
424             coeffs[i] = sinf(x) * sinf(x / 2.f) / (x * x / 2.f);
425         }
426         sum += coeffs[i];
427     }
428
429     for (int i = 0; i < 4; i++) {
430         coeffs[i] /= sum;
431     }
432 }
433
434 /**
435  * Calculate kernel for lanczos interpolation.
436  *
437  * @param du horizontal relative coordinate
438  * @param dv vertical relative coordinate
439  * @param rmap calculated 4x4 window
440  * @param u u remap data
441  * @param v v remap data
442  * @param ker ker remap data
443  */
444 static void lanczos_kernel(float du, float dv, const XYRemap *rmap,
445                            uint16_t *u, uint16_t *v, int16_t *ker)
446 {
447     float du_coeffs[4];
448     float dv_coeffs[4];
449
450     calculate_lanczos_coeffs(du, du_coeffs);
451     calculate_lanczos_coeffs(dv, dv_coeffs);
452
453     for (int i = 0; i < 4; i++) {
454         for (int j = 0; j < 4; j++) {
455             u[i * 4 + j] = rmap->u[i][j];
456             v[i * 4 + j] = rmap->v[i][j];
457             ker[i * 4 + j] = lrintf(du_coeffs[j] * dv_coeffs[i] * 16385.f);
458         }
459     }
460 }
461
462 /**
463  * Modulo operation with only positive remainders.
464  *
465  * @param a dividend
466  * @param b divisor
467  *
468  * @return positive remainder of (a / b)
469  */
470 static inline int mod(int a, int b)
471 {
472     const int res = a % b;
473     if (res < 0) {
474         return res + b;
475     } else {
476         return res;
477     }
478 }
479
480 /**
481  * Convert char to corresponding direction.
482  * Used for cubemap options.
483  */
484 static int get_direction(char c)
485 {
486     switch (c) {
487     case 'r':
488         return RIGHT;
489     case 'l':
490         return LEFT;
491     case 'u':
492         return UP;
493     case 'd':
494         return DOWN;
495     case 'f':
496         return FRONT;
497     case 'b':
498         return BACK;
499     default:
500         return -1;
501     }
502 }
503
504 /**
505  * Convert char to corresponding rotation angle.
506  * Used for cubemap options.
507  */
508 static int get_rotation(char c)
509 {
510     switch (c) {
511     case '0':
512         return ROT_0;
513     case '1':
514         return ROT_90;
515     case '2':
516         return ROT_180;
517     case '3':
518         return ROT_270;
519     default:
520         return -1;
521     }
522 }
523
524 /**
525  * Convert char to corresponding rotation order.
526  */
527 static int get_rorder(char c)
528 {
529     switch (c) {
530     case 'Y':
531     case 'y':
532         return YAW;
533     case 'P':
534     case 'p':
535         return PITCH;
536     case 'R':
537     case 'r':
538         return ROLL;
539     default:
540         return -1;
541     }
542 }
543
544 /**
545  * Prepare data for processing cubemap input format.
546  *
547  * @param ctx filter context
548  *
549  * @return error code
550  */
551 static int prepare_cube_in(AVFilterContext *ctx)
552 {
553     V360Context *s = ctx->priv;
554
555     for (int face = 0; face < NB_FACES; face++) {
556         const char c = s->in_forder[face];
557         int direction;
558
559         if (c == '\0') {
560             av_log(ctx, AV_LOG_ERROR,
561                    "Incomplete in_forder option. Direction for all 6 faces should be specified.\n");
562             return AVERROR(EINVAL);
563         }
564
565         direction = get_direction(c);
566         if (direction == -1) {
567             av_log(ctx, AV_LOG_ERROR,
568                    "Incorrect direction symbol '%c' in in_forder option.\n", c);
569             return AVERROR(EINVAL);
570         }
571
572         s->in_cubemap_face_order[direction] = face;
573     }
574
575     for (int face = 0; face < NB_FACES; face++) {
576         const char c = s->in_frot[face];
577         int rotation;
578
579         if (c == '\0') {
580             av_log(ctx, AV_LOG_ERROR,
581                    "Incomplete in_frot option. Rotation for all 6 faces should be specified.\n");
582             return AVERROR(EINVAL);
583         }
584
585         rotation = get_rotation(c);
586         if (rotation == -1) {
587             av_log(ctx, AV_LOG_ERROR,
588                    "Incorrect rotation symbol '%c' in in_frot option.\n", c);
589             return AVERROR(EINVAL);
590         }
591
592         s->in_cubemap_face_rotation[face] = rotation;
593     }
594
595     return 0;
596 }
597
598 /**
599  * Prepare data for processing cubemap output format.
600  *
601  * @param ctx filter context
602  *
603  * @return error code
604  */
605 static int prepare_cube_out(AVFilterContext *ctx)
606 {
607     V360Context *s = ctx->priv;
608
609     for (int face = 0; face < NB_FACES; face++) {
610         const char c = s->out_forder[face];
611         int direction;
612
613         if (c == '\0') {
614             av_log(ctx, AV_LOG_ERROR,
615                    "Incomplete out_forder option. Direction for all 6 faces should be specified.\n");
616             return AVERROR(EINVAL);
617         }
618
619         direction = get_direction(c);
620         if (direction == -1) {
621             av_log(ctx, AV_LOG_ERROR,
622                    "Incorrect direction symbol '%c' in out_forder option.\n", c);
623             return AVERROR(EINVAL);
624         }
625
626         s->out_cubemap_direction_order[face] = direction;
627     }
628
629     for (int face = 0; face < NB_FACES; face++) {
630         const char c = s->out_frot[face];
631         int rotation;
632
633         if (c == '\0') {
634             av_log(ctx, AV_LOG_ERROR,
635                    "Incomplete out_frot option. Rotation for all 6 faces should be specified.\n");
636             return AVERROR(EINVAL);
637         }
638
639         rotation = get_rotation(c);
640         if (rotation == -1) {
641             av_log(ctx, AV_LOG_ERROR,
642                    "Incorrect rotation symbol '%c' in out_frot option.\n", c);
643             return AVERROR(EINVAL);
644         }
645
646         s->out_cubemap_face_rotation[face] = rotation;
647     }
648
649     return 0;
650 }
651
652 static inline void rotate_cube_face(float *uf, float *vf, int rotation)
653 {
654     float tmp;
655
656     switch (rotation) {
657     case ROT_0:
658         break;
659     case ROT_90:
660         tmp =  *uf;
661         *uf = -*vf;
662         *vf =  tmp;
663         break;
664     case ROT_180:
665         *uf = -*uf;
666         *vf = -*vf;
667         break;
668     case ROT_270:
669         tmp = -*uf;
670         *uf =  *vf;
671         *vf =  tmp;
672         break;
673     default:
674         av_assert0(0);
675     }
676 }
677
678 static inline void rotate_cube_face_inverse(float *uf, float *vf, int rotation)
679 {
680     float tmp;
681
682     switch (rotation) {
683     case ROT_0:
684         break;
685     case ROT_90:
686         tmp = -*uf;
687         *uf =  *vf;
688         *vf =  tmp;
689         break;
690     case ROT_180:
691         *uf = -*uf;
692         *vf = -*vf;
693         break;
694     case ROT_270:
695         tmp =  *uf;
696         *uf = -*vf;
697         *vf =  tmp;
698         break;
699     default:
700         av_assert0(0);
701     }
702 }
703
704 /**
705  * Normalize vector.
706  *
707  * @param vec vector
708  */
709 static void normalize_vector(float *vec)
710 {
711     const float norm = sqrtf(vec[0] * vec[0] + vec[1] * vec[1] + vec[2] * vec[2]);
712
713     vec[0] /= norm;
714     vec[1] /= norm;
715     vec[2] /= norm;
716 }
717
718 /**
719  * Calculate 3D coordinates on sphere for corresponding cubemap position.
720  * Common operation for every cubemap.
721  *
722  * @param s filter private context
723  * @param uf horizontal cubemap coordinate [0, 1)
724  * @param vf vertical cubemap coordinate [0, 1)
725  * @param face face of cubemap
726  * @param vec coordinates on sphere
727  */
728 static void cube_to_xyz(const V360Context *s,
729                         float uf, float vf, int face,
730                         float *vec)
731 {
732     const int direction = s->out_cubemap_direction_order[face];
733     float l_x, l_y, l_z;
734
735     uf /= (1.f - s->out_pad);
736     vf /= (1.f - s->out_pad);
737
738     rotate_cube_face_inverse(&uf, &vf, s->out_cubemap_face_rotation[face]);
739
740     switch (direction) {
741     case RIGHT:
742         l_x =  1.f;
743         l_y = -vf;
744         l_z =  uf;
745         break;
746     case LEFT:
747         l_x = -1.f;
748         l_y = -vf;
749         l_z = -uf;
750         break;
751     case UP:
752         l_x =  uf;
753         l_y =  1.f;
754         l_z = -vf;
755         break;
756     case DOWN:
757         l_x =  uf;
758         l_y = -1.f;
759         l_z =  vf;
760         break;
761     case FRONT:
762         l_x =  uf;
763         l_y = -vf;
764         l_z = -1.f;
765         break;
766     case BACK:
767         l_x = -uf;
768         l_y = -vf;
769         l_z =  1.f;
770         break;
771     default:
772         av_assert0(0);
773     }
774
775     vec[0] = l_x;
776     vec[1] = l_y;
777     vec[2] = l_z;
778
779     normalize_vector(vec);
780 }
781
782 /**
783  * Calculate cubemap position for corresponding 3D coordinates on sphere.
784  * Common operation for every cubemap.
785  *
786  * @param s filter private context
787  * @param vec coordinated on sphere
788  * @param uf horizontal cubemap coordinate [0, 1)
789  * @param vf vertical cubemap coordinate [0, 1)
790  * @param direction direction of view
791  */
792 static void xyz_to_cube(const V360Context *s,
793                         const float *vec,
794                         float *uf, float *vf, int *direction)
795 {
796     const float phi   = atan2f(vec[0], -vec[2]);
797     const float theta = asinf(-vec[1]);
798     float phi_norm, theta_threshold;
799     int face;
800
801     if (phi >= -M_PI_4 && phi < M_PI_4) {
802         *direction = FRONT;
803         phi_norm = phi;
804     } else if (phi >= -(M_PI_2 + M_PI_4) && phi < -M_PI_4) {
805         *direction = LEFT;
806         phi_norm = phi + M_PI_2;
807     } else if (phi >= M_PI_4 && phi < M_PI_2 + M_PI_4) {
808         *direction = RIGHT;
809         phi_norm = phi - M_PI_2;
810     } else {
811         *direction = BACK;
812         phi_norm = phi + ((phi > 0.f) ? -M_PI : M_PI);
813     }
814
815     theta_threshold = atanf(cosf(phi_norm));
816     if (theta > theta_threshold) {
817         *direction = DOWN;
818     } else if (theta < -theta_threshold) {
819         *direction = UP;
820     }
821
822     switch (*direction) {
823     case RIGHT:
824         *uf =  vec[2] / vec[0];
825         *vf = -vec[1] / vec[0];
826         break;
827     case LEFT:
828         *uf =  vec[2] / vec[0];
829         *vf =  vec[1] / vec[0];
830         break;
831     case UP:
832         *uf =  vec[0] / vec[1];
833         *vf = -vec[2] / vec[1];
834         break;
835     case DOWN:
836         *uf = -vec[0] / vec[1];
837         *vf = -vec[2] / vec[1];
838         break;
839     case FRONT:
840         *uf = -vec[0] / vec[2];
841         *vf =  vec[1] / vec[2];
842         break;
843     case BACK:
844         *uf = -vec[0] / vec[2];
845         *vf = -vec[1] / vec[2];
846         break;
847     default:
848         av_assert0(0);
849     }
850
851     face = s->in_cubemap_face_order[*direction];
852     rotate_cube_face(uf, vf, s->in_cubemap_face_rotation[face]);
853
854     (*uf) *= s->input_mirror_modifier[0];
855     (*vf) *= s->input_mirror_modifier[1];
856 }
857
858 /**
859  * Find position on another cube face in case of overflow/underflow.
860  * Used for calculation of interpolation window.
861  *
862  * @param s filter private context
863  * @param uf horizontal cubemap coordinate
864  * @param vf vertical cubemap coordinate
865  * @param direction direction of view
866  * @param new_uf new horizontal cubemap coordinate
867  * @param new_vf new vertical cubemap coordinate
868  * @param face face position on cubemap
869  */
870 static void process_cube_coordinates(const V360Context *s,
871                                      float uf, float vf, int direction,
872                                      float *new_uf, float *new_vf, int *face)
873 {
874     /*
875      *  Cubemap orientation
876      *
877      *           width
878      *         <------->
879      *         +-------+
880      *         |       |                              U
881      *         | up    |                   h       ------->
882      * +-------+-------+-------+-------+ ^ e      |
883      * |       |       |       |       | | i    V |
884      * | left  | front | right | back  | | g      |
885      * +-------+-------+-------+-------+ v h      v
886      *         |       |                   t
887      *         | down  |
888      *         +-------+
889      */
890
891     *face = s->in_cubemap_face_order[direction];
892     rotate_cube_face_inverse(&uf, &vf, s->in_cubemap_face_rotation[*face]);
893
894     if ((uf < -1.f || uf >= 1.f) && (vf < -1.f || vf >= 1.f)) {
895         // There are no pixels to use in this case
896         *new_uf = uf;
897         *new_vf = vf;
898     } else if (uf < -1.f) {
899         uf += 2.f;
900         switch (direction) {
901         case RIGHT:
902             direction = FRONT;
903             *new_uf =  uf;
904             *new_vf =  vf;
905             break;
906         case LEFT:
907             direction = BACK;
908             *new_uf =  uf;
909             *new_vf =  vf;
910             break;
911         case UP:
912             direction = LEFT;
913             *new_uf =  vf;
914             *new_vf = -uf;
915             break;
916         case DOWN:
917             direction = LEFT;
918             *new_uf = -vf;
919             *new_vf =  uf;
920             break;
921         case FRONT:
922             direction = LEFT;
923             *new_uf =  uf;
924             *new_vf =  vf;
925             break;
926         case BACK:
927             direction = RIGHT;
928             *new_uf =  uf;
929             *new_vf =  vf;
930             break;
931         default:
932             av_assert0(0);
933         }
934     } else if (uf >= 1.f) {
935         uf -= 2.f;
936         switch (direction) {
937         case RIGHT:
938             direction = BACK;
939             *new_uf =  uf;
940             *new_vf =  vf;
941             break;
942         case LEFT:
943             direction = FRONT;
944             *new_uf =  uf;
945             *new_vf =  vf;
946             break;
947         case UP:
948             direction = RIGHT;
949             *new_uf = -vf;
950             *new_vf =  uf;
951             break;
952         case DOWN:
953             direction = RIGHT;
954             *new_uf =  vf;
955             *new_vf = -uf;
956             break;
957         case FRONT:
958             direction = RIGHT;
959             *new_uf =  uf;
960             *new_vf =  vf;
961             break;
962         case BACK:
963             direction = LEFT;
964             *new_uf =  uf;
965             *new_vf =  vf;
966             break;
967         default:
968             av_assert0(0);
969         }
970     } else if (vf < -1.f) {
971         vf += 2.f;
972         switch (direction) {
973         case RIGHT:
974             direction = UP;
975             *new_uf =  vf;
976             *new_vf = -uf;
977             break;
978         case LEFT:
979             direction = UP;
980             *new_uf = -vf;
981             *new_vf =  uf;
982             break;
983         case UP:
984             direction = BACK;
985             *new_uf = -uf;
986             *new_vf = -vf;
987             break;
988         case DOWN:
989             direction = FRONT;
990             *new_uf =  uf;
991             *new_vf =  vf;
992             break;
993         case FRONT:
994             direction = UP;
995             *new_uf =  uf;
996             *new_vf =  vf;
997             break;
998         case BACK:
999             direction = UP;
1000             *new_uf = -uf;
1001             *new_vf = -vf;
1002             break;
1003         default:
1004             av_assert0(0);
1005         }
1006     } else if (vf >= 1.f) {
1007         vf -= 2.f;
1008         switch (direction) {
1009         case RIGHT:
1010             direction = DOWN;
1011             *new_uf = -vf;
1012             *new_vf =  uf;
1013             break;
1014         case LEFT:
1015             direction = DOWN;
1016             *new_uf =  vf;
1017             *new_vf = -uf;
1018             break;
1019         case UP:
1020             direction = FRONT;
1021             *new_uf =  uf;
1022             *new_vf =  vf;
1023             break;
1024         case DOWN:
1025             direction = BACK;
1026             *new_uf = -uf;
1027             *new_vf = -vf;
1028             break;
1029         case FRONT:
1030             direction = DOWN;
1031             *new_uf =  uf;
1032             *new_vf =  vf;
1033             break;
1034         case BACK:
1035             direction = DOWN;
1036             *new_uf = -uf;
1037             *new_vf = -vf;
1038             break;
1039         default:
1040             av_assert0(0);
1041         }
1042     } else {
1043         // Inside cube face
1044         *new_uf = uf;
1045         *new_vf = vf;
1046     }
1047
1048     *face = s->in_cubemap_face_order[direction];
1049     rotate_cube_face(new_uf, new_vf, s->in_cubemap_face_rotation[*face]);
1050 }
1051
1052 /**
1053  * Calculate 3D coordinates on sphere for corresponding frame position in cubemap3x2 format.
1054  *
1055  * @param s filter private context
1056  * @param i horizontal position on frame [0, width)
1057  * @param j vertical position on frame [0, height)
1058  * @param width frame width
1059  * @param height frame height
1060  * @param vec coordinates on sphere
1061  */
1062 static void cube3x2_to_xyz(const V360Context *s,
1063                            int i, int j, int width, int height,
1064                            float *vec)
1065 {
1066     const float ew = width  / 3.f;
1067     const float eh = height / 2.f;
1068
1069     const int u_face = floorf(i / ew);
1070     const int v_face = floorf(j / eh);
1071     const int face = u_face + 3 * v_face;
1072
1073     const int u_shift = ceilf(ew * u_face);
1074     const int v_shift = ceilf(eh * v_face);
1075     const int ewi = ceilf(ew * (u_face + 1)) - u_shift;
1076     const int ehi = ceilf(eh * (v_face + 1)) - v_shift;
1077
1078     const float uf = 2.f * (i - u_shift + 0.5f) / ewi - 1.f;
1079     const float vf = 2.f * (j - v_shift + 0.5f) / ehi - 1.f;
1080
1081     cube_to_xyz(s, uf, vf, face, vec);
1082 }
1083
1084 /**
1085  * Calculate frame position in cubemap3x2 format for corresponding 3D coordinates on sphere.
1086  *
1087  * @param s filter private context
1088  * @param vec coordinates on sphere
1089  * @param width frame width
1090  * @param height frame height
1091  * @param us horizontal coordinates for interpolation window
1092  * @param vs vertical coordinates for interpolation window
1093  * @param du horizontal relative coordinate
1094  * @param dv vertical relative coordinate
1095  */
1096 static void xyz_to_cube3x2(const V360Context *s,
1097                            const float *vec, int width, int height,
1098                            uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1099 {
1100     const float ew = width  / 3.f;
1101     const float eh = height / 2.f;
1102     float uf, vf;
1103     int ui, vi;
1104     int ewi, ehi;
1105     int direction, face;
1106     int u_face, v_face;
1107
1108     xyz_to_cube(s, vec, &uf, &vf, &direction);
1109
1110     uf *= (1.f - s->in_pad);
1111     vf *= (1.f - s->in_pad);
1112
1113     face = s->in_cubemap_face_order[direction];
1114     u_face = face % 3;
1115     v_face = face / 3;
1116     ewi = ceilf(ew * (u_face + 1)) - ceilf(ew * u_face);
1117     ehi = ceilf(eh * (v_face + 1)) - ceilf(eh * v_face);
1118
1119     uf = 0.5f * ewi * (uf + 1.f) - 0.5f;
1120     vf = 0.5f * ehi * (vf + 1.f) - 0.5f;
1121
1122     ui = floorf(uf);
1123     vi = floorf(vf);
1124
1125     *du = uf - ui;
1126     *dv = vf - vi;
1127
1128     for (int i = -1; i < 3; i++) {
1129         for (int j = -1; j < 3; j++) {
1130             int new_ui = ui + j;
1131             int new_vi = vi + i;
1132             int u_shift, v_shift;
1133             int new_ewi, new_ehi;
1134
1135             if (new_ui >= 0 && new_ui < ewi && new_vi >= 0 && new_vi < ehi) {
1136                 face = s->in_cubemap_face_order[direction];
1137
1138                 u_face = face % 3;
1139                 v_face = face / 3;
1140                 u_shift = ceilf(ew * u_face);
1141                 v_shift = ceilf(eh * v_face);
1142             } else {
1143                 uf = 2.f * new_ui / ewi - 1.f;
1144                 vf = 2.f * new_vi / ehi - 1.f;
1145
1146                 uf /= (1.f - s->in_pad);
1147                 vf /= (1.f - s->in_pad);
1148
1149                 process_cube_coordinates(s, uf, vf, direction, &uf, &vf, &face);
1150
1151                 uf *= (1.f - s->in_pad);
1152                 vf *= (1.f - s->in_pad);
1153
1154                 u_face = face % 3;
1155                 v_face = face / 3;
1156                 u_shift = ceilf(ew * u_face);
1157                 v_shift = ceilf(eh * v_face);
1158                 new_ewi = ceilf(ew * (u_face + 1)) - u_shift;
1159                 new_ehi = ceilf(eh * (v_face + 1)) - v_shift;
1160
1161                 new_ui = av_clip(roundf(0.5f * new_ewi * (uf + 1.f)), 0, new_ewi - 1);
1162                 new_vi = av_clip(roundf(0.5f * new_ehi * (vf + 1.f)), 0, new_ehi - 1);
1163             }
1164
1165             us[i + 1][j + 1] = u_shift + new_ui;
1166             vs[i + 1][j + 1] = v_shift + new_vi;
1167         }
1168     }
1169 }
1170
1171 /**
1172  * Calculate 3D coordinates on sphere for corresponding frame position in cubemap1x6 format.
1173  *
1174  * @param s filter private context
1175  * @param i horizontal position on frame [0, width)
1176  * @param j vertical position on frame [0, height)
1177  * @param width frame width
1178  * @param height frame height
1179  * @param vec coordinates on sphere
1180  */
1181 static void cube1x6_to_xyz(const V360Context *s,
1182                            int i, int j, int width, int height,
1183                            float *vec)
1184 {
1185     const float ew = width;
1186     const float eh = height / 6.f;
1187
1188     const int face = floorf(j / eh);
1189
1190     const int v_shift = ceilf(eh * face);
1191     const int ehi = ceilf(eh * (face + 1)) - v_shift;
1192
1193     const float uf = 2.f * (i           + 0.5f) / ew  - 1.f;
1194     const float vf = 2.f * (j - v_shift + 0.5f) / ehi - 1.f;
1195
1196     cube_to_xyz(s, uf, vf, face, vec);
1197 }
1198
1199 /**
1200  * Calculate 3D coordinates on sphere for corresponding frame position in cubemap6x1 format.
1201  *
1202  * @param s filter private context
1203  * @param i horizontal position on frame [0, width)
1204  * @param j vertical position on frame [0, height)
1205  * @param width frame width
1206  * @param height frame height
1207  * @param vec coordinates on sphere
1208  */
1209 static void cube6x1_to_xyz(const V360Context *s,
1210                            int i, int j, int width, int height,
1211                            float *vec)
1212 {
1213     const float ew = width / 6.f;
1214     const float eh = height;
1215
1216     const int face = floorf(i / ew);
1217
1218     const int u_shift = ceilf(ew * face);
1219     const int ewi = ceilf(ew * (face + 1)) - u_shift;
1220
1221     const float uf = 2.f * (i - u_shift + 0.5f) / ewi - 1.f;
1222     const float vf = 2.f * (j           + 0.5f) / eh  - 1.f;
1223
1224     cube_to_xyz(s, uf, vf, face, vec);
1225 }
1226
1227 /**
1228  * Calculate frame position in cubemap1x6 format for corresponding 3D coordinates on sphere.
1229  *
1230  * @param s filter private context
1231  * @param vec coordinates on sphere
1232  * @param width frame width
1233  * @param height frame height
1234  * @param us horizontal coordinates for interpolation window
1235  * @param vs vertical coordinates for interpolation window
1236  * @param du horizontal relative coordinate
1237  * @param dv vertical relative coordinate
1238  */
1239 static void xyz_to_cube1x6(const V360Context *s,
1240                            const float *vec, int width, int height,
1241                            uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1242 {
1243     const float eh = height / 6.f;
1244     const int ewi = width;
1245     float uf, vf;
1246     int ui, vi;
1247     int ehi;
1248     int direction, face;
1249
1250     xyz_to_cube(s, vec, &uf, &vf, &direction);
1251
1252     uf *= (1.f - s->in_pad);
1253     vf *= (1.f - s->in_pad);
1254
1255     face = s->in_cubemap_face_order[direction];
1256     ehi = ceilf(eh * (face + 1)) - ceilf(eh * face);
1257
1258     uf = 0.5f * ewi * (uf + 1.f) - 0.5f;
1259     vf = 0.5f * ehi * (vf + 1.f) - 0.5f;
1260
1261     ui = floorf(uf);
1262     vi = floorf(vf);
1263
1264     *du = uf - ui;
1265     *dv = vf - vi;
1266
1267     for (int i = -1; i < 3; i++) {
1268         for (int j = -1; j < 3; j++) {
1269             int new_ui = ui + j;
1270             int new_vi = vi + i;
1271             int v_shift;
1272             int new_ehi;
1273
1274             if (new_ui >= 0 && new_ui < ewi && new_vi >= 0 && new_vi < ehi) {
1275                 face = s->in_cubemap_face_order[direction];
1276
1277                 v_shift = ceilf(eh * face);
1278             } else {
1279                 uf = 2.f * new_ui / ewi - 1.f;
1280                 vf = 2.f * new_vi / ehi - 1.f;
1281
1282                 uf /= (1.f - s->in_pad);
1283                 vf /= (1.f - s->in_pad);
1284
1285                 process_cube_coordinates(s, uf, vf, direction, &uf, &vf, &face);
1286
1287                 uf *= (1.f - s->in_pad);
1288                 vf *= (1.f - s->in_pad);
1289
1290                 v_shift = ceilf(eh * face);
1291                 new_ehi = ceilf(eh * (face + 1)) - v_shift;
1292
1293                 new_ui = av_clip(roundf(0.5f *     ewi * (uf + 1.f)), 0,     ewi - 1);
1294                 new_vi = av_clip(roundf(0.5f * new_ehi * (vf + 1.f)), 0, new_ehi - 1);
1295             }
1296
1297             us[i + 1][j + 1] =           new_ui;
1298             vs[i + 1][j + 1] = v_shift + new_vi;
1299         }
1300     }
1301 }
1302
1303 /**
1304  * Calculate frame position in cubemap6x1 format for corresponding 3D coordinates on sphere.
1305  *
1306  * @param s filter private context
1307  * @param vec coordinates on sphere
1308  * @param width frame width
1309  * @param height frame height
1310  * @param us horizontal coordinates for interpolation window
1311  * @param vs vertical coordinates for interpolation window
1312  * @param du horizontal relative coordinate
1313  * @param dv vertical relative coordinate
1314  */
1315 static void xyz_to_cube6x1(const V360Context *s,
1316                            const float *vec, int width, int height,
1317                            uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1318 {
1319     const float ew = width / 6.f;
1320     const int ehi = height;
1321     float uf, vf;
1322     int ui, vi;
1323     int ewi;
1324     int direction, face;
1325
1326     xyz_to_cube(s, vec, &uf, &vf, &direction);
1327
1328     uf *= (1.f - s->in_pad);
1329     vf *= (1.f - s->in_pad);
1330
1331     face = s->in_cubemap_face_order[direction];
1332     ewi = ceilf(ew * (face + 1)) - ceilf(ew * face);
1333
1334     uf = 0.5f * ewi * (uf + 1.f) - 0.5f;
1335     vf = 0.5f * ehi * (vf + 1.f) - 0.5f;
1336
1337     ui = floorf(uf);
1338     vi = floorf(vf);
1339
1340     *du = uf - ui;
1341     *dv = vf - vi;
1342
1343     for (int i = -1; i < 3; i++) {
1344         for (int j = -1; j < 3; j++) {
1345             int new_ui = ui + j;
1346             int new_vi = vi + i;
1347             int u_shift;
1348             int new_ewi;
1349
1350             if (new_ui >= 0 && new_ui < ewi && new_vi >= 0 && new_vi < ehi) {
1351                 face = s->in_cubemap_face_order[direction];
1352
1353                 u_shift = ceilf(ew * face);
1354             } else {
1355                 uf = 2.f * new_ui / ewi - 1.f;
1356                 vf = 2.f * new_vi / ehi - 1.f;
1357
1358                 uf /= (1.f - s->in_pad);
1359                 vf /= (1.f - s->in_pad);
1360
1361                 process_cube_coordinates(s, uf, vf, direction, &uf, &vf, &face);
1362
1363                 uf *= (1.f - s->in_pad);
1364                 vf *= (1.f - s->in_pad);
1365
1366                 u_shift = ceilf(ew * face);
1367                 new_ewi = ceilf(ew * (face + 1)) - u_shift;
1368
1369                 new_ui = av_clip(roundf(0.5f * new_ewi * (uf + 1.f)), 0, new_ewi - 1);
1370                 new_vi = av_clip(roundf(0.5f *     ehi * (vf + 1.f)), 0,     ehi - 1);
1371             }
1372
1373             us[i + 1][j + 1] = u_shift + new_ui;
1374             vs[i + 1][j + 1] =           new_vi;
1375         }
1376     }
1377 }
1378
1379 /**
1380  * Calculate 3D coordinates on sphere for corresponding frame position in equirectangular format.
1381  *
1382  * @param s filter private context
1383  * @param i horizontal position on frame [0, width)
1384  * @param j vertical position on frame [0, height)
1385  * @param width frame width
1386  * @param height frame height
1387  * @param vec coordinates on sphere
1388  */
1389 static void equirect_to_xyz(const V360Context *s,
1390                             int i, int j, int width, int height,
1391                             float *vec)
1392 {
1393     const float phi   = ((2.f * i) / width  - 1.f) * M_PI;
1394     const float theta = ((2.f * j) / height - 1.f) * M_PI_2;
1395
1396     const float sin_phi   = sinf(phi);
1397     const float cos_phi   = cosf(phi);
1398     const float sin_theta = sinf(theta);
1399     const float cos_theta = cosf(theta);
1400
1401     vec[0] =  cos_theta * sin_phi;
1402     vec[1] = -sin_theta;
1403     vec[2] = -cos_theta * cos_phi;
1404 }
1405
1406 /**
1407  * Prepare data for processing stereographic output format.
1408  *
1409  * @param ctx filter context
1410  *
1411  * @return error code
1412  */
1413 static int prepare_stereographic_out(AVFilterContext *ctx)
1414 {
1415     V360Context *s = ctx->priv;
1416
1417     const float h_angle = tanf(FFMIN(s->h_fov, 359.f) * M_PI / 720.f);
1418     const float v_angle = tanf(FFMIN(s->v_fov, 359.f) * M_PI / 720.f);
1419
1420     s->flat_range[0] = h_angle;
1421     s->flat_range[1] = v_angle;
1422
1423     return 0;
1424 }
1425
1426 /**
1427  * Calculate 3D coordinates on sphere for corresponding frame position in stereographic format.
1428  *
1429  * @param s filter private context
1430  * @param i horizontal position on frame [0, width)
1431  * @param j vertical position on frame [0, height)
1432  * @param width frame width
1433  * @param height frame height
1434  * @param vec coordinates on sphere
1435  */
1436 static void stereographic_to_xyz(const V360Context *s,
1437                                  int i, int j, int width, int height,
1438                                  float *vec)
1439 {
1440     const float x = ((2.f * i) / width  - 1.f) * s->flat_range[0];
1441     const float y = ((2.f * j) / height - 1.f) * s->flat_range[1];
1442     const float xy = x * x + y * y;
1443
1444     vec[0] = 2.f * x / (1.f + xy);
1445     vec[1] = (-1.f + xy) / (1.f + xy);
1446     vec[2] = 2.f * y / (1.f + xy);
1447
1448     normalize_vector(vec);
1449 }
1450
1451 /**
1452  * Calculate frame position in stereographic format for corresponding 3D coordinates on sphere.
1453  *
1454  * @param s filter private context
1455  * @param vec coordinates on sphere
1456  * @param width frame width
1457  * @param height frame height
1458  * @param us horizontal coordinates for interpolation window
1459  * @param vs vertical coordinates for interpolation window
1460  * @param du horizontal relative coordinate
1461  * @param dv vertical relative coordinate
1462  */
1463 static void xyz_to_stereographic(const V360Context *s,
1464                                  const float *vec, int width, int height,
1465                                  uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1466 {
1467     const float x = av_clipf(vec[0] / (1.f - vec[1]), -1.f, 1.f) * s->input_mirror_modifier[0];
1468     const float y = av_clipf(vec[2] / (1.f - vec[1]), -1.f, 1.f) * s->input_mirror_modifier[1];
1469     float uf, vf;
1470     int ui, vi;
1471
1472     uf = (x + 1.f) * width  / 2.f;
1473     vf = (y + 1.f) * height / 2.f;
1474     ui = floorf(uf);
1475     vi = floorf(vf);
1476
1477     *du = uf - ui;
1478     *dv = vf - vi;
1479
1480     for (int i = -1; i < 3; i++) {
1481         for (int j = -1; j < 3; j++) {
1482             us[i + 1][j + 1] = av_clip(ui + j, 0, width - 1);
1483             vs[i + 1][j + 1] = av_clip(vi + i, 0, height - 1);
1484         }
1485     }
1486 }
1487
1488 /**
1489  * Calculate frame position in equirectangular format for corresponding 3D coordinates on sphere.
1490  *
1491  * @param s filter private context
1492  * @param vec coordinates on sphere
1493  * @param width frame width
1494  * @param height frame height
1495  * @param us horizontal coordinates for interpolation window
1496  * @param vs vertical coordinates for interpolation window
1497  * @param du horizontal relative coordinate
1498  * @param dv vertical relative coordinate
1499  */
1500 static void xyz_to_equirect(const V360Context *s,
1501                             const float *vec, int width, int height,
1502                             uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1503 {
1504     const float phi   = atan2f(vec[0], -vec[2]) * s->input_mirror_modifier[0];
1505     const float theta = asinf(-vec[1]) * s->input_mirror_modifier[1];
1506     float uf, vf;
1507     int ui, vi;
1508
1509     uf = (phi   / M_PI   + 1.f) * width  / 2.f;
1510     vf = (theta / M_PI_2 + 1.f) * height / 2.f;
1511     ui = floorf(uf);
1512     vi = floorf(vf);
1513
1514     *du = uf - ui;
1515     *dv = vf - vi;
1516
1517     for (int i = -1; i < 3; i++) {
1518         for (int j = -1; j < 3; j++) {
1519             us[i + 1][j + 1] = mod(ui + j, width);
1520             vs[i + 1][j + 1] = av_clip(vi + i, 0, height - 1);
1521         }
1522     }
1523 }
1524
1525 /**
1526  * Calculate frame position in mercator format for corresponding 3D coordinates on sphere.
1527  *
1528  * @param s filter private context
1529  * @param vec coordinates on sphere
1530  * @param width frame width
1531  * @param height frame height
1532  * @param us horizontal coordinates for interpolation window
1533  * @param vs vertical coordinates for interpolation window
1534  * @param du horizontal relative coordinate
1535  * @param dv vertical relative coordinate
1536  */
1537 static void xyz_to_mercator(const V360Context *s,
1538                             const float *vec, int width, int height,
1539                             uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1540 {
1541     const float phi   = atan2f(vec[0], -vec[2]) * s->input_mirror_modifier[0];
1542     const float theta = 0.5f * asinhf(vec[1] / sqrtf(1.f - vec[1] * vec[1])) * s->input_mirror_modifier[1];
1543     float uf, vf;
1544     int ui, vi;
1545
1546     uf = (phi   / M_PI + 1.f) * width  / 2.f;
1547     vf = (theta / M_PI + 1.f) * height / 2.f;
1548     ui = floorf(uf);
1549     vi = floorf(vf);
1550
1551     *du = uf - ui;
1552     *dv = vf - vi;
1553
1554     for (int i = -1; i < 3; i++) {
1555         for (int j = -1; j < 3; j++) {
1556             us[i + 1][j + 1] = mod(ui + j, width);
1557             vs[i + 1][j + 1] = av_clip(vi + i, 0, height - 1);
1558         }
1559     }
1560 }
1561
1562 /**
1563  * Calculate 3D coordinates on sphere for corresponding frame position in mercator format.
1564  *
1565  * @param s filter private context
1566  * @param i horizontal position on frame [0, width)
1567  * @param j vertical position on frame [0, height)
1568  * @param width frame width
1569  * @param height frame height
1570  * @param vec coordinates on sphere
1571  */
1572 static void mercator_to_xyz(const V360Context *s,
1573                             int i, int j, int width, int height,
1574                             float *vec)
1575 {
1576     const float phi   = ((2.f * i) / width  - 1.f) * M_PI;
1577     const float theta = atanf(sinhf(((2.f * j) / height - 1.f) * 2.f * M_PI));
1578
1579     const float sin_phi   = sinf(phi);
1580     const float cos_phi   = cosf(phi);
1581     const float sin_theta = sinf(theta);
1582     const float cos_theta = cosf(theta);
1583
1584     vec[0] =  cos_theta * sin_phi;
1585     vec[1] = -sin_theta;
1586     vec[2] = -cos_theta * cos_phi;
1587 }
1588
1589 /**
1590  * Calculate frame position in ball format for corresponding 3D coordinates on sphere.
1591  *
1592  * @param s filter private context
1593  * @param vec coordinates on sphere
1594  * @param width frame width
1595  * @param height frame height
1596  * @param us horizontal coordinates for interpolation window
1597  * @param vs vertical coordinates for interpolation window
1598  * @param du horizontal relative coordinate
1599  * @param dv vertical relative coordinate
1600  */
1601 static void xyz_to_ball(const V360Context *s,
1602                         const float *vec, int width, int height,
1603                         uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1604 {
1605     const float l = hypotf(vec[0], vec[1]);
1606     const float r = sqrtf(1.f + vec[2]) / M_SQRT2;
1607     float uf, vf;
1608     int ui, vi;
1609
1610     uf = (1.f + r * vec[0] * s->input_mirror_modifier[0] / (l > 0.f ? l : 1.f)) * width  * 0.5f;
1611     vf = (1.f - r * vec[1] * s->input_mirror_modifier[1] / (l > 0.f ? l : 1.f)) * height * 0.5f;
1612
1613     ui = floorf(uf);
1614     vi = floorf(vf);
1615
1616     *du = uf - ui;
1617     *dv = vf - vi;
1618
1619     for (int i = -1; i < 3; i++) {
1620         for (int j = -1; j < 3; j++) {
1621             us[i + 1][j + 1] = mod(ui + j, width);
1622             vs[i + 1][j + 1] = av_clip(vi + i, 0, height - 1);
1623         }
1624     }
1625 }
1626
1627 /**
1628  * Calculate 3D coordinates on sphere for corresponding frame position in ball format.
1629  *
1630  * @param s filter private context
1631  * @param i horizontal position on frame [0, width)
1632  * @param j vertical position on frame [0, height)
1633  * @param width frame width
1634  * @param height frame height
1635  * @param vec coordinates on sphere
1636  */
1637 static void ball_to_xyz(const V360Context *s,
1638                         int i, int j, int width, int height,
1639                         float *vec)
1640 {
1641     const float x = (2.f * i) / width  - 1.f;
1642     const float y = (2.f * j) / height - 1.f;
1643     const float l = hypotf(x, y);
1644
1645     if (l <= 1.f) {
1646         const float phi   = atan2f(x, y);
1647         const float theta = 2.f * asinf(l);
1648
1649         const float sin_phi   = sinf(phi);
1650         const float cos_phi   = cosf(phi);
1651         const float sin_theta = sinf(theta);
1652         const float cos_theta = cosf(theta);
1653
1654         vec[0] =  sin_theta * sin_phi;
1655         vec[1] = -sin_theta * cos_phi;
1656         vec[2] = -cos_theta;
1657     } else {
1658         vec[0] =  0.f;
1659         vec[1] = -1.f;
1660         vec[2] =  0.f;
1661     }
1662 }
1663
1664 /**
1665  * Calculate 3D coordinates on sphere for corresponding frame position in hammer format.
1666  *
1667  * @param s filter private context
1668  * @param i horizontal position on frame [0, width)
1669  * @param j vertical position on frame [0, height)
1670  * @param width frame width
1671  * @param height frame height
1672  * @param vec coordinates on sphere
1673  */
1674 static void hammer_to_xyz(const V360Context *s,
1675                           int i, int j, int width, int height,
1676                           float *vec)
1677 {
1678     const float x = ((2.f * i) / width  - 1.f);
1679     const float y = ((2.f * j) / height - 1.f);
1680
1681     const float xx = x * x;
1682     const float yy = y * y;
1683
1684     const float z = sqrtf(1.f - xx * 0.5f - yy * 0.5f);
1685
1686     const float a = M_SQRT2 * x * z;
1687     const float b = 2.f * z * z - 1.f;
1688
1689     const float aa = a * a;
1690     const float bb = b * b;
1691
1692     const float w = sqrtf(1.f - 2.f * yy * z * z);
1693
1694     vec[0] =  w * 2.f * a * b / (aa + bb);
1695     vec[1] = -M_SQRT2 * y * z;
1696     vec[2] = -w * (bb  - aa) / (aa + bb);
1697
1698     normalize_vector(vec);
1699 }
1700
1701 /**
1702  * Calculate frame position in hammer format for corresponding 3D coordinates on sphere.
1703  *
1704  * @param s filter private context
1705  * @param vec coordinates on sphere
1706  * @param width frame width
1707  * @param height frame height
1708  * @param us horizontal coordinates for interpolation window
1709  * @param vs vertical coordinates for interpolation window
1710  * @param du horizontal relative coordinate
1711  * @param dv vertical relative coordinate
1712  */
1713 static void xyz_to_hammer(const V360Context *s,
1714                           const float *vec, int width, int height,
1715                           uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1716 {
1717     const float theta = atan2f(vec[0], -vec[2]) * s->input_mirror_modifier[0];
1718
1719     const float z = sqrtf(1.f + sqrtf(1.f - vec[1] * vec[1]) * cosf(theta * 0.5f));
1720     const float x = sqrtf(1.f - vec[1] * vec[1]) * sinf(theta * 0.5f) / z;
1721     const float y = -vec[1] / z * s->input_mirror_modifier[1];
1722     float uf, vf;
1723     int ui, vi;
1724
1725     uf = (x + 1.f) * width  / 2.f;
1726     vf = (y + 1.f) * height / 2.f;
1727     ui = floorf(uf);
1728     vi = floorf(vf);
1729
1730     *du = uf - ui;
1731     *dv = vf - vi;
1732
1733     for (int i = -1; i < 3; i++) {
1734         for (int j = -1; j < 3; j++) {
1735             us[i + 1][j + 1] = mod(ui + j, width);
1736             vs[i + 1][j + 1] = av_clip(vi + i, 0, height - 1);
1737         }
1738     }
1739 }
1740
1741 /**
1742  * Prepare data for processing equi-angular cubemap input format.
1743  *
1744  * @param ctx filter context
1745  *
1746  * @return error code
1747  */
1748 static int prepare_eac_in(AVFilterContext *ctx)
1749 {
1750     V360Context *s = ctx->priv;
1751
1752     if (s->ih_flip && s->iv_flip) {
1753         s->in_cubemap_face_order[RIGHT] = BOTTOM_LEFT;
1754         s->in_cubemap_face_order[LEFT]  = BOTTOM_RIGHT;
1755         s->in_cubemap_face_order[UP]    = TOP_LEFT;
1756         s->in_cubemap_face_order[DOWN]  = TOP_RIGHT;
1757         s->in_cubemap_face_order[FRONT] = BOTTOM_MIDDLE;
1758         s->in_cubemap_face_order[BACK]  = TOP_MIDDLE;
1759     } else if (s->ih_flip) {
1760         s->in_cubemap_face_order[RIGHT] = TOP_LEFT;
1761         s->in_cubemap_face_order[LEFT]  = TOP_RIGHT;
1762         s->in_cubemap_face_order[UP]    = BOTTOM_LEFT;
1763         s->in_cubemap_face_order[DOWN]  = BOTTOM_RIGHT;
1764         s->in_cubemap_face_order[FRONT] = TOP_MIDDLE;
1765         s->in_cubemap_face_order[BACK]  = BOTTOM_MIDDLE;
1766     } else if (s->iv_flip) {
1767         s->in_cubemap_face_order[RIGHT] = BOTTOM_RIGHT;
1768         s->in_cubemap_face_order[LEFT]  = BOTTOM_LEFT;
1769         s->in_cubemap_face_order[UP]    = TOP_RIGHT;
1770         s->in_cubemap_face_order[DOWN]  = TOP_LEFT;
1771         s->in_cubemap_face_order[FRONT] = BOTTOM_MIDDLE;
1772         s->in_cubemap_face_order[BACK]  = TOP_MIDDLE;
1773     } else {
1774         s->in_cubemap_face_order[RIGHT] = TOP_RIGHT;
1775         s->in_cubemap_face_order[LEFT]  = TOP_LEFT;
1776         s->in_cubemap_face_order[UP]    = BOTTOM_RIGHT;
1777         s->in_cubemap_face_order[DOWN]  = BOTTOM_LEFT;
1778         s->in_cubemap_face_order[FRONT] = TOP_MIDDLE;
1779         s->in_cubemap_face_order[BACK]  = BOTTOM_MIDDLE;
1780     }
1781
1782     if (s->iv_flip) {
1783         s->in_cubemap_face_rotation[TOP_LEFT]      = ROT_270;
1784         s->in_cubemap_face_rotation[TOP_MIDDLE]    = ROT_90;
1785         s->in_cubemap_face_rotation[TOP_RIGHT]     = ROT_270;
1786         s->in_cubemap_face_rotation[BOTTOM_LEFT]   = ROT_0;
1787         s->in_cubemap_face_rotation[BOTTOM_MIDDLE] = ROT_0;
1788         s->in_cubemap_face_rotation[BOTTOM_RIGHT]  = ROT_0;
1789     } else {
1790         s->in_cubemap_face_rotation[TOP_LEFT]      = ROT_0;
1791         s->in_cubemap_face_rotation[TOP_MIDDLE]    = ROT_0;
1792         s->in_cubemap_face_rotation[TOP_RIGHT]     = ROT_0;
1793         s->in_cubemap_face_rotation[BOTTOM_LEFT]   = ROT_270;
1794         s->in_cubemap_face_rotation[BOTTOM_MIDDLE] = ROT_90;
1795         s->in_cubemap_face_rotation[BOTTOM_RIGHT]  = ROT_270;
1796     }
1797
1798     return 0;
1799 }
1800
1801 /**
1802  * Prepare data for processing equi-angular cubemap output format.
1803  *
1804  * @param ctx filter context
1805  *
1806  * @return error code
1807  */
1808 static int prepare_eac_out(AVFilterContext *ctx)
1809 {
1810     V360Context *s = ctx->priv;
1811
1812     s->out_cubemap_direction_order[TOP_LEFT]      = LEFT;
1813     s->out_cubemap_direction_order[TOP_MIDDLE]    = FRONT;
1814     s->out_cubemap_direction_order[TOP_RIGHT]     = RIGHT;
1815     s->out_cubemap_direction_order[BOTTOM_LEFT]   = DOWN;
1816     s->out_cubemap_direction_order[BOTTOM_MIDDLE] = BACK;
1817     s->out_cubemap_direction_order[BOTTOM_RIGHT]  = UP;
1818
1819     s->out_cubemap_face_rotation[TOP_LEFT]      = ROT_0;
1820     s->out_cubemap_face_rotation[TOP_MIDDLE]    = ROT_0;
1821     s->out_cubemap_face_rotation[TOP_RIGHT]     = ROT_0;
1822     s->out_cubemap_face_rotation[BOTTOM_LEFT]   = ROT_270;
1823     s->out_cubemap_face_rotation[BOTTOM_MIDDLE] = ROT_90;
1824     s->out_cubemap_face_rotation[BOTTOM_RIGHT]  = ROT_270;
1825
1826     return 0;
1827 }
1828
1829 /**
1830  * Calculate 3D coordinates on sphere for corresponding frame position in equi-angular cubemap format.
1831  *
1832  * @param s filter private context
1833  * @param i horizontal position on frame [0, width)
1834  * @param j vertical position on frame [0, height)
1835  * @param width frame width
1836  * @param height frame height
1837  * @param vec coordinates on sphere
1838  */
1839 static void eac_to_xyz(const V360Context *s,
1840                        int i, int j, int width, int height,
1841                        float *vec)
1842 {
1843     const float pixel_pad = 2;
1844     const float u_pad = pixel_pad / width;
1845     const float v_pad = pixel_pad / height;
1846
1847     int u_face, v_face, face;
1848
1849     float l_x, l_y, l_z;
1850
1851     float uf = (i + 0.5f) / width;
1852     float vf = (j + 0.5f) / height;
1853
1854     // EAC has 2-pixel padding on faces except between faces on the same row
1855     // Padding pixels seems not to be stretched with tangent as regular pixels
1856     // Formulas below approximate original padding as close as I could get experimentally
1857
1858     // Horizontal padding
1859     uf = 3.f * (uf - u_pad) / (1.f - 2.f * u_pad);
1860     if (uf < 0.f) {
1861         u_face = 0;
1862         uf -= 0.5f;
1863     } else if (uf >= 3.f) {
1864         u_face = 2;
1865         uf -= 2.5f;
1866     } else {
1867         u_face = floorf(uf);
1868         uf = fmodf(uf, 1.f) - 0.5f;
1869     }
1870
1871     // Vertical padding
1872     v_face = floorf(vf * 2.f);
1873     vf = (vf - v_pad - 0.5f * v_face) / (0.5f - 2.f * v_pad) - 0.5f;
1874
1875     if (uf >= -0.5f && uf < 0.5f) {
1876         uf = tanf(M_PI_2 * uf);
1877     } else {
1878         uf = 2.f * uf;
1879     }
1880     if (vf >= -0.5f && vf < 0.5f) {
1881         vf = tanf(M_PI_2 * vf);
1882     } else {
1883         vf = 2.f * vf;
1884     }
1885
1886     face = u_face + 3 * v_face;
1887
1888     switch (face) {
1889     case TOP_LEFT:
1890         l_x = -1.f;
1891         l_y = -vf;
1892         l_z = -uf;
1893         break;
1894     case TOP_MIDDLE:
1895         l_x =  uf;
1896         l_y = -vf;
1897         l_z = -1.f;
1898         break;
1899     case TOP_RIGHT:
1900         l_x =  1.f;
1901         l_y = -vf;
1902         l_z =  uf;
1903         break;
1904     case BOTTOM_LEFT:
1905         l_x = -vf;
1906         l_y = -1.f;
1907         l_z =  uf;
1908         break;
1909     case BOTTOM_MIDDLE:
1910         l_x = -vf;
1911         l_y =  uf;
1912         l_z =  1.f;
1913         break;
1914     case BOTTOM_RIGHT:
1915         l_x = -vf;
1916         l_y =  1.f;
1917         l_z = -uf;
1918         break;
1919     default:
1920         av_assert0(0);
1921     }
1922
1923     vec[0] = l_x;
1924     vec[1] = l_y;
1925     vec[2] = l_z;
1926
1927     normalize_vector(vec);
1928 }
1929
1930 /**
1931  * Calculate frame position in equi-angular cubemap format for corresponding 3D coordinates on sphere.
1932  *
1933  * @param s filter private context
1934  * @param vec coordinates on sphere
1935  * @param width frame width
1936  * @param height frame height
1937  * @param us horizontal coordinates for interpolation window
1938  * @param vs vertical coordinates for interpolation window
1939  * @param du horizontal relative coordinate
1940  * @param dv vertical relative coordinate
1941  */
1942 static void xyz_to_eac(const V360Context *s,
1943                        const float *vec, int width, int height,
1944                        uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
1945 {
1946     const float pixel_pad = 2;
1947     const float u_pad = pixel_pad / width;
1948     const float v_pad = pixel_pad / height;
1949
1950     float uf, vf;
1951     int ui, vi;
1952     int direction, face;
1953     int u_face, v_face;
1954
1955     xyz_to_cube(s, vec, &uf, &vf, &direction);
1956
1957     face = s->in_cubemap_face_order[direction];
1958     u_face = face % 3;
1959     v_face = face / 3;
1960
1961     uf = M_2_PI * atanf(uf) + 0.5f;
1962     vf = M_2_PI * atanf(vf) + 0.5f;
1963
1964     // These formulas are inversed from eac_to_xyz ones
1965     uf = (uf + u_face) * (1.f - 2.f * u_pad) / 3.f + u_pad;
1966     vf = vf * (0.5f - 2.f * v_pad) + v_pad + 0.5f * v_face;
1967
1968     uf *= width;
1969     vf *= height;
1970
1971     uf -= 0.5f;
1972     vf -= 0.5f;
1973
1974     ui = floorf(uf);
1975     vi = floorf(vf);
1976
1977     *du = uf - ui;
1978     *dv = vf - vi;
1979
1980     for (int i = -1; i < 3; i++) {
1981         for (int j = -1; j < 3; j++) {
1982             us[i + 1][j + 1] = av_clip(ui + j, 0, width  - 1);
1983             vs[i + 1][j + 1] = av_clip(vi + i, 0, height - 1);
1984         }
1985     }
1986 }
1987
1988 /**
1989  * Prepare data for processing flat output format.
1990  *
1991  * @param ctx filter context
1992  *
1993  * @return error code
1994  */
1995 static int prepare_flat_out(AVFilterContext *ctx)
1996 {
1997     V360Context *s = ctx->priv;
1998
1999     const float h_angle = 0.5f * s->h_fov * M_PI / 180.f;
2000     const float v_angle = 0.5f * s->v_fov * M_PI / 180.f;
2001
2002     s->flat_range[0] = tanf(h_angle);
2003     s->flat_range[1] = tanf(v_angle);
2004
2005     return 0;
2006 }
2007
2008 /**
2009  * Calculate 3D coordinates on sphere for corresponding frame position in flat format.
2010  *
2011  * @param s filter private context
2012  * @param i horizontal position on frame [0, width)
2013  * @param j vertical position on frame [0, height)
2014  * @param width frame width
2015  * @param height frame height
2016  * @param vec coordinates on sphere
2017  */
2018 static void flat_to_xyz(const V360Context *s,
2019                         int i, int j, int width, int height,
2020                         float *vec)
2021 {
2022     const float l_x =  s->flat_range[0] * (2.f * i / width  - 1.f);
2023     const float l_y = -s->flat_range[1] * (2.f * j / height - 1.f);
2024
2025     vec[0] =  l_x;
2026     vec[1] =  l_y;
2027     vec[2] = -1.f;
2028
2029     normalize_vector(vec);
2030 }
2031
2032 /**
2033  * Calculate 3D coordinates on sphere for corresponding frame position in dual fisheye format.
2034  *
2035  * @param s filter private context
2036  * @param i horizontal position on frame [0, width)
2037  * @param j vertical position on frame [0, height)
2038  * @param width frame width
2039  * @param height frame height
2040  * @param vec coordinates on sphere
2041  */
2042 static void dfisheye_to_xyz(const V360Context *s,
2043                             int i, int j, int width, int height,
2044                             float *vec)
2045 {
2046     const float scale = 1.f + s->out_pad;
2047
2048     const float ew = width / 2.f;
2049     const float eh = height;
2050
2051     const int ei = i >= ew ? i - ew : i;
2052     const float m = i >= ew ? -1.f : 1.f;
2053
2054     const float uf = ((2.f * ei) / ew - 1.f) * scale;
2055     const float vf = ((2.f *  j) / eh - 1.f) * scale;
2056
2057     const float phi   = M_PI + atan2f(vf, uf * m);
2058     const float theta = m * M_PI_2 * (1.f - hypotf(uf, vf));
2059
2060     const float sin_phi   = sinf(phi);
2061     const float cos_phi   = cosf(phi);
2062     const float sin_theta = sinf(theta);
2063     const float cos_theta = cosf(theta);
2064
2065     vec[0] = cos_theta * cos_phi;
2066     vec[1] = cos_theta * sin_phi;
2067     vec[2] = sin_theta;
2068
2069     normalize_vector(vec);
2070 }
2071
2072 /**
2073  * Calculate frame position in dual fisheye format for corresponding 3D coordinates on sphere.
2074  *
2075  * @param s filter private context
2076  * @param vec coordinates on sphere
2077  * @param width frame width
2078  * @param height frame height
2079  * @param us horizontal coordinates for interpolation window
2080  * @param vs vertical coordinates for interpolation window
2081  * @param du horizontal relative coordinate
2082  * @param dv vertical relative coordinate
2083  */
2084 static void xyz_to_dfisheye(const V360Context *s,
2085                             const float *vec, int width, int height,
2086                             uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
2087 {
2088     const float scale = 1.f - s->in_pad;
2089
2090     const float ew = width / 2.f;
2091     const float eh = height;
2092
2093     const float phi   = atan2f(-vec[1], -vec[0]) * s->input_mirror_modifier[0];
2094     const float theta = acosf(fabsf(vec[2])) / M_PI * s->input_mirror_modifier[1];
2095
2096     float uf = (theta * cosf(phi) * scale + 0.5f) * ew;
2097     float vf = (theta * sinf(phi) * scale + 0.5f) * eh;
2098
2099     int ui, vi;
2100     int u_shift;
2101
2102     if (vec[2] >= 0) {
2103         u_shift = 0;
2104     } else {
2105         u_shift = ceilf(ew);
2106         uf = ew - uf;
2107     }
2108
2109     ui = floorf(uf);
2110     vi = floorf(vf);
2111
2112     *du = uf - ui;
2113     *dv = vf - vi;
2114
2115     for (int i = -1; i < 3; i++) {
2116         for (int j = -1; j < 3; j++) {
2117             us[i + 1][j + 1] = av_clip(u_shift + ui + j, 0, width  - 1);
2118             vs[i + 1][j + 1] = av_clip(          vi + i, 0, height - 1);
2119         }
2120     }
2121 }
2122
2123 /**
2124  * Calculate 3D coordinates on sphere for corresponding frame position in barrel facebook's format.
2125  *
2126  * @param s filter private context
2127  * @param i horizontal position on frame [0, width)
2128  * @param j vertical position on frame [0, height)
2129  * @param width frame width
2130  * @param height frame height
2131  * @param vec coordinates on sphere
2132  */
2133 static void barrel_to_xyz(const V360Context *s,
2134                           int i, int j, int width, int height,
2135                           float *vec)
2136 {
2137     const float scale = 0.99f;
2138     float l_x, l_y, l_z;
2139
2140     if (i < 4 * width / 5) {
2141         const float theta_range = M_PI_4;
2142
2143         const int ew = 4 * width / 5;
2144         const int eh = height;
2145
2146         const float phi   = ((2.f * i) / ew - 1.f) * M_PI        / scale;
2147         const float theta = ((2.f * j) / eh - 1.f) * theta_range / scale;
2148
2149         const float sin_phi   = sinf(phi);
2150         const float cos_phi   = cosf(phi);
2151         const float sin_theta = sinf(theta);
2152         const float cos_theta = cosf(theta);
2153
2154         l_x =  cos_theta * sin_phi;
2155         l_y = -sin_theta;
2156         l_z = -cos_theta * cos_phi;
2157     } else {
2158         const int ew = width  / 5;
2159         const int eh = height / 2;
2160
2161         float uf, vf;
2162
2163         if (j < eh) {   // UP
2164             uf = 2.f * (i - 4 * ew) / ew  - 1.f;
2165             vf = 2.f * (j         ) / eh - 1.f;
2166
2167             uf /= scale;
2168             vf /= scale;
2169
2170             l_x =  uf;
2171             l_y =  1.f;
2172             l_z = -vf;
2173         } else {            // DOWN
2174             uf = 2.f * (i - 4 * ew) / ew - 1.f;
2175             vf = 2.f * (j -     eh) / eh - 1.f;
2176
2177             uf /= scale;
2178             vf /= scale;
2179
2180             l_x =  uf;
2181             l_y = -1.f;
2182             l_z =  vf;
2183         }
2184     }
2185
2186     vec[0] = l_x;
2187     vec[1] = l_y;
2188     vec[2] = l_z;
2189
2190     normalize_vector(vec);
2191 }
2192
2193 /**
2194  * Calculate frame position in barrel facebook's format for corresponding 3D coordinates on sphere.
2195  *
2196  * @param s filter private context
2197  * @param vec coordinates on sphere
2198  * @param width frame width
2199  * @param height frame height
2200  * @param us horizontal coordinates for interpolation window
2201  * @param vs vertical coordinates for interpolation window
2202  * @param du horizontal relative coordinate
2203  * @param dv vertical relative coordinate
2204  */
2205 static void xyz_to_barrel(const V360Context *s,
2206                           const float *vec, int width, int height,
2207                           uint16_t us[4][4], uint16_t vs[4][4], float *du, float *dv)
2208 {
2209     const float scale = 0.99f;
2210
2211     const float phi   = atan2f(vec[0], -vec[2]) * s->input_mirror_modifier[0];
2212     const float theta = asinf(-vec[1]) * s->input_mirror_modifier[1];
2213     const float theta_range = M_PI_4;
2214
2215     int ew, eh;
2216     int u_shift, v_shift;
2217     float uf, vf;
2218     int ui, vi;
2219
2220     if (theta > -theta_range && theta < theta_range) {
2221         ew = 4 * width / 5;
2222         eh = height;
2223
2224         u_shift = s->ih_flip ? width / 5 : 0;
2225         v_shift = 0;
2226
2227         uf = (phi   / M_PI        * scale + 1.f) * ew / 2.f;
2228         vf = (theta / theta_range * scale + 1.f) * eh / 2.f;
2229     } else {
2230         ew = width  / 5;
2231         eh = height / 2;
2232
2233         u_shift = s->ih_flip ? 0 : 4 * ew;
2234
2235         if (theta < 0.f) {  // UP
2236             uf =  vec[0] / vec[1];
2237             vf = -vec[2] / vec[1];
2238             v_shift = 0;
2239         } else {            // DOWN
2240             uf = -vec[0] / vec[1];
2241             vf = -vec[2] / vec[1];
2242             v_shift = eh;
2243         }
2244
2245         uf *= s->input_mirror_modifier[0] * s->input_mirror_modifier[1];
2246         vf *= s->input_mirror_modifier[1];
2247
2248         uf = 0.5f * ew * (uf * scale + 1.f);
2249         vf = 0.5f * eh * (vf * scale + 1.f);
2250     }
2251
2252     ui = floorf(uf);
2253     vi = floorf(vf);
2254
2255     *du = uf - ui;
2256     *dv = vf - vi;
2257
2258     for (int i = -1; i < 3; i++) {
2259         for (int j = -1; j < 3; j++) {
2260             us[i + 1][j + 1] = u_shift + av_clip(ui + j, 0, ew - 1);
2261             vs[i + 1][j + 1] = v_shift + av_clip(vi + i, 0, eh - 1);
2262         }
2263     }
2264 }
2265
2266 static void multiply_matrix(float c[3][3], const float a[3][3], const float b[3][3])
2267 {
2268     for (int i = 0; i < 3; i++) {
2269         for (int j = 0; j < 3; j++) {
2270             float sum = 0;
2271
2272             for (int k = 0; k < 3; k++)
2273                 sum += a[i][k] * b[k][j];
2274
2275             c[i][j] = sum;
2276         }
2277     }
2278 }
2279
2280 /**
2281  * Calculate rotation matrix for yaw/pitch/roll angles.
2282  */
2283 static inline void calculate_rotation_matrix(float yaw, float pitch, float roll,
2284                                              float rot_mat[3][3],
2285                                              const int rotation_order[3])
2286 {
2287     const float yaw_rad   = yaw   * M_PI / 180.f;
2288     const float pitch_rad = pitch * M_PI / 180.f;
2289     const float roll_rad  = roll  * M_PI / 180.f;
2290
2291     const float sin_yaw   = sinf(-yaw_rad);
2292     const float cos_yaw   = cosf(-yaw_rad);
2293     const float sin_pitch = sinf(pitch_rad);
2294     const float cos_pitch = cosf(pitch_rad);
2295     const float sin_roll  = sinf(roll_rad);
2296     const float cos_roll  = cosf(roll_rad);
2297
2298     float m[3][3][3];
2299     float temp[3][3];
2300
2301     m[0][0][0] =  cos_yaw;  m[0][0][1] = 0;          m[0][0][2] =  sin_yaw;
2302     m[0][1][0] =  0;        m[0][1][1] = 1;          m[0][1][2] =  0;
2303     m[0][2][0] = -sin_yaw;  m[0][2][1] = 0;          m[0][2][2] =  cos_yaw;
2304
2305     m[1][0][0] = 1;         m[1][0][1] = 0;          m[1][0][2] =  0;
2306     m[1][1][0] = 0;         m[1][1][1] = cos_pitch;  m[1][1][2] = -sin_pitch;
2307     m[1][2][0] = 0;         m[1][2][1] = sin_pitch;  m[1][2][2] =  cos_pitch;
2308
2309     m[2][0][0] = cos_roll;  m[2][0][1] = -sin_roll;  m[2][0][2] =  0;
2310     m[2][1][0] = sin_roll;  m[2][1][1] =  cos_roll;  m[2][1][2] =  0;
2311     m[2][2][0] = 0;         m[2][2][1] =  0;         m[2][2][2] =  1;
2312
2313     multiply_matrix(temp, m[rotation_order[0]], m[rotation_order[1]]);
2314     multiply_matrix(rot_mat, temp, m[rotation_order[2]]);
2315 }
2316
2317 /**
2318  * Rotate vector with given rotation matrix.
2319  *
2320  * @param rot_mat rotation matrix
2321  * @param vec vector
2322  */
2323 static inline void rotate(const float rot_mat[3][3],
2324                           float *vec)
2325 {
2326     const float x_tmp = vec[0] * rot_mat[0][0] + vec[1] * rot_mat[0][1] + vec[2] * rot_mat[0][2];
2327     const float y_tmp = vec[0] * rot_mat[1][0] + vec[1] * rot_mat[1][1] + vec[2] * rot_mat[1][2];
2328     const float z_tmp = vec[0] * rot_mat[2][0] + vec[1] * rot_mat[2][1] + vec[2] * rot_mat[2][2];
2329
2330     vec[0] = x_tmp;
2331     vec[1] = y_tmp;
2332     vec[2] = z_tmp;
2333 }
2334
2335 static inline void set_mirror_modifier(int h_flip, int v_flip, int d_flip,
2336                                        float *modifier)
2337 {
2338     modifier[0] = h_flip ? -1.f : 1.f;
2339     modifier[1] = v_flip ? -1.f : 1.f;
2340     modifier[2] = d_flip ? -1.f : 1.f;
2341 }
2342
2343 static inline void mirror(const float *modifier, float *vec)
2344 {
2345     vec[0] *= modifier[0];
2346     vec[1] *= modifier[1];
2347     vec[2] *= modifier[2];
2348 }
2349
2350 static int allocate_plane(V360Context *s, int sizeof_uv, int sizeof_ker, int p)
2351 {
2352     s->u[p] = av_calloc(s->uv_linesize[p] * s->pr_height[p], sizeof_uv);
2353     s->v[p] = av_calloc(s->uv_linesize[p] * s->pr_height[p], sizeof_uv);
2354     if (!s->u[p] || !s->v[p])
2355         return AVERROR(ENOMEM);
2356     if (sizeof_ker) {
2357         s->ker[p] = av_calloc(s->uv_linesize[p] * s->pr_height[p], sizeof_ker);
2358         if (!s->ker[p])
2359             return AVERROR(ENOMEM);
2360     }
2361
2362     return 0;
2363 }
2364
2365 static void fov_from_dfov(V360Context *s, float w, float h)
2366 {
2367     const float da = tanf(0.5 * FFMIN(s->d_fov, 359.f) * M_PI / 180.f);
2368     const float d = hypotf(w, h);
2369
2370     s->h_fov = atan2f(da * w, d) * 360.f / M_PI;
2371     s->v_fov = atan2f(da * h, d) * 360.f / M_PI;
2372
2373     if (s->h_fov < 0.f)
2374         s->h_fov += 360.f;
2375     if (s->v_fov < 0.f)
2376         s->v_fov += 360.f;
2377 }
2378
2379 static void set_dimensions(int *outw, int *outh, int w, int h, const AVPixFmtDescriptor *desc)
2380 {
2381     outw[1] = outw[2] = FF_CEIL_RSHIFT(w, desc->log2_chroma_w);
2382     outw[0] = outw[3] = w;
2383     outh[1] = outh[2] = FF_CEIL_RSHIFT(h, desc->log2_chroma_h);
2384     outh[0] = outh[3] = h;
2385 }
2386
2387 // Calculate remap data
2388 static av_always_inline int v360_slice(AVFilterContext *ctx, void *arg, int jobnr, int nb_jobs)
2389 {
2390     V360Context *s = ctx->priv;
2391
2392     for (int p = 0; p < s->nb_allocated; p++) {
2393         const int width = s->pr_width[p];
2394         const int uv_linesize = s->uv_linesize[p];
2395         const int height = s->pr_height[p];
2396         const int in_width = s->inplanewidth[p];
2397         const int in_height = s->inplaneheight[p];
2398         const int slice_start = (height *  jobnr     ) / nb_jobs;
2399         const int slice_end   = (height * (jobnr + 1)) / nb_jobs;
2400         float du, dv;
2401         float vec[3];
2402         XYRemap rmap;
2403
2404         for (int j = slice_start; j < slice_end; j++) {
2405             for (int i = 0; i < width; i++) {
2406                 uint16_t *u = s->u[p] + (j * uv_linesize + i) * s->elements;
2407                 uint16_t *v = s->v[p] + (j * uv_linesize + i) * s->elements;
2408                 int16_t *ker = s->ker[p] + (j * uv_linesize + i) * s->elements;
2409
2410                 if (s->out_transpose)
2411                     s->out_transform(s, j, i, height, width, vec);
2412                 else
2413                     s->out_transform(s, i, j, width, height, vec);
2414                 av_assert1(!isnan(vec[0]) && !isnan(vec[1]) && !isnan(vec[2]));
2415                 rotate(s->rot_mat, vec);
2416                 av_assert1(!isnan(vec[0]) && !isnan(vec[1]) && !isnan(vec[2]));
2417                 normalize_vector(vec);
2418                 mirror(s->output_mirror_modifier, vec);
2419                 if (s->in_transpose)
2420                     s->in_transform(s, vec, in_height, in_width, rmap.v, rmap.u, &du, &dv);
2421                 else
2422                     s->in_transform(s, vec, in_width, in_height, rmap.u, rmap.v, &du, &dv);
2423                 av_assert1(!isnan(du) && !isnan(dv));
2424                 s->calculate_kernel(du, dv, &rmap, u, v, ker);
2425             }
2426         }
2427     }
2428
2429     return 0;
2430 }
2431
2432 static int config_output(AVFilterLink *outlink)
2433 {
2434     AVFilterContext *ctx = outlink->src;
2435     AVFilterLink *inlink = ctx->inputs[0];
2436     V360Context *s = ctx->priv;
2437     const AVPixFmtDescriptor *desc = av_pix_fmt_desc_get(inlink->format);
2438     const int depth = desc->comp[0].depth;
2439     int sizeof_uv;
2440     int sizeof_ker;
2441     int err;
2442     int h, w;
2443     int in_offset_h, in_offset_w;
2444     int out_offset_h, out_offset_w;
2445     float hf, wf;
2446     int (*prepare_out)(AVFilterContext *ctx);
2447
2448     s->input_mirror_modifier[0] = s->ih_flip ? -1.f : 1.f;
2449     s->input_mirror_modifier[1] = s->iv_flip ? -1.f : 1.f;
2450
2451     switch (s->interp) {
2452     case NEAREST:
2453         s->calculate_kernel = nearest_kernel;
2454         s->remap_slice = depth <= 8 ? remap1_8bit_slice : remap1_16bit_slice;
2455         s->elements = 1;
2456         sizeof_uv = sizeof(uint16_t) * s->elements;
2457         sizeof_ker = 0;
2458         break;
2459     case BILINEAR:
2460         s->calculate_kernel = bilinear_kernel;
2461         s->remap_slice = depth <= 8 ? remap2_8bit_slice : remap2_16bit_slice;
2462         s->elements = 2 * 2;
2463         sizeof_uv = sizeof(uint16_t) * s->elements;
2464         sizeof_ker = sizeof(uint16_t) * s->elements;
2465         break;
2466     case BICUBIC:
2467         s->calculate_kernel = bicubic_kernel;
2468         s->remap_slice = depth <= 8 ? remap4_8bit_slice : remap4_16bit_slice;
2469         s->elements = 4 * 4;
2470         sizeof_uv = sizeof(uint16_t) * s->elements;
2471         sizeof_ker = sizeof(uint16_t) * s->elements;
2472         break;
2473     case LANCZOS:
2474         s->calculate_kernel = lanczos_kernel;
2475         s->remap_slice = depth <= 8 ? remap4_8bit_slice : remap4_16bit_slice;
2476         s->elements = 4 * 4;
2477         sizeof_uv = sizeof(uint16_t) * s->elements;
2478         sizeof_ker = sizeof(uint16_t) * s->elements;
2479         break;
2480     default:
2481         av_assert0(0);
2482     }
2483
2484     ff_v360_init(s, depth);
2485
2486     for (int order = 0; order < NB_RORDERS; order++) {
2487         const char c = s->rorder[order];
2488         int rorder;
2489
2490         if (c == '\0') {
2491             av_log(ctx, AV_LOG_ERROR,
2492                    "Incomplete rorder option. Direction for all 3 rotation orders should be specified.\n");
2493             return AVERROR(EINVAL);
2494         }
2495
2496         rorder = get_rorder(c);
2497         if (rorder == -1) {
2498             av_log(ctx, AV_LOG_ERROR,
2499                    "Incorrect rotation order symbol '%c' in rorder option.\n", c);
2500             return AVERROR(EINVAL);
2501         }
2502
2503         s->rotation_order[order] = rorder;
2504     }
2505
2506     switch (s->in_stereo) {
2507     case STEREO_2D:
2508         w = inlink->w;
2509         h = inlink->h;
2510         in_offset_w = in_offset_h = 0;
2511         break;
2512     case STEREO_SBS:
2513         w = inlink->w / 2;
2514         h = inlink->h;
2515         in_offset_w = w;
2516         in_offset_h = 0;
2517         break;
2518     case STEREO_TB:
2519         w = inlink->w;
2520         h = inlink->h / 2;
2521         in_offset_w = 0;
2522         in_offset_h = h;
2523         break;
2524     default:
2525         av_assert0(0);
2526     }
2527
2528     set_dimensions(s->inplanewidth, s->inplaneheight, w, h, desc);
2529     set_dimensions(s->in_offset_w, s->in_offset_h, in_offset_w, in_offset_h, desc);
2530
2531     switch (s->in) {
2532     case EQUIRECTANGULAR:
2533         s->in_transform = xyz_to_equirect;
2534         err = 0;
2535         wf = w;
2536         hf = h;
2537         break;
2538     case CUBEMAP_3_2:
2539         s->in_transform = xyz_to_cube3x2;
2540         err = prepare_cube_in(ctx);
2541         wf = w / 3.f * 4.f;
2542         hf = h;
2543         break;
2544     case CUBEMAP_1_6:
2545         s->in_transform = xyz_to_cube1x6;
2546         err = prepare_cube_in(ctx);
2547         wf = w * 4.f;
2548         hf = h / 3.f;
2549         break;
2550     case CUBEMAP_6_1:
2551         s->in_transform = xyz_to_cube6x1;
2552         err = prepare_cube_in(ctx);
2553         wf = w / 3.f * 2.f;
2554         hf = h * 2.f;
2555         break;
2556     case EQUIANGULAR:
2557         s->in_transform = xyz_to_eac;
2558         err = prepare_eac_in(ctx);
2559         wf = w;
2560         hf = h / 9.f * 8.f;
2561         break;
2562     case FLAT:
2563         av_log(ctx, AV_LOG_ERROR, "Flat format is not accepted as input.\n");
2564         return AVERROR(EINVAL);
2565     case DUAL_FISHEYE:
2566         s->in_transform = xyz_to_dfisheye;
2567         err = 0;
2568         wf = w;
2569         hf = h;
2570         break;
2571     case BARREL:
2572         s->in_transform = xyz_to_barrel;
2573         err = 0;
2574         wf = w / 5.f * 4.f;
2575         hf = h;
2576         break;
2577     case STEREOGRAPHIC:
2578         s->in_transform = xyz_to_stereographic;
2579         err = 0;
2580         wf = w;
2581         hf = h / 2.f;
2582         break;
2583     case MERCATOR:
2584         s->in_transform = xyz_to_mercator;
2585         err = 0;
2586         wf = w;
2587         hf = h;
2588         break;
2589     case BALL:
2590         s->in_transform = xyz_to_ball;
2591         err = 0;
2592         wf = w;
2593         hf = h / 2.f;
2594         break;
2595     case HAMMER:
2596         s->in_transform = xyz_to_hammer;
2597         err = 0;
2598         wf = w;
2599         hf = h;
2600         break;
2601     default:
2602         av_log(ctx, AV_LOG_ERROR, "Specified input format is not handled.\n");
2603         return AVERROR_BUG;
2604     }
2605
2606     if (err != 0) {
2607         return err;
2608     }
2609
2610     switch (s->out) {
2611     case EQUIRECTANGULAR:
2612         s->out_transform = equirect_to_xyz;
2613         prepare_out = NULL;
2614         w = roundf(wf);
2615         h = roundf(hf);
2616         break;
2617     case CUBEMAP_3_2:
2618         s->out_transform = cube3x2_to_xyz;
2619         prepare_out = prepare_cube_out;
2620         w = roundf(wf / 4.f * 3.f);
2621         h = roundf(hf);
2622         break;
2623     case CUBEMAP_1_6:
2624         s->out_transform = cube1x6_to_xyz;
2625         prepare_out = prepare_cube_out;
2626         w = roundf(wf / 4.f);
2627         h = roundf(hf * 3.f);
2628         break;
2629     case CUBEMAP_6_1:
2630         s->out_transform = cube6x1_to_xyz;
2631         prepare_out = prepare_cube_out;
2632         w = roundf(wf / 2.f * 3.f);
2633         h = roundf(hf / 2.f);
2634         break;
2635     case EQUIANGULAR:
2636         s->out_transform = eac_to_xyz;
2637         prepare_out = prepare_eac_out;
2638         w = roundf(wf);
2639         h = roundf(hf / 8.f * 9.f);
2640         break;
2641     case FLAT:
2642         s->out_transform = flat_to_xyz;
2643         prepare_out = prepare_flat_out;
2644         w = roundf(wf);
2645         h = roundf(hf);
2646         break;
2647     case DUAL_FISHEYE:
2648         s->out_transform = dfisheye_to_xyz;
2649         prepare_out = NULL;
2650         w = roundf(wf);
2651         h = roundf(hf);
2652         break;
2653     case BARREL:
2654         s->out_transform = barrel_to_xyz;
2655         prepare_out = NULL;
2656         w = roundf(wf / 4.f * 5.f);
2657         h = roundf(hf);
2658         break;
2659     case STEREOGRAPHIC:
2660         s->out_transform = stereographic_to_xyz;
2661         prepare_out = prepare_stereographic_out;
2662         w = roundf(wf);
2663         h = roundf(hf * 2.f);
2664         break;
2665     case MERCATOR:
2666         s->out_transform = mercator_to_xyz;
2667         prepare_out = NULL;
2668         w = roundf(wf);
2669         h = roundf(hf);
2670         break;
2671     case BALL:
2672         s->out_transform = ball_to_xyz;
2673         prepare_out = NULL;
2674         w = roundf(wf);
2675         h = roundf(hf * 2.f);
2676         break;
2677     case HAMMER:
2678         s->out_transform = hammer_to_xyz;
2679         prepare_out = NULL;
2680         w = roundf(wf);
2681         h = roundf(hf);
2682         break;
2683     default:
2684         av_log(ctx, AV_LOG_ERROR, "Specified output format is not handled.\n");
2685         return AVERROR_BUG;
2686     }
2687
2688     // Override resolution with user values if specified
2689     if (s->width > 0 && s->height > 0) {
2690         w = s->width;
2691         h = s->height;
2692     } else if (s->width > 0 || s->height > 0) {
2693         av_log(ctx, AV_LOG_ERROR, "Both width and height values should be specified.\n");
2694         return AVERROR(EINVAL);
2695     } else {
2696         if (s->out_transpose)
2697             FFSWAP(int, w, h);
2698
2699         if (s->in_transpose)
2700             FFSWAP(int, w, h);
2701     }
2702
2703     if (s->d_fov > 0.f)
2704         fov_from_dfov(s, w, h);
2705
2706     if (prepare_out) {
2707         err = prepare_out(ctx);
2708         if (err != 0)
2709             return err;
2710     }
2711
2712     set_dimensions(s->pr_width, s->pr_height, w, h, desc);
2713
2714     switch (s->out_stereo) {
2715     case STEREO_2D:
2716         out_offset_w = out_offset_h = 0;
2717         break;
2718     case STEREO_SBS:
2719         out_offset_w = w;
2720         out_offset_h = 0;
2721         w *= 2;
2722         break;
2723     case STEREO_TB:
2724         out_offset_w = 0;
2725         out_offset_h = h;
2726         h *= 2;
2727         break;
2728     default:
2729         av_assert0(0);
2730     }
2731
2732     set_dimensions(s->out_offset_w, s->out_offset_h, out_offset_w, out_offset_h, desc);
2733     set_dimensions(s->planewidth, s->planeheight, w, h, desc);
2734
2735     for (int i = 0; i < 4; i++)
2736         s->uv_linesize[i] = FFALIGN(s->pr_width[i], 8);
2737
2738     outlink->h = h;
2739     outlink->w = w;
2740
2741     s->nb_planes = av_pix_fmt_count_planes(inlink->format);
2742
2743     if (desc->log2_chroma_h == desc->log2_chroma_w && desc->log2_chroma_h == 0) {
2744         s->nb_allocated = 1;
2745         s->map[0] = s->map[1] = s->map[2] = s->map[3] = 0;
2746     } else {
2747         s->nb_allocated = 2;
2748         s->map[0] = 0;
2749         s->map[1] = s->map[2] = 1;
2750         s->map[3] = 0;
2751     }
2752
2753     for (int i = 0; i < s->nb_allocated; i++)
2754         allocate_plane(s, sizeof_uv, sizeof_ker, i);
2755
2756     calculate_rotation_matrix(s->yaw, s->pitch, s->roll, s->rot_mat, s->rotation_order);
2757     set_mirror_modifier(s->h_flip, s->v_flip, s->d_flip, s->output_mirror_modifier);
2758
2759     ctx->internal->execute(ctx, v360_slice, NULL, NULL, FFMIN(outlink->h, ff_filter_get_nb_threads(ctx)));
2760
2761     return 0;
2762 }
2763
2764 static int filter_frame(AVFilterLink *inlink, AVFrame *in)
2765 {
2766     AVFilterContext *ctx = inlink->dst;
2767     AVFilterLink *outlink = ctx->outputs[0];
2768     V360Context *s = ctx->priv;
2769     AVFrame *out;
2770     ThreadData td;
2771
2772     out = ff_get_video_buffer(outlink, outlink->w, outlink->h);
2773     if (!out) {
2774         av_frame_free(&in);
2775         return AVERROR(ENOMEM);
2776     }
2777     av_frame_copy_props(out, in);
2778
2779     td.in = in;
2780     td.out = out;
2781
2782     ctx->internal->execute(ctx, s->remap_slice, &td, NULL, FFMIN(outlink->h, ff_filter_get_nb_threads(ctx)));
2783
2784     av_frame_free(&in);
2785     return ff_filter_frame(outlink, out);
2786 }
2787
2788 static av_cold void uninit(AVFilterContext *ctx)
2789 {
2790     V360Context *s = ctx->priv;
2791
2792     for (int p = 0; p < s->nb_allocated; p++) {
2793         av_freep(&s->u[p]);
2794         av_freep(&s->v[p]);
2795         av_freep(&s->ker[p]);
2796     }
2797 }
2798
2799 static const AVFilterPad inputs[] = {
2800     {
2801         .name         = "default",
2802         .type         = AVMEDIA_TYPE_VIDEO,
2803         .filter_frame = filter_frame,
2804     },
2805     { NULL }
2806 };
2807
2808 static const AVFilterPad outputs[] = {
2809     {
2810         .name         = "default",
2811         .type         = AVMEDIA_TYPE_VIDEO,
2812         .config_props = config_output,
2813     },
2814     { NULL }
2815 };
2816
2817 AVFilter ff_vf_v360 = {
2818     .name          = "v360",
2819     .description   = NULL_IF_CONFIG_SMALL("Convert 360 projection of video."),
2820     .priv_size     = sizeof(V360Context),
2821     .uninit        = uninit,
2822     .query_formats = query_formats,
2823     .inputs        = inputs,
2824     .outputs       = outputs,
2825     .priv_class    = &v360_class,
2826     .flags         = AVFILTER_FLAG_SLICE_THREADS,
2827 };