git.sesse.net Git - casparcg/blob - modules/ffmpeg/producer/util/util.cpp

   1 #include "../../stdafx.h"\r
   2 \r
   3 #include "util.h"\r
   4 \r
   5 #include "flv.h"\r
   6 \r
   7 #include "../tbb_avcodec.h"\r
   8 #include "../../ffmpeg_error.h"\r
   9 \r
  10 #include <tbb/concurrent_unordered_map.h>\r
  11 #include <tbb/concurrent_queue.h>\r
  12 \r
  13 #include <core/producer/frame/frame_transform.h>\r
  14 #include <core/producer/frame/frame_factory.h>\r
  15 #include <core/producer/frame_producer.h>\r
  16 #include <core/mixer/write_frame.h>\r
  17 \r
  18 #include <common/exception/exceptions.h>\r
  19 #include <common/utility/assert.h>\r
  20 #include <common/memory/memcpy.h>\r
  21 \r
  22 #include <tbb/parallel_for.h>\r
  23 \r
  24 #include <boost/filesystem.hpp>\r
  25 #include <boost/lexical_cast.hpp>\r
  26 \r
  27 #if defined(_MSC_VER)\r
  28 #pragma warning (push)\r
  29 #pragma warning (disable : 4244)\r
  30 #endif\r
  31 extern "C" \r
  32 {\r
  33         #include <libswscale/swscale.h>\r
  34         #include <libavcodec/avcodec.h>\r
  35         #include <libavformat/avformat.h>\r
  36 }\r
  37 #if defined(_MSC_VER)\r
  38 #pragma warning (pop)\r
  39 #endif\r
  40 \r
  41 namespace caspar { namespace ffmpeg {\r
  42                 \r
  43 safe_ptr<AVPacket> flush_packet()\r
  44 {\r
  45         static auto packet = create_packet();\r
  46         return packet;\r
  47 }\r
  48 \r
  49 std::shared_ptr<core::audio_buffer> flush_audio()\r
  50 {\r
  51         static std::shared_ptr<core::audio_buffer> audio(new core::audio_buffer());\r
  52         return audio;\r
  53 }\r
  54 \r
  55 std::shared_ptr<core::audio_buffer> empty_audio()\r
  56 {\r
  57         static std::shared_ptr<core::audio_buffer> audio(new core::audio_buffer());\r
  58         return audio;\r
  59 }\r
  60 \r
  61 std::shared_ptr<AVFrame>                        flush_video()\r
  62 {\r
  63         static std::shared_ptr<AVFrame> video(avcodec_alloc_frame(), av_free);\r
  64         return video;\r
  65 }\r
  66 \r
  67 std::shared_ptr<AVFrame>                        empty_video()\r
  68 {\r
  69         static std::shared_ptr<AVFrame> video(avcodec_alloc_frame(), av_free);\r
  70         return video;\r
  71 }\r
  72 \r
  73 core::field_mode::type get_mode(const AVFrame& frame)\r
  74 {\r
  75         if(!frame.interlaced_frame)\r
  76                 return core::field_mode::progressive;\r
  77 \r
  78         return frame.top_field_first ? core::field_mode::upper : core::field_mode::lower;\r
  79 }\r
  80 \r
  81 core::pixel_format::type get_pixel_format(PixelFormat pix_fmt)\r
  82 {\r
  83         switch(pix_fmt)\r
  84         {\r
  85         case CASPAR_PIX_FMT_LUMA:       return core::pixel_format::luma;\r
  86         case PIX_FMT_GRAY8:                     return core::pixel_format::gray;\r
  87         case PIX_FMT_BGRA:                      return core::pixel_format::bgra;\r
  88         case PIX_FMT_ARGB:                      return core::pixel_format::argb;\r
  89         case PIX_FMT_RGBA:                      return core::pixel_format::rgba;\r
  90         case PIX_FMT_ABGR:                      return core::pixel_format::abgr;\r
  91         case PIX_FMT_YUV444P:           return core::pixel_format::ycbcr;\r
  92         case PIX_FMT_YUV422P:           return core::pixel_format::ycbcr;\r
  93         case PIX_FMT_YUV420P:           return core::pixel_format::ycbcr;\r
  94         case PIX_FMT_YUV411P:           return core::pixel_format::ycbcr;\r
  95         case PIX_FMT_YUV410P:           return core::pixel_format::ycbcr;\r
  96         case PIX_FMT_YUVA420P:          return core::pixel_format::ycbcra;\r
  97         default:                                        return core::pixel_format::invalid;\r
  98         }\r
  99 }\r
 100 \r
 101 core::pixel_format_desc get_pixel_format_desc(PixelFormat pix_fmt, size_t width, size_t height)\r
 102 {\r
 103         // Get linesizes\r
 104         AVPicture dummy_pict;   \r
 105         avpicture_fill(&dummy_pict, nullptr, pix_fmt == CASPAR_PIX_FMT_LUMA ? PIX_FMT_GRAY8 : pix_fmt, width, height);\r
 106 \r
 107         core::pixel_format_desc desc;\r
 108         desc.pix_fmt = get_pixel_format(pix_fmt);\r
 109                 \r
 110         switch(desc.pix_fmt)\r
 111         {\r
 112         case core::pixel_format::gray:\r
 113         case core::pixel_format::luma:\r
 114                 {\r
 115                         desc.planes.push_back(core::pixel_format_desc::plane(dummy_pict.linesize[0], height, 1));                                               \r
 116                         return desc;\r
 117                 }\r
 118         case core::pixel_format::bgra:\r
 119         case core::pixel_format::argb:\r
 120         case core::pixel_format::rgba:\r
 121         case core::pixel_format::abgr:\r
 122                 {\r
 123                         desc.planes.push_back(core::pixel_format_desc::plane(dummy_pict.linesize[0]/4, height, 4));                                             \r
 124                         return desc;\r
 125                 }\r
 126         case core::pixel_format::ycbcr:\r
 127         case core::pixel_format::ycbcra:\r
 128                 {               \r
 129                         // Find chroma height\r
 130                         size_t size2 = dummy_pict.data[2] - dummy_pict.data[1];\r
 131                         size_t h2 = size2/dummy_pict.linesize[1];                       \r
 132 \r
 133                         desc.planes.push_back(core::pixel_format_desc::plane(dummy_pict.linesize[0], height, 1));\r
 134                         desc.planes.push_back(core::pixel_format_desc::plane(dummy_pict.linesize[1], h2, 1));\r
 135                         desc.planes.push_back(core::pixel_format_desc::plane(dummy_pict.linesize[2], h2, 1));\r
 136 \r
 137                         if(desc.pix_fmt == core::pixel_format::ycbcra)                                          \r
 138                                 desc.planes.push_back(core::pixel_format_desc::plane(dummy_pict.linesize[3], height, 1));       \r
 139                         return desc;\r
 140                 }               \r
 141         default:                \r
 142                 desc.pix_fmt = core::pixel_format::invalid;\r
 143                 return desc;\r
 144         }\r
 145 }\r
 146 \r
 147 int make_alpha_format(int format)\r
 148 {\r
 149         switch(get_pixel_format(static_cast<PixelFormat>(format)))\r
 150         {\r
 151         case core::pixel_format::ycbcr:\r
 152         case core::pixel_format::ycbcra:\r
 153                 return CASPAR_PIX_FMT_LUMA;\r
 154         default:\r
 155                 return format;\r
 156         }\r
 157 }\r
 158 \r
 159 safe_ptr<core::write_frame> make_write_frame(const void* tag, const safe_ptr<AVFrame>& decoded_frame, const safe_ptr<core::frame_factory>& frame_factory, int hints)\r
 160 {                       \r
 161         static tbb::concurrent_unordered_map<size_t, tbb::concurrent_queue<std::shared_ptr<SwsContext>>> sws_contexts_;\r
 162         \r
 163         if(decoded_frame->width < 1 || decoded_frame->height < 1)\r
 164                 return make_safe<core::write_frame>(tag);\r
 165 \r
 166         const auto width  = decoded_frame->width;\r
 167         const auto height = decoded_frame->height;\r
 168         auto desc                 = get_pixel_format_desc(static_cast<PixelFormat>(decoded_frame->format), width, height);\r
 169         \r
 170         if(hints & core::frame_producer::ALPHA_HINT)\r
 171                 desc = get_pixel_format_desc(static_cast<PixelFormat>(make_alpha_format(decoded_frame->format)), width, height);\r
 172 \r
 173         std::shared_ptr<core::write_frame> write;\r
 174 \r
 175         if(desc.pix_fmt == core::pixel_format::invalid)\r
 176         {\r
 177                 auto pix_fmt = static_cast<PixelFormat>(decoded_frame->format);\r
 178 \r
 179                 write = frame_factory->create_frame(tag, get_pixel_format_desc(PIX_FMT_BGRA, width, height));\r
 180                 write->set_type(get_mode(*decoded_frame));\r
 181 \r
 182                 std::shared_ptr<SwsContext> sws_context;\r
 183 \r
 184                 //CASPAR_LOG(warning) << "Hardware accelerated color transform not supported.";\r
 185 \r
 186                 size_t key = width << 20 | height << 8 | pix_fmt;\r
 187                         \r
 188                 auto& pool = sws_contexts_[key];\r
 189                                                 \r
 190                 if(!pool.try_pop(sws_context))\r
 191                 {\r
 192                         double param;\r
 193                         sws_context.reset(sws_getContext(width, height, pix_fmt, width, height, PIX_FMT_BGRA, SWS_BILINEAR, nullptr, nullptr, &param), sws_freeContext);\r
 194                 }\r
 195                         \r
 196                 if(!sws_context)\r
 197                 {\r
 198                         BOOST_THROW_EXCEPTION(operation_failed() << msg_info("Could not create software scaling context.") << \r
 199                                                                         boost::errinfo_api_function("sws_getContext"));\r
 200                 }       \r
 201 \r
 202                 // Use sws_scale when provided colorspace has no hw-accel.\r
 203                 safe_ptr<AVFrame> av_frame(avcodec_alloc_frame(), av_free);     \r
 204                 avcodec_get_frame_defaults(av_frame.get());                     \r
 205                 auto size = avpicture_fill(reinterpret_cast<AVPicture*>(av_frame.get()), write->image_data().begin(), PIX_FMT_BGRA, width, height);\r
 206                 CASPAR_VERIFY(size == write->image_data().size()); \r
 207 \r
 208                 sws_scale(sws_context.get(), decoded_frame->data, decoded_frame->linesize, 0, height, av_frame->data, av_frame->linesize);      \r
 209                 pool.push(sws_context);\r
 210 \r
 211                 write->commit();\r
 212         }\r
 213         else\r
 214         {\r
 215                 write = frame_factory->create_frame(tag, desc);\r
 216                 write->set_type(get_mode(*decoded_frame));\r
 217 \r
 218                 for(int n = 0; n < static_cast<int>(desc.planes.size()); ++n)\r
 219                 {\r
 220                         auto plane            = desc.planes[n];\r
 221                         auto result           = write->image_data(n).begin();\r
 222                         auto decoded          = decoded_frame->data[n];\r
 223                         auto decoded_linesize = decoded_frame->linesize[n];\r
 224                         \r
 225                         CASPAR_ASSERT(decoded);\r
 226                         CASPAR_ASSERT(write->image_data(n).begin());\r
 227 \r
 228                         if(decoded_linesize != static_cast<int>(plane.width))\r
 229                         {\r
 230                                 // Copy line by line since ffmpeg sometimes pads each line.\r
 231                                 tbb::parallel_for<size_t>(0, desc.planes[n].height, [&](size_t y)\r
 232                                 {\r
 233                                         fast_memcpy(result + y*plane.linesize, decoded + y*decoded_linesize, plane.linesize);\r
 234                                 });\r
 235                         }\r
 236                         else\r
 237                         {\r
 238                                 fast_memcpy(result, decoded, plane.size);\r
 239                         }\r
 240 \r
 241                         write->commit(n);\r
 242                 }\r
 243         }\r
 244 \r
 245         if(decoded_frame->height == 480) // NTSC DV\r
 246         {\r
 247                 write->get_frame_transform().fill_translation[1] += 2.0/static_cast<double>(frame_factory->get_video_format_desc().height);\r
 248                 write->get_frame_transform().fill_scale[1] = 1.0 - 6.0*1.0/static_cast<double>(frame_factory->get_video_format_desc().height);\r
 249         }\r
 250         \r
 251         // Fix field-order if needed\r
 252         if(write->get_type() == core::field_mode::lower && frame_factory->get_video_format_desc().field_mode == core::field_mode::upper)\r
 253                 write->get_frame_transform().fill_translation[1] += 1.0/static_cast<double>(frame_factory->get_video_format_desc().height);\r
 254         else if(write->get_type() == core::field_mode::upper && frame_factory->get_video_format_desc().field_mode == core::field_mode::lower)\r
 255                 write->get_frame_transform().fill_translation[1] -= 1.0/static_cast<double>(frame_factory->get_video_format_desc().height);\r
 256 \r
 257         return make_safe_ptr(write);\r
 258 }\r
 259 \r
 260 bool is_sane_fps(AVRational time_base)\r
 261 {\r
 262         double fps = static_cast<double>(time_base.den) / static_cast<double>(time_base.num);\r
 263         return fps > 20.0 && fps < 65.0;\r
 264 }\r
 265 \r
 266 AVRational fix_time_base(AVRational time_base)\r
 267 {\r
 268         if(time_base.num == 1)\r
 269                 time_base.num = static_cast<int>(std::pow(10.0, static_cast<int>(std::log10(static_cast<float>(time_base.den)))-1));    \r
 270                         \r
 271         if(!is_sane_fps(time_base))\r
 272         {\r
 273                 auto tmp = time_base;\r
 274                 tmp.den /= 2;\r
 275                 if(is_sane_fps(tmp))\r
 276                         time_base = tmp;\r
 277         }\r
 278 \r
 279         return time_base;\r
 280 }\r
 281 \r
 282 void fix_meta_data(AVFormatContext& context)\r
 283 {\r
 284         auto video_index = av_find_best_stream(&context, AVMEDIA_TYPE_VIDEO, -1, -1, 0, 0);\r
 285         auto audio_index = av_find_best_stream(&context, AVMEDIA_TYPE_AUDIO, -1, -1, 0, 0);\r
 286 \r
 287         if(video_index < 0)\r
 288                 return;\r
 289 \r
 290         auto& video_context = *context.streams[video_index]->codec;\r
 291         auto& video_stream  = *context.streams[video_index];\r
 292                                                 \r
 293         if(boost::filesystem2::path(context.filename).extension() == ".flv")\r
 294         {\r
 295                 try\r
 296                 {\r
 297                         auto meta = read_flv_meta_info(context.filename);\r
 298                         double fps = boost::lexical_cast<double>(meta["framerate"]);\r
 299                         video_context.time_base.num = 1000000;\r
 300                         video_context.time_base.den = static_cast<int>(fps*1000000.0);\r
 301                         video_stream.nb_frames = static_cast<int64_t>(boost::lexical_cast<double>(meta["duration"])*fps);\r
 302                 }\r
 303                 catch(...){}\r
 304         }\r
 305         else\r
 306         {\r
 307                 if(video_stream.nb_frames == 0)\r
 308                         video_stream.nb_frames = (video_stream.duration*video_stream.time_base.num)/video_stream.time_base.den;\r
 309                 \r
 310                 if(video_stream.nb_frames == 0)\r
 311                         video_stream.nb_frames = video_stream.duration;\r
 312 \r
 313                 video_context.time_base.num *= video_context.ticks_per_frame;\r
 314 \r
 315                 if(!is_sane_fps(video_context.time_base))\r
 316                 {                       \r
 317                         video_context.time_base = fix_time_base(video_context.time_base);\r
 318 \r
 319                         if(!is_sane_fps(video_context.time_base) && audio_index > -1)\r
 320                         {\r
 321                                 auto& audio_context = *context.streams[audio_index]->codec;\r
 322                                 auto& audio_stream  = *context.streams[audio_index];\r
 323 \r
 324                                 double duration_sec = audio_stream.duration / static_cast<double>(audio_context.sample_rate);\r
 325                                                                 \r
 326                                 video_context.time_base.num = static_cast<int>(duration_sec*100000.0);\r
 327                                 video_context.time_base.den = static_cast<int>(video_stream.nb_frames*100000);\r
 328                         }\r
 329                 }\r
 330 \r
 331                 //if(audio_index > -1) // Check for invalid double frame-rate\r
 332                 //{\r
 333                 //      auto& audio_context             = *context.streams[audio_index]->codec;\r
 334                 //      auto& audio_stream              = *context.streams[audio_index];\r
 335                 //      \r
 336                 //      double duration_sec             = audio_stream.duration / static_cast<double>(audio_context.sample_rate);\r
 337                 //      double fps                              = static_cast<double>(video_context.time_base.den) / static_cast<double>(video_context.time_base.num);\r
 338 \r
 339                 //      double fps_nb_frames    = static_cast<double>(duration_sec*fps);\r
 340                 //      double stream_nb_frames = static_cast<double>(video_stream.nb_frames);\r
 341                 //      double diff                             = std::abs(fps_nb_frames - stream_nb_frames*2.0);\r
 342                 //      if(diff < fps_nb_frames*0.05)\r
 343                 //              video_context.time_base.num *= 2;\r
 344                 //}\r
 345                 //else\r
 346                 //{\r
 347                 //      video_context.time_base.den = video_stream.r_frame_rate.num;\r
 348                 //      video_context.time_base.num = video_stream.r_frame_rate.den;\r
 349                 //}\r
 350         }\r
 351 \r
 352         double fps = static_cast<double>(video_context.time_base.den) / static_cast<double>(video_context.time_base.num);\r
 353 \r
 354         double closest_fps = 0.0;\r
 355         for(int n = 0; n < core::video_format::count; ++n)\r
 356         {\r
 357                 auto format = core::video_format_desc::get(static_cast<core::video_format::type>(n));\r
 358 \r
 359                 double diff1 = std::abs(format.fps - fps);\r
 360                 double diff2 = std::abs(closest_fps - fps);\r
 361 \r
 362                 if(diff1 < diff2)\r
 363                         closest_fps = format.fps;\r
 364         }\r
 365         \r
 366         video_context.time_base.num = 1000000;\r
 367         video_context.time_base.den = static_cast<int>(closest_fps*1000000.0);\r
 368 }\r
 369 \r
 370 safe_ptr<AVPacket> create_packet()\r
 371 {\r
 372         safe_ptr<AVPacket> packet(new AVPacket, [](AVPacket* p)\r
 373         {\r
 374                 av_free_packet(p);\r
 375                 delete p;\r
 376         });\r
 377         \r
 378         av_init_packet(packet.get());\r
 379         return packet;\r
 380 }\r
 381 \r
 382 safe_ptr<AVCodecContext> open_codec(AVFormatContext& context, enum AVMediaType type, int& index)\r
 383 {       \r
 384         AVCodec* decoder;\r
 385         index = THROW_ON_ERROR2(av_find_best_stream(&context, type, -1, -1, &decoder, 0), "");\r
 386         //if(strcmp(decoder->name, "prores") == 0 && decoder->next && strcmp(decoder->next->name, "prores_lgpl") == 0)\r
 387         //      decoder = decoder->next;\r
 388 \r
 389         THROW_ON_ERROR2(tbb_avcodec_open(context.streams[index]->codec, decoder), "");\r
 390         return safe_ptr<AVCodecContext>(context.streams[index]->codec, tbb_avcodec_close);\r
 391 }\r
 392 \r
 393 safe_ptr<AVFormatContext> open_input(const std::wstring& filename)\r
 394 {\r
 395         AVFormatContext* weak_context = nullptr;\r
 396         THROW_ON_ERROR2(avformat_open_input(&weak_context, narrow(filename).c_str(), nullptr, nullptr), filename);\r
 397         safe_ptr<AVFormatContext> context(weak_context, av_close_input_file);                   \r
 398         THROW_ON_ERROR2(avformat_find_stream_info(weak_context, nullptr), filename);\r
 399         fix_meta_data(*context);\r
 400         return context;\r
 401 }\r
 402 //\r
 403 //void av_dup_frame(AVFrame* frame)\r
 404 //{\r
 405 //      AVFrame* new_frame = avcodec_alloc_frame();\r
 406 //\r
 407 //\r
 408 //      const uint8_t *src_data[4] = {0};\r
 409 //      memcpy(const_cast<uint8_t**>(&src_data[0]), frame->data, 4);\r
 410 //      const int src_linesizes[4] = {0};\r
 411 //      memcpy(const_cast<int*>(&src_linesizes[0]), frame->linesize, 4);\r
 412 //\r
 413 //      av_image_alloc(new_frame->data, new_frame->linesize, new_frame->width, new_frame->height, frame->format, 16);\r
 414 //\r
 415 //      av_image_copy(new_frame->data, new_frame->linesize, src_data, src_linesizes, frame->format, new_frame->width, new_frame->height);\r
 416 //\r
 417 //      frame =\r
 418 //}\r
 419 \r
 420 }}