avfilter/dnn: get the data type of network output from dnn execution result

author Guo, Yejun <yejun.guo@intel.com>

Mon, 21 Oct 2019 12:38:10 +0000 (20:38 +0800)

committer Pedro Arthur <bygrandao@gmail.com>

Wed, 30 Oct 2019 14:00:41 +0000 (11:00 -0300)
author Guo, Yejun <yejun.guo@intel.com>
Mon, 21 Oct 2019 12:38:10 +0000 (20:38 +0800)
committer Pedro Arthur <bygrandao@gmail.com>
Wed, 30 Oct 2019 14:00:41 +0000 (11:00 -0300)
diff --git a/libavfilter/dnn/dnn_backend_native.c b/libavfilter/dnn/dnn_backend_native.c

index ff280b5506c3de01773e70b690c044da34b39c4d..add1db42cfda48b37c6e7bfb04625d2aa8cee58e 100644 (file)
--- a/libavfilter/dnn/dnn_backend_native.c
+++ b/libavfilter/dnn/dnn_backend_native.c
@@ -28,7 +28,7 @@
  #include "dnn_backend_native_layer_conv2d.h"
  #include "dnn_backend_native_layers.h"
  
-static DNNReturnType set_input_output_native(void *model, DNNInputData *input, const char *input_name, const char **output_names, uint32_t nb_output)
+static DNNReturnType set_input_output_native(void *model, DNNData *input, const char *input_name, const char **output_names, uint32_t nb_output)
  {
      ConvolutionalNetwork *network = (ConvolutionalNetwork *)model;
      DnnOperand *oprd = NULL;
@@ -263,6 +263,7 @@ DNNReturnType ff_dnn_execute_model_native(const DNNModel *model, DNNData *output
          outputs[i].height = oprd->dims[1];
          outputs[i].width = oprd->dims[2];
          outputs[i].channels = oprd->dims[3];
+        outputs[i].dt = oprd->data_type;
      }
  
      return DNN_SUCCESS;
diff --git a/libavfilter/dnn/dnn_backend_native_layer_conv2d.c b/libavfilter/dnn/dnn_backend_native_layer_conv2d.c

index 6ec0fa7a996c833788d8e4479029f10ed3625620..7b296979a9deeb8847546e7b25502b087e05d6b7 100644 (file)
--- a/libavfilter/dnn/dnn_backend_native_layer_conv2d.c
+++ b/libavfilter/dnn/dnn_backend_native_layer_conv2d.c
@@ -106,6 +106,7 @@ int dnn_execute_layer_conv2d(DnnOperand *operands, const int32_t *input_operand_
      output_operand->dims[1] = height - pad_size * 2;
      output_operand->dims[2] = width - pad_size * 2;
      output_operand->dims[3] = conv_params->output_num;
+    output_operand->data_type = operands[input_operand_index].data_type;
      output_operand->length = calculate_operand_data_length(output_operand);
      output_operand->data = av_realloc(output_operand->data, output_operand->length);
      if (!output_operand->data)
diff --git a/libavfilter/dnn/dnn_backend_native_layer_depth2space.c b/libavfilter/dnn/dnn_backend_native_layer_depth2space.c

index 174676e14ab4a839e7d4029a2f4d4556c6997926..7dab19d40fb5713badb3a8c9e405b0eeab1dc97d 100644 (file)
--- a/libavfilter/dnn/dnn_backend_native_layer_depth2space.c
+++ b/libavfilter/dnn/dnn_backend_native_layer_depth2space.c
@@ -69,6 +69,7 @@ int dnn_execute_layer_depth2space(DnnOperand *operands, const int32_t *input_ope
      output_operand->dims[1] = height * block_size;
      output_operand->dims[2] = width * block_size;
      output_operand->dims[3] = new_channels;
+    output_operand->data_type = operands[input_operand_index].data_type;
      output_operand->length = calculate_operand_data_length(output_operand);
      output_operand->data = av_realloc(output_operand->data, output_operand->length);
      if (!output_operand->data)
diff --git a/libavfilter/dnn/dnn_backend_native_layer_pad.c b/libavfilter/dnn/dnn_backend_native_layer_pad.c

index 8fa35de196a5408f64487d33c613edb4b73dd86b..8e5959bdd1bd20d0c603b472e2c3bb0102617567 100644 (file)
--- a/libavfilter/dnn/dnn_backend_native_layer_pad.c
+++ b/libavfilter/dnn/dnn_backend_native_layer_pad.c
@@ -105,6 +105,7 @@ int dnn_execute_layer_pad(DnnOperand *operands, const int32_t *input_operand_ind
      output_operand->dims[1] = new_height;
      output_operand->dims[2] = new_width;
      output_operand->dims[3] = new_channel;
+    output_operand->data_type = operands[input_operand_index].data_type;
      output_operand->length = calculate_operand_data_length(output_operand);
      output_operand->data = av_realloc(output_operand->data, output_operand->length);
      if (!output_operand->data)
diff --git a/libavfilter/dnn/dnn_backend_tf.c b/libavfilter/dnn/dnn_backend_tf.c

index c8dff51744836a9c2fba30d63cf33a4e872a2330..ed91d0500dc69bac6d6557bfbb131cf91f09a430 100644 (file)
--- a/libavfilter/dnn/dnn_backend_tf.c
+++ b/libavfilter/dnn/dnn_backend_tf.c
@@ -83,7 +83,7 @@ static TF_Buffer *read_graph(const char *model_filename)
      return graph_buf;
  }
  
-static TF_Tensor *allocate_input_tensor(const DNNInputData *input)
+static TF_Tensor *allocate_input_tensor(const DNNData *input)
  {
      TF_DataType dt;
      size_t size;
@@ -105,7 +105,7 @@ static TF_Tensor *allocate_input_tensor(const DNNInputData *input)
                               input_dims[1] * input_dims[2] * input_dims[3] * size);
  }
  
-static DNNReturnType set_input_output_tf(void *model, DNNInputData *input, const char *input_name, const char **output_names, uint32_t nb_output)
+static DNNReturnType set_input_output_tf(void *model, DNNData *input, const char *input_name, const char **output_names, uint32_t nb_output)
  {
      TFModel *tf_model = (TFModel *)model;
      TF_SessionOptions *sess_opts;
@@ -603,6 +603,7 @@ DNNReturnType ff_dnn_execute_model_tf(const DNNModel *model, DNNData *outputs, u
          outputs[i].width = TF_Dim(tf_model->output_tensors[i], 2);
          outputs[i].channels = TF_Dim(tf_model->output_tensors[i], 3);
          outputs[i].data = TF_TensorData(tf_model->output_tensors[i]);
+        outputs[i].dt = TF_TensorType(tf_model->output_tensors[i]);
      }
  
      return DNN_SUCCESS;
diff --git a/libavfilter/dnn_interface.h b/libavfilter/dnn_interface.h

index 057005f47e7294d779c2d4716400063b51bd5d0f..fdefcb708b658be0f8f0b6dc113c6bac8beccbc8 100644 (file)
--- a/libavfilter/dnn_interface.h
+++ b/libavfilter/dnn_interface.h
@@ -34,15 +34,10 @@ typedef enum {DNN_NATIVE, DNN_TF} DNNBackendType;
  
  typedef enum {DNN_FLOAT = 1, DNN_UINT8 = 4} DNNDataType;
  
-typedef struct DNNInputData{
+typedef struct DNNData{
      void *data;
      DNNDataType dt;
      int width, height, channels;
-} DNNInputData;
-
-typedef struct DNNData{
-    float *data;
-    int width, height, channels;
  } DNNData;
  
  typedef struct DNNModel{
@@ -50,7 +45,7 @@ typedef struct DNNModel{
      void *model;
      // Sets model input and output.
      // Should be called at least once before model execution.
-    DNNReturnType (*set_input_output)(void *model, DNNInputData *input, const char *input_name, const char **output_names, uint32_t nb_output);
+    DNNReturnType (*set_input_output)(void *model, DNNData *input, const char *input_name, const char **output_names, uint32_t nb_output);
  } DNNModel;
  
  // Stores pointers to functions for loading, executing, freeing DNN models for one of the backends.
diff --git a/libavfilter/vf_derain.c b/libavfilter/vf_derain.c

index b7bba094643e2fd799d54ee09fb609ef648765e6..89f9d5a2ed82e3e97a8e541d44e6e746f3f67f15 100644 (file)
--- a/libavfilter/vf_derain.c
+++ b/libavfilter/vf_derain.c
@@ -39,7 +39,7 @@ typedef struct DRContext {
      DNNBackendType     backend_type;
      DNNModule         *dnn_module;
      DNNModel          *model;
-    DNNInputData       input;
+    DNNData            input;
      DNNData            output;
  } DRContext;
  
@@ -137,7 +137,7 @@ static int filter_frame(AVFilterLink *inlink, AVFrame *in)
              int t = i * out->width * 3 + j;
  
              int t_in =  (i + pad_size) * in->width * 3 + j + pad_size * 3;
-            out->data[0][k] = CLIP((int)((((float *)dr_context->input.data)[t_in] - dr_context->output.data[t]) * 255), 0, 255);
+            out->data[0][k] = CLIP((int)((((float *)dr_context->input.data)[t_in] - ((float *)dr_context->output.data)[t]) * 255), 0, 255);
          }
      }
  
diff --git a/libavfilter/vf_sr.c b/libavfilter/vf_sr.c

index 0433246e26516c8a18869ceea4ac213699fb9681..fff19ea6931be20b661de9f52a588eb3a61e389b 100644 (file)
--- a/libavfilter/vf_sr.c
+++ b/libavfilter/vf_sr.c
@@ -41,7 +41,7 @@ typedef struct SRContext {
      DNNBackendType backend_type;
      DNNModule *dnn_module;
      DNNModel *model;
-    DNNInputData input;
+    DNNData input;
      DNNData output;
      int scale_factor;
      struct SwsContext *sws_contexts[3];
author	Guo, Yejun <yejun.guo@intel.com>
	Mon, 21 Oct 2019 12:38:10 +0000 (20:38 +0800)
committer	Pedro Arthur <bygrandao@gmail.com>
	Wed, 30 Oct 2019 14:00:41 +0000 (11:00 -0300)
libavfilter/dnn/dnn_backend_native.c		patch \| blob \| history
libavfilter/dnn/dnn_backend_native_layer_conv2d.c		patch \| blob \| history
libavfilter/dnn/dnn_backend_native_layer_depth2space.c		patch \| blob \| history
libavfilter/dnn/dnn_backend_native_layer_pad.c		patch \| blob \| history
libavfilter/dnn/dnn_backend_tf.c		patch \| blob \| history
libavfilter/dnn_interface.h		patch \| blob \| history
libavfilter/vf_derain.c		patch \| blob \| history
libavfilter/vf_sr.c		patch \| blob \| history