]> git.sesse.net Git - movit/blobdiff - init.cpp
Explicitly bind fragment shader outputs in order.
[movit] / init.cpp
index 671c507c5588c7faf5783b7f0a500d1780fc9162..733d24689b5f5c4f2ef56135a32030e92fa9738f 100644 (file)
--- a/init.cpp
+++ b/init.cpp
@@ -16,8 +16,10 @@ bool movit_initialized = false;
 MovitDebugLevel movit_debug_level = MOVIT_DEBUG_ON;
 float movit_texel_subpixel_precision;
 bool movit_srgb_textures_supported;
+bool movit_timer_queries_supported;
 int movit_num_wrongly_rounded;
 bool movit_shader_rounding_supported;
+MovitShaderModel movit_shader_model;
 
 // The rules for objects with nontrivial constructors in static scope
 // are somewhat convoluted, and easy to mess up. We simply have a
@@ -38,7 +40,7 @@ void measure_texel_subpixel_precision()
        check_error();
        glBindTexture(GL_TEXTURE_2D, dst_texnum);
        check_error();
-       glTexImage2D(GL_TEXTURE_2D, 0, GL_RGBA16F_ARB, width, 1, 0, GL_RGBA, GL_UNSIGNED_BYTE, NULL);
+       glTexImage2D(GL_TEXTURE_2D, 0, GL_RGBA16F, width, 1, 0, GL_RGBA, GL_FLOAT, NULL);
        check_error();
 
        glGenFramebuffers(1, &fbo);
@@ -77,8 +79,11 @@ void measure_texel_subpixel_precision()
 
        glViewport(0, 0, width, 1);
 
+       vector<string> frag_shader_outputs;
        GLuint glsl_program_num = resource_pool.compile_glsl_program(
-               read_file("vs.vert"), read_file("texture1d.frag"));
+               read_version_dependent_file("vs", "vert"),
+               read_version_dependent_file("texture1d", "frag"),
+               frag_shader_outputs);
        glUseProgram(glsl_program_num);
        check_error();
        glUniform1i(glGetUniformLocation(glsl_program_num, "tex"), 0);  // Bind the 2D sampler.
@@ -122,14 +127,14 @@ void measure_texel_subpixel_precision()
        // Now read the data back and see what the card did.
        // (We only look at the red channel; the others will surely be the same.)
        // We assume a linear ramp; anything else will give sort of odd results here.
-       float out_data[width];
-       glReadPixels(0, 0, width, 1, GL_RED, GL_FLOAT, out_data);
+       float out_data[width * 4];
+       glReadPixels(0, 0, width, 1, GL_RGBA, GL_FLOAT, out_data);
        check_error();
 
        float biggest_jump = 0.0f;
        for (unsigned i = 1; i < width; ++i) {
-               assert(out_data[i] >= out_data[i - 1]);
-               biggest_jump = max(biggest_jump, out_data[i] - out_data[i - 1]);
+               assert(out_data[i * 4] >= out_data[(i - 1) * 4]);
+               biggest_jump = max(biggest_jump, out_data[i * 4] - out_data[(i - 1) * 4]);
        }
 
        assert(biggest_jump > 0.0);
@@ -208,8 +213,11 @@ void measure_roundoff_problems()
 
        glViewport(0, 0, 512, 1);
 
+       vector<string> frag_shader_outputs;
        GLuint glsl_program_num = resource_pool.compile_glsl_program(
-               read_file("vs.vert"), read_file("texture1d.frag"));
+               read_version_dependent_file("vs", "vert"),
+               read_version_dependent_file("texture1d", "frag"),
+               frag_shader_outputs);
        glUseProgram(glsl_program_num);
        check_error();
        glUniform1i(glGetUniformLocation(glsl_program_num, "tex"), 0);  // Bind the 2D sampler.
@@ -242,16 +250,16 @@ void measure_roundoff_problems()
 
        // Now read the data back and see what the card did. (Ignore the last value.)
        // (We only look at the red channel; the others will surely be the same.)
-       unsigned char out_data[512];
-       glReadPixels(0, 0, 512, 1, GL_RED, GL_UNSIGNED_BYTE, out_data);
+       unsigned char out_data[512 * 4];
+       glReadPixels(0, 0, 512, 1, GL_RGBA, GL_UNSIGNED_BYTE, out_data);
        check_error();
 
        int wrongly_rounded = 0;
        for (unsigned i = 0; i < 255; ++i) {
-               if (out_data[i * 2 + 0] != i) {
+               if (out_data[(i * 2 + 0) * 4] != i) {
                        ++wrongly_rounded;
                }
-               if (out_data[i * 2 + 1] != i + 1) {
+               if (out_data[(i * 2 + 1) * 4] != i + 1) {
                        ++wrongly_rounded;
                }
        }
@@ -275,34 +283,70 @@ void measure_roundoff_problems()
        check_error();
 }
 
-bool check_extensions()
-{
+struct RequiredExtension {
+       int min_equivalent_gl_version;
+       const char extension_name[64];
+};
+const RequiredExtension required_extensions[] = {
        // We fundamentally need FBOs and floating-point textures.
        // FBOs are covered by OpenGL 1.5, and are not an extension there.
        // Floating-point textures are part of OpenGL 3.0 and newer.
-       if (epoxy_gl_version() < 15 &&
-           !epoxy_has_gl_extension("GL_ARB_framebuffer_object")) return false;
-       if (epoxy_gl_version() < 30 &&
-           !epoxy_has_gl_extension("GL_ARB_texture_float")) return false;
+       { 15, "GL_ARB_framebuffer_object" },
+       { 30, "GL_ARB_texture_float" },
 
        // We assume that we can use non-power-of-two textures without restrictions.
-       if (epoxy_gl_version() < 20 &&
-           !epoxy_has_gl_extension("GL_ARB_texture_non_power_of_two")) return false;
+       { 20, "GL_ARB_texture_non_power_of_two" },
 
        // We also need GLSL fragment shaders.
-       if (epoxy_gl_version() < 20) {
-               if (!epoxy_has_gl_extension("GL_ARB_fragment_shader")) return false;
-               if (!epoxy_has_gl_extension("GL_ARB_shading_language_100")) return false;
-       }
+       { 20, "GL_ARB_fragment_shader" },
+       { 20, "GL_ARB_shading_language_100" },
 
        // FlatInput and YCbCrInput uses PBOs. (They could in theory do without,
        // but no modern card would really not provide it.)
-       if (epoxy_gl_version() < 21 &&
-           !epoxy_has_gl_extension("GL_ARB_pixel_buffer_object")) return false;
+       { 21, "GL_ARB_pixel_buffer_object" },
 
        // ResampleEffect uses RG textures to encode a two-component LUT.
-       if (epoxy_gl_version() < 30 &&
-           !epoxy_has_gl_extension("GL_ARB_texture_rg")) return false;
+       // We also need GL_R several places, for single-channel input.
+       { 30, "GL_ARB_texture_rg" },
+};
+
+bool check_extensions()
+{
+       // GLES generally doesn't use extensions as actively as desktop OpenGL.
+       // For now, we say that for GLES, we require GLES 3, which has everything
+       // we need.
+       if (!epoxy_is_desktop_gl()) {
+               if (epoxy_gl_version() >= 30) {
+                       movit_srgb_textures_supported = true;
+                       movit_shader_rounding_supported = true;
+                       return true;
+               } else {
+                       fprintf(stderr, "Movit system requirements: GLES version %.1f is too old (GLES 3.0 needed).\n",
+                               0.1f * epoxy_gl_version());
+                       fprintf(stderr, "Movit initialization failed.\n");
+                       return false;
+               }
+       }
+
+       // Check all extensions, and output errors for the ones that we are missing.
+       bool all_ok = true;
+       int gl_version = epoxy_gl_version();
+
+       for (unsigned i = 0; i < sizeof(required_extensions) / sizeof(required_extensions[0]); ++i) {
+               if (gl_version < required_extensions[i].min_equivalent_gl_version &&
+                   !epoxy_has_gl_extension(required_extensions[i].extension_name)) {
+                       fprintf(stderr, "Movit system requirements: Needs extension '%s' or at least OpenGL version %.1f (has version %.1f)\n",
+                               required_extensions[i].extension_name,
+                               0.1f * required_extensions[i].min_equivalent_gl_version,
+                               0.1f * gl_version);
+                       all_ok = false;
+               }
+       }
+
+       if (!all_ok) {
+               fprintf(stderr, "Movit initialization failed.\n");
+               return false;
+       }
 
        // sRGB texture decode would be nice, but are not mandatory
        // (GammaExpansionEffect can do the same thing if needed).
@@ -316,9 +360,51 @@ bool check_extensions()
        movit_shader_rounding_supported =
                (epoxy_gl_version() >= 30 || epoxy_has_gl_extension("GL_EXT_gpu_shader4"));
 
+       // The user can specify that they want a timing report for each
+       // phase in an effect chain. However, that depends on this extension;
+       // without it, we do cannot even create the query objects.
+       movit_timer_queries_supported =
+               (epoxy_gl_version() >= 33 || epoxy_has_gl_extension("GL_ARB_timer_query"));
+
        return true;
 }
 
+double get_glsl_version()
+{
+       char *glsl_version_str = strdup((const char *)glGetString(GL_SHADING_LANGUAGE_VERSION));
+
+       // Skip past the first period.
+       char *ptr = strchr(glsl_version_str, '.');
+       assert(ptr != NULL);
+       ++ptr;
+
+       // Now cut the string off at the next period or space, whatever comes first
+       // (unless the string ends first).
+       while (*ptr && *ptr != '.' && *ptr != ' ') {
+               ++ptr;
+       }
+       *ptr = '\0';
+
+       // Now we have something on the form X.YY. We convert it to a float, and hope
+       // that if it's inexact (e.g. 1.30), atof() will round the same way the
+       // compiler will.
+       float glsl_version = atof(glsl_version_str);
+       free(glsl_version_str);
+
+       return glsl_version;
+}
+
+void APIENTRY debug_callback(GLenum source,
+                             GLenum type,
+                             GLuint id,
+                             GLenum severity,
+                             GLsizei length,
+                             const char *message,
+                             const void *userParam)
+{
+       printf("Debug: %s\n", message);
+}
+
 }  // namespace
 
 bool init_movit(const string& data_directory, MovitDebugLevel debug_level)
@@ -335,9 +421,45 @@ bool init_movit(const string& data_directory, MovitDebugLevel debug_level)
        glPixelStorei(GL_UNPACK_ALIGNMENT, 1);
        glDisable(GL_DITHER);
 
+       // You can turn this on if you want detailed debug messages from the driver.
+       // You should probably also ask for a debug context (see gtest_sdl_main.cpp),
+       // or you might not get much data back.
+       // glDebugMessageCallbackARB(callback, NULL);
+       // glDebugMessageControlARB(GL_DONT_CARE, GL_DONT_CARE, GL_DONT_CARE, 0, 0, GL_TRUE);
+
        if (!check_extensions()) {
                return false;
        }
+
+       // Find out what shader model we should compile for.
+       // We need at least 1.30, due to use of (among others) integers.
+       if (epoxy_is_desktop_gl()) {
+               if (get_glsl_version() < 1.30f) {
+                       fprintf(stderr, "Movit system requirements: Needs at least GLSL version 1.30 (has version %.1f)\n",
+                               get_glsl_version());
+                       if (get_glsl_version() >= 1.10f) {
+                               fprintf(stderr, "Attempting to continue nevertheless; expect shader compilation issues.\n");
+                               fprintf(stderr, "Try switching to a core OpenGL context, as especially OS X drivers\n");
+                               fprintf(stderr, "support newer GLSL versions there.\n");
+                               movit_shader_model = MOVIT_GLSL_130_AS_110;
+                       } else {
+                               return false;
+                       }
+               }
+               if (get_glsl_version() < 1.50f) {
+                       movit_shader_model = MOVIT_GLSL_130;
+               } else {
+                       // Note: All of our 1.50 shaders are identical to our 1.30 shaders,
+                       // but OS X does not support 1.30; only 1.10 (which we don't support
+                       // anymore) and 1.50 (and then only with core contexts). So we keep
+                       // a second set of shaders around whose only difference is the different
+                       // #version declaration.
+                       movit_shader_model = MOVIT_GLSL_150;
+               }
+       } else {
+               movit_shader_model = MOVIT_ESSL_300;
+       }
+
        measure_texel_subpixel_precision();
        measure_roundoff_problems();