]> git.sesse.net Git - fjl/blob - dehuff.h
Get rid of AC_SIXTEEN_ZEROS.
[fjl] / dehuff.h
1 #ifndef _DEHUFF_H
2 #define _DEHUFF_H 1
3
4 #include <stddef.h>
5 #include <stdint.h>
6 #include <sys/types.h>
7
8 #include "bytesource.h"
9 #include "bitsource.h"
10
11 // About 99% of all Huffman codes are <= 8 bits long (see codelen.txt),
12 // and it's what libjpeg uses. Thus, it seems like a reasonable size.
13 #define DEHUF_TABLE_BITS 8
14 #define DEHUF_TABLE_SIZE (1 << DEHUF_TABLE_BITS)
15 static const int DEHUF_SLOW_PATH = -1;
16
17 // About 98% of all AC coefficients (control byte + coefficient) are <= 10 bits
18 // long; again, see codelen.txt. This will cost us about 6 kB of data to store
19 // in L1 cache.
20 #define DEHUF_AC_TABLE_BITS 10
21 #define DEHUF_AC_TABLE_SIZE (1 << DEHUF_AC_TABLE_BITS)
22 static const int AC_DEHUF_SLOW_PATH = 0xf0000000;
23 static const int AC_END_OF_BLOCK = 0xf0000001;
24
25 struct huffman_table {
26         unsigned num_codes[17];     // BITS
27         unsigned char codes[256];   // HUFFVAL
28         
29         // Derived values.
30         unsigned huffsize[256];
31         unsigned huffcode[256];
32         int maxcode[16];
33         int mincode[16];
34         unsigned valptr[16];
35
36         // Lookup table for fast decoding; given eight bits,
37         // return the symbol and length in bits. For longer codes,
38         // DEHUF_SLOW_PATH is returned.
39
40         // Note that the codes we return are 8-bit, but the type of
41         // the lookup tables is int to avoid extra zero extending. 
42         int lookup_table_codes[DEHUF_TABLE_SIZE]; 
43         int lookup_table_length[DEHUF_TABLE_SIZE]; 
44         
45         // Further lookup tables for decoding AC coefficients.
46         // (Generated but obviously not used for DC coefficients.)
47         // Maps from 10-bit lookahead values to the signed coeffient (_codes),
48         // number of bits to skip (_length) and the number of zero coefficients
49         // after this one (_skip).
50         int ac_table_codes[DEHUF_AC_TABLE_SIZE]; 
51         uint8_t ac_table_length[DEHUF_AC_TABLE_SIZE]; 
52         uint8_t ac_table_skip[DEHUF_AC_TABLE_SIZE]; 
53 };
54
55 enum coefficient_class {
56         DC_CLASS = 0,
57         AC_CLASS,
58         NUM_COEFF_CLASSES
59 };
60 typedef struct huffman_table huffman_tables_t[NUM_COEFF_CLASSES][4];
61
62 // Read Huffman tables from a stream, and compute the derived values.
63 void read_huffman_tables(huffman_tables_t* dst, input_func_t* input_func, void* userdata);
64
65 unsigned read_huffman_symbol_slow_path(const struct huffman_table* table,
66                                        struct bit_source* source);
67
68 static inline unsigned read_huffman_symbol_no_refill(
69         const struct huffman_table* table,
70         struct bit_source* source)
71 {
72         assert(source->bits_available >= DEHUF_TABLE_BITS);
73         unsigned lookup = peek_bits(source, DEHUF_TABLE_BITS);
74         int code = table->lookup_table_codes[lookup];
75         int length = table->lookup_table_length[lookup];
76
77         if (code == DEHUF_SLOW_PATH) {
78                 return read_huffman_symbol_slow_path(table, source);
79         }
80                 
81         read_bits(source, length);
82         return code;
83 }
84
85 static inline unsigned read_huffman_symbol(const struct huffman_table* table,
86                                            struct bit_source* source)
87 {
88         possibly_refill(source, DEHUF_TABLE_BITS);
89         return read_huffman_symbol_no_refill(table, source);
90 }
91
92 // procedure EXTEND (figure F.12)
93
94 // Fast lookup table for (1 << (bits - 1)).
95 // The table actually helps, since the load can go in parallel with the shift
96 // operation below.
97 static const int bit_thresholds[16] = {
98         0, 1 << 0, 1 << 1, 1 << 2, 1 << 3, 1 << 4, 1 << 5, 1 << 6, 1 << 7, 1 << 8, 1 << 9, 1 << 10, 1 << 11, 1 << 12, 1 << 13, 1 << 14
99 };
100
101 static inline unsigned extend(int val, unsigned bits)
102 {
103 #if defined(__GNUC__) && (defined(__i386__) || defined(__x86_64__))
104         // GCC should ideally be able to figure out that the conditional move is better, but
105         // it doesn't for various reasons, and this is pretty important for speed, so we hardcode.
106         asm("cmp %1, %0 ; cmovl %2, %0"
107                 : "+r" (val)
108                 : "g" (bit_thresholds[bits]),
109                   "r" (val + (-1 << bits) + 1)
110                 : "cc");
111         return val;
112 #else
113         if (val < bit_thresholds[bits]) {
114                 return val + (-1 << bits) + 1;
115         } else {
116                 return val;
117         }
118 #endif
119 }
120
121 #endif /* !defined(_DEHUFF_H) */