e270141e62941f6c33202d34f15786d62fca9200
[cubemap] / main.cpp
1 #include <stdio.h>
2 #include <string.h>
3 #include <stdint.h>
4 #include <assert.h>
5 #include <arpa/inet.h>
6 #include <sys/socket.h>
7 #include <pthread.h>
8 #include <sys/types.h>
9 #include <sys/ioctl.h>
10 #include <sys/poll.h>
11 #include <sys/time.h>
12 #include <signal.h>
13 #include <errno.h>
14 #include <ctype.h>
15 #include <fcntl.h>
16 #include <vector>
17 #include <string>
18 #include <map>
19 #include <set>
20
21 #include "acceptor.h"
22 #include "markpool.h"
23 #include "metacube.h"
24 #include "parse.h"
25 #include "server.h"
26 #include "serverpool.h"
27 #include "input.h"
28 #include "stats.h"
29 #include "state.pb.h"
30
31 using namespace std;
32
33 ServerPool *servers = NULL;
34 volatile bool hupped = false;
35
36 void hup(int ignored)
37 {
38         hupped = true;
39 }
40
41 // Serialize the given state to a file descriptor, and return the (still open)
42 // descriptor.
43 int make_tempfile(const CubemapStateProto &state)
44 {
45         char tmpl[] = "/tmp/cubemapstate.XXXXXX";
46         int state_fd = mkstemp(tmpl);
47         if (state_fd == -1) {
48                 perror("mkstemp");
49                 exit(1);
50         }
51
52         string serialized;
53         state.SerializeToString(&serialized);
54
55         const char *ptr = serialized.data();
56         size_t to_write = serialized.size();
57         while (to_write > 0) {
58                 ssize_t ret = write(state_fd, ptr, to_write);
59                 if (ret == -1) {
60                         perror("write");
61                         exit(1);
62                 }
63
64                 ptr += ret;
65                 to_write -= ret;
66         }
67
68         return state_fd;
69 }
70
71 // Read the state back from the file descriptor made by make_tempfile,
72 // and close it.
73 CubemapStateProto read_tempfile(int state_fd)
74 {
75         if (lseek(state_fd, 0, SEEK_SET) == -1) {
76                 perror("lseek");
77                 exit(1);
78         }
79
80         string serialized;
81         char buf[4096];
82         for ( ;; ) {
83                 ssize_t ret = read(state_fd, buf, sizeof(buf));
84                 if (ret == -1) {
85                         perror("read");
86                         exit(1);
87                 }
88                 if (ret == 0) {
89                         // EOF.
90                         break;
91                 }
92
93                 serialized.append(string(buf, buf + ret));
94         }
95
96         close(state_fd);  // Implicitly deletes the file.
97
98         CubemapStateProto state;
99         if (!state.ParseFromString(serialized)) {
100                 fprintf(stderr, "PANIC: Failed deserialization of state.\n");
101                 exit(1);
102         }
103
104         return state;
105 }
106         
107 // Reuse mark pools if one already exists.
108 MarkPool *get_mark_pool(map<pair<int, int>, MarkPool *> *mark_pools, int from, int to)
109 {
110         pair<int, int> mark_range(from, to);
111         if (mark_pools->count(mark_range) != 0) {
112                 return (*mark_pools)[mark_range];
113         }
114
115         // Check if we're overlapping some other mark pool.
116         for (map<pair<int, int>, MarkPool *>::const_iterator mp_it = mark_pools->begin();
117              mp_it != mark_pools->end();
118              ++mp_it) {
119                 int other_from = mp_it->first.first;
120                 int other_to = mp_it->first.second;
121                 if ((from >= other_from && from < other_to) ||
122                     (to >= other_from && to < other_to)) {
123                         fprintf(stderr, "WARNING: Mark pool %d-%d partially overlaps with %d-%d, you may get duplicate marks.\n",
124                                 from, to, other_from, other_to);
125                         fprintf(stderr, "         Mark pools must either be completely disjunct, or completely overlapping.\n");
126                 }
127         }       
128
129         MarkPool *mark_pool = new MarkPool(from, to);
130         mark_pools->insert(make_pair(mark_range, mark_pool));
131         return mark_pool;
132 }
133                         
134 MarkPool *parse_mark_pool(map<pair<int, int>, MarkPool *> *mark_pools, const string &mark_str)
135 {
136         size_t split = mark_str.find_first_of('-');
137         if (split == string::npos) {
138                 fprintf(stderr, "WARNING: Invalid mark specification '%s' (expected 'X-Y'), ignoring.\n",
139                         mark_str.c_str());
140                 return NULL;
141         }
142
143         string from_str(mark_str.begin(), mark_str.begin() + split);
144         string to_str(mark_str.begin() + split + 1, mark_str.end());
145         int from = atoi(from_str.c_str());
146         int to = atoi(to_str.c_str());
147
148         if (from <= 0 || from >= 65536 || to <= 0 || to >= 65536) {
149                 fprintf(stderr, "WARNING: Mark pool range %d-%d is outside legal range [1,65536>, ignoring.\n",
150                         from, to);
151                 return NULL;
152         }
153
154         return get_mark_pool(mark_pools, from, to);
155 }
156
157 int main(int argc, char **argv)
158 {
159         fprintf(stderr, "\nCubemap starting.\n");
160
161         struct timeval serialize_start;
162         bool is_reexec = false;
163
164         string config_filename = (argc == 1) ? "cubemap.config" : argv[1];
165         vector<ConfigLine> config = parse_config(config_filename);
166
167         int port = fetch_config_int(config, "port", 1, 65535, PARAMATER_MANDATORY);
168         int num_servers = fetch_config_int(config, "num_servers", 1, 20000, PARAMATER_MANDATORY);  // Insanely high max limit.
169
170         servers = new ServerPool(num_servers);
171
172         CubemapStateProto loaded_state;
173         int server_sock = -1, old_port = -1;
174         set<string> deserialized_stream_ids;
175         map<string, Input *> deserialized_inputs;
176         if (argc == 4 && strcmp(argv[2], "-state") == 0) {
177                 is_reexec = true;
178
179                 fprintf(stderr, "Deserializing state from previous process... ");
180                 int state_fd = atoi(argv[3]);
181                 loaded_state = read_tempfile(state_fd);
182
183                 serialize_start.tv_sec = loaded_state.serialize_start_sec();
184                 serialize_start.tv_usec = loaded_state.serialize_start_usec();
185
186                 // Deserialize the streams.
187                 for (int i = 0; i < loaded_state.streams_size(); ++i) {
188                         servers->add_stream_from_serialized(loaded_state.streams(i));
189                         deserialized_stream_ids.insert(loaded_state.streams(i).stream_id());
190                 }
191
192                 // Deserialize the inputs. Note that we don't actually add them to any state yet.
193                 for (int i = 0; i < loaded_state.inputs_size(); ++i) {
194                         deserialized_inputs.insert(make_pair(
195                                 loaded_state.inputs(i).stream_id(),
196                                 new Input(loaded_state.inputs(i))));
197                 } 
198
199                 // Deserialize the server socket.
200                 server_sock = loaded_state.server_sock();
201                 old_port = loaded_state.port();
202
203                 fprintf(stderr, "done.\n");
204         }
205
206         // Find all streams in the configuration file, and create them.
207         set<string> expecting_stream_ids = deserialized_stream_ids;
208         map<pair<int, int>, MarkPool *> mark_pools;
209         for (unsigned i = 0; i < config.size(); ++i) {
210                 if (config[i].keyword != "stream") {
211                         continue;
212                 }
213                 if (config[i].arguments.size() != 1) {
214                         fprintf(stderr, "ERROR: 'stream' takes exactly one argument\n");
215                         exit(1);
216                 }
217                 string stream_id = config[i].arguments[0];
218                 if (deserialized_stream_ids.count(stream_id) == 0) {
219                         servers->add_stream(stream_id);
220                 }
221                 expecting_stream_ids.erase(stream_id);
222
223                 // Set up marks, if so desired.
224                 if (config[i].parameters.count("mark")) {
225                         MarkPool *mark_pool = parse_mark_pool(&mark_pools, config[i].parameters["mark"]);
226                         servers->set_mark_pool(stream_id, mark_pool);
227                 }
228         }
229
230         // Warn about any servers we've lost.
231         // TODO: Make an option (delete=yes?) to actually shut down streams.
232         for (set<string>::const_iterator stream_it = expecting_stream_ids.begin();
233              stream_it != expecting_stream_ids.end();
234              ++stream_it) {
235                 string stream_id = *stream_it;
236                 fprintf(stderr, "WARNING: stream '%s' disappeared from the configuration file.\n",
237                         stream_id.c_str());
238                 fprintf(stderr, "         It will not be deleted, but clients will not get any new inputs.\n");
239                 if (deserialized_inputs.count(stream_id) != 0) {
240                         delete deserialized_inputs[stream_id];
241                         deserialized_inputs.erase(stream_id);
242                 }
243         }
244
245         // Open a new server socket if we do not already have one, or if we changed ports.
246         if (server_sock != -1 && port != old_port) {
247                 fprintf(stderr, "NOTE: Port changed from %d to %d; opening new socket.\n", old_port, port);
248                 close(server_sock);
249                 server_sock = -1;
250         }
251         if (server_sock == -1) {
252                 server_sock = create_server_socket(port);
253         }
254
255         // See if the user wants stats.
256         string stats_file = fetch_config_string(config, "stats_file", PARAMETER_OPTIONAL);
257         int stats_interval = fetch_config_int(config, "stats_interval", 1, INT_MAX, PARAMETER_OPTIONAL, -1);
258         if (stats_interval != -1 && stats_file.empty()) {
259                 fprintf(stderr, "WARNING: 'stats_interval' given, but no 'stats_file'. No statistics will be written.\n");
260         }
261         StatsThread *stats_thread = NULL;
262         if (!stats_file.empty()) {
263                 stats_thread = new StatsThread(stats_file, stats_interval);
264         }
265
266         servers->run();
267
268         pthread_t acceptor_thread;
269         pthread_create(&acceptor_thread, NULL, acceptor_thread_run, reinterpret_cast<void *>(server_sock));
270
271         // Find all streams in the configuration file, and create inputs for them.
272         vector<Input *> inputs;
273         for (unsigned i = 0; i < config.size(); ++i) {
274                 if (config[i].keyword != "stream") {
275                         continue;
276                 }
277                 assert(config[i].arguments.size() == 1);
278                 string stream_id = config[i].arguments[0];
279
280                 if (config[i].parameters.count("src") == 0) {
281                         fprintf(stderr, "WARNING: stream '%s' has no src= attribute, clients will not get any data.\n",
282                                 stream_id.c_str());
283                         continue;
284                 }
285
286                 string src = config[i].parameters["src"];
287                 Input *input = NULL;
288                 if (deserialized_inputs.count(stream_id) != 0) {
289                         input = deserialized_inputs[stream_id];
290                         if (input->get_url() != src) {
291                                 fprintf(stderr, "INFO: Stream '%s' has changed URL from '%s' to '%s', restarting input.\n",
292                                         stream_id.c_str(), input->get_url().c_str(), src.c_str());
293                                 delete input;
294                                 input = NULL;
295                         }
296                         deserialized_inputs.erase(stream_id);
297                 }
298                 if (input == NULL) {
299                         input = new Input(stream_id, src);
300                 }
301                 input->run();
302                 inputs.push_back(input);
303         }
304         
305         if (is_reexec) {        
306                 // Put back the existing clients. It doesn't matter which server we
307                 // allocate them to, so just do round-robin. However, we need to add
308                 // them after the mark pools have been set up.
309                 for (int i = 0; i < loaded_state.clients_size(); ++i) {
310                         servers->add_client_from_serialized(loaded_state.clients(i));
311                 }
312         }
313
314         // All deserialized inputs should now have been taken care of, one way or the other.
315         assert(deserialized_inputs.empty());
316
317         // Start writing statistics.
318         if (stats_thread != NULL) {
319                 stats_thread->run();
320         }
321
322         signal(SIGHUP, hup);
323         
324         struct timeval server_start;
325         gettimeofday(&server_start, NULL);
326         if (is_reexec) {
327                 // Measure time from we started deserializing (below) to now, when basically everything
328                 // is up and running. This is, in other words, a conservative estimate of how long our
329                 // “glitch” period was, not counting of course reconnects if the configuration changed.
330                 double glitch_time = server_start.tv_sec - serialize_start.tv_sec +
331                         1e-6 * (server_start.tv_usec - serialize_start.tv_usec);
332                 fprintf(stderr, "Re-exec happened in approx. %.0f ms.\n", glitch_time * 1000.0);
333         }
334
335         while (!hupped) {
336                 usleep(100000);
337         }
338
339         // OK, we've been HUPed. Time to shut down everything, serialize, and re-exec.
340         gettimeofday(&serialize_start, NULL);
341
342         if (stats_thread != NULL) {
343                 stats_thread->stop();
344         }
345         pthread_kill(acceptor_thread, SIGHUP);
346         if (pthread_join(acceptor_thread, NULL) == -1) {
347                 perror("pthread_join");
348                 exit(1);
349         }
350
351         CubemapStateProto state;
352         state.set_serialize_start_sec(serialize_start.tv_sec);
353         state.set_serialize_start_usec(serialize_start.tv_usec);
354         state.set_server_sock(server_sock);
355         state.set_port(port);
356
357         for (size_t i = 0; i < inputs.size(); ++i) {
358                 inputs[i]->stop();
359                 state.add_inputs()->MergeFrom(inputs[i]->serialize());
360         }
361
362         for (int i = 0; i < num_servers; ++i) { 
363                 servers->get_server(i)->stop();
364
365                 CubemapStateProto local_state = servers->get_server(i)->serialize();
366
367                 // The stream state should be identical between the servers, so we only store it once.
368                 if (i == 0) {
369                         state.mutable_streams()->MergeFrom(local_state.streams());
370                 }
371                 for (int j = 0; j < local_state.clients_size(); ++j) {
372                         state.add_clients()->MergeFrom(local_state.clients(j));
373                 }
374         }
375         delete servers;
376
377         fprintf(stderr, "Serializing state and re-execing...\n");
378         int state_fd = make_tempfile(state);
379
380         char buf[16];
381         sprintf(buf, "%d", state_fd);
382
383         for ( ;; ) {
384                 execlp(argv[0], argv[0], config_filename.c_str(), "-state", buf, NULL);
385                 perror("execlp");
386                 fprintf(stderr, "PANIC: re-exec of %s failed. Waiting 0.2 seconds and trying again...\n", argv[0]);
387                 usleep(200000);
388         }
389 }