]> git.sesse.net Git - vlc/blob - share/lua/extensions/imdb.lua
2a36b1bb14153d75995e386f32571627cf036227
[vlc] / share / lua / extensions / imdb.lua
1 --[[
2  Get information about a movie from IMDb
3
4  Copyright © 2009-2010 VideoLAN and AUTHORS
5
6  Authors:  Jean-Philippe André (jpeg@videolan.org)
7
8  This program is free software; you can redistribute it and/or modify
9  it under the terms of the GNU General Public License as published by
10  the Free Software Foundation; either version 2 of the License, or
11  (at your option) any later version.
12
13  This program is distributed in the hope that it will be useful,
14  but WITHOUT ANY WARRANTY; without even the implied warranty of
15  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16  GNU General Public License for more details.
17
18  You should have received a copy of the GNU General Public License
19  along with this program; if not, write to the Free Software
20  Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston MA 02110-1301, USA.
21 --]]
22
23 dlg = nil
24 txt = nil
25 function descriptor()
26     return { title = "IMDb - The Internet Movie Database" ;
27              version = "0.1" ;
28              author = "Jean-Philippe André" ;
29              url = 'http://www.imdb.org/';
30              description = "<center><b>The Internet Movie Database</b></center>\n"
31                         .. "Get information about movies from the Internet "
32                         .. "Movie Database (IMDb).\nThis Extension will show "
33                         .. "you the cast, a short plot summary and a link to "
34                         .. "the web page on imdb.org." ;
35              capabilities = { "input-listener" } }
36 end
37
38 -- Update title text field. Removes file extensions.
39 function update_title()
40     local item = vlc.input.item()
41     local title = item and item:name()
42     if title ~= nil then
43         title = string.gsub(title, "(.*)(%.%w+)$", "%1")
44     end
45     if title ~= nil then
46         txt:set_text(title)
47     end
48 end
49
50 function input_changed()
51     update_title()
52 end
53
54 function create_dialog()
55     dlg = vlc.dialog("IMDb Search")
56     dlg:add_label("The Internet Movie Database", 1, 1, 4, 1)
57     dlg:add_label("<b>Movie Title</b>", 1, 2, 1, 1)
58     local item = vlc.input.item()
59     txt = dlg:add_text_input(item and item:name() or "", 2, 2, 1, 1)
60     dlg:add_button("Okay", "click_okay", 3, 2, 1, 1)
61     dlg:add_button("*", "update_title", 4, 2, 1, 1)
62     dlg:show() -- Show, if not already visible
63 end
64
65 function activate()
66     create_dialog()
67 end
68
69 function deactivate()
70 end
71
72 -- Dialog closed
73 function close()
74     -- Deactivate this extension
75     vlc.deactivate()
76 end
77
78 -- Some global variables: widgets
79 list = nil
80 button_open = nil
81 titles = nil
82 html = nil
83
84 function click_okay()
85     vlc.msg.dbg("Searching for " .. txt:get_text() .. " on IMDb")
86
87     if html then
88         dlg:del_widget(html)
89         html = nil
90     end
91
92     if not list then
93         list = dlg:add_list(1, 3, 4, 1)
94         button_open = dlg:add_button("Open", "click_open", 1, 4, 4, 1)
95     end
96
97     -- Clear previous results
98     list:clear()
99
100     -- Search IMDb
101     local url = "http://www.imdb.com/find?s=all&q="
102     local title = string.gsub(txt:get_text(), " ", "+")
103     local s = vlc.stream(url .. title)
104
105     -- Fetch HTML data
106     local data = s:read(65000)
107
108     -- Find titles
109     titles = {}
110     local count = 0
111
112     idxEnd = 1
113     while idxEnd ~= nil do
114         -- Find title types
115         _, idxEnd, titleType = string.find(data, "<b>([^<]*Titles[^<]*)</b>", idxEnd)
116         _, _, nextTitle = string.find(data, "<b>([^<]*Titles[^<]*)</b>", idxEnd)
117         if not titleType then
118             break
119         else
120             -- Find current scope
121             if not nextTitle then
122                 _, _, table = string.find(data, "<table>(.*)</table>", idxEnd)
123             else
124                 nextTitle = string.gsub(nextTitle, "%(", "%%(")
125                 nextTitle = string.gsub(nextTitle, "%)", "%%)")
126                 _, _, table = string.find(data, "<table>(.*)</table>.*"..nextTitle, idxEnd)
127             end
128             -- Find all titles in this scope
129             if not table then break end
130             pos = 0
131             while pos ~= nil do
132                 _, _, link = string.find(table, "<a href=\"([^\"]+title[^\"]+)\"", pos)
133                 if not link then break end -- this would not be normal behavior...
134                 _, pos, title = string.find(table, "<a href=\"" .. link .. "\"[^>]*>([^<]+)</a>", pos)
135                 if not title then break end -- this would not be normal behavior...
136                 _, _, year = string.find(table, "\((%d+)\)", pos)
137                 -- Add this title to the list
138                 count = count + 1
139                 _, _, imdbID = string.find(link, "/([^/]+)/$")
140                 title = replace_html_chars(title)
141                 titles[count] = { id = imdbID ; title = title ; year = year ; link = link }
142             end
143         end
144     end
145
146     for idx, title in ipairs(titles) do
147         list:add_value("[" .. title.id .. "] " .. title.title .. " (" .. title.year .. ")", idx)
148     end
149 end
150
151 function click_open()
152     selection = list:get_selection()
153     if not selection then return 1 end
154     if not html then
155         html = dlg:add_html("Loading IMDb page...", 1, 3, 4, 1)
156         -- userLink = dlg:add_label("", 1, 4, 5, 1)
157     end
158
159     dlg:del_widget(list)
160     dlg:del_widget(button_open)
161     list = nil
162     button_open = nil
163
164     local sel = nil
165     for idx, selectedItem in pairs(selection) do
166         sel = idx
167         break
168     end
169     imdbID = titles[sel].id
170     url = "http://www.imdb.org/title/" .. imdbID .. "/"
171
172     -- userLink:set_text("<a href=\"url\">" .. url .. "</a>")
173
174     local s = vlc.stream(url)
175     data = s:read(65000)
176
177     text = "<h1>" .. titles[sel].title .. " (" .. titles[sel].year .. ")</h1>"
178     text = text .. "<h2>Overview</h2><table>"
179
180     -- Director
181     local director = nil
182     _, nextIdx, _ = string.find(data, "<div id=\"director-info\"", 1, true)
183     if nextIdx then
184         _, _, director = string.find(data, "<a href[^>]+>([%w%s]+)</a>", nextIdx)
185     end
186     if not director then
187         director = "(Unknown)"
188     end
189     text = text .. "<tr><td><b>Director</b></td><td>" .. director .. "</td></tr>"
190
191     -- Main genres
192     local genres = "<tr><td><b>Genres</b></td>"
193     local first = true
194     for genre, _ in string.gmatch(data, "/Sections/Genres/(%w+)/\">") do
195         if first then
196             genres = genres .. "<td>" .. genre .. "</td></tr>"
197         else
198             genres = genres .. "<tr><td /><td>" .. genre .. "</td></tr>"
199         end
200         first = false
201     end
202     text = text .. genres
203
204     -- List main actors
205     local actors = "<tr><td><b>Cast</b></td>"
206     first = true
207     for nm, char in string.gmatch(data, "<td class=\"nm\"><a[^>]+>([%w%s]+)</a></td><td class=\"ddd\"> ... </td><td class=\"char\"><a[^>]+>([%w%s]+)</a>") do
208         if not first then
209             actors = actors .. "<tr><td />"
210         end
211         actors = actors .. "<td>" .. nm .. "</td><td><i>" .. char .. "</i></td></tr>"
212         first = false
213     end
214     text = text .. actors .. "</table>"
215
216     text = text .. "<h2>Plot Summary</h2>"
217     s = vlc.stream(url .. "plotsummary")
218     data = s:read(65000)
219
220     -- We read only the first summary
221     _, _, summary = string.find(data, "<p class=\"plotpar\">([^<]+)")
222     if not summary then
223         summary = "(Unknown)"
224     end
225     text = text .. "<p>" .. summary .. "</p>"
226     text = text .. "<p><h2>Source IMDb</h2><a href=\"" .. url .. "\">" .. url .. "</a></p>"
227
228     html:set_text(text)
229 end
230
231 -- Convert some HTML characters into UTF8
232 function replace_html_chars(txt)
233     if not txt then return nil end
234     -- return vlc.strings.resolve_xml_special_chars(txt)
235     for num in string.gmatch(txt, "&#x(%x+);") do
236         -- Convert to decimal (any better way?)
237         dec = 0
238         for c in string.gmatch(num, "%x") do
239             cc = string.byte(c) - string.byte("0")
240             if (cc >= 10 or cc < 0) then
241                 cc = string.byte(string.lower(c)) - string.byte("a") + 10
242             end
243             dec = dec * 16 + cc
244         end
245         txt = string.gsub(txt, "&#x" .. num .. ";", string.char(dec))
246     end
247     return txt
248 end
249