]> git.sesse.net Git - vlc/blob - share/lua/playlist/youtube.lua
88b9055bf30de01a4e032eb2dfa57be4de9baf1f
[vlc] / share / lua / playlist / youtube.lua
1 --[[
2  $Id$
3
4  Copyright © 2007-2011 the VideoLAN team
5
6  This program is free software; you can redistribute it and/or modify
7  it under the terms of the GNU General Public License as published by
8  the Free Software Foundation; either version 2 of the License, or
9  (at your option) any later version.
10
11  This program is distributed in the hope that it will be useful,
12  but WITHOUT ANY WARRANTY; without even the implied warranty of
13  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14  GNU General Public License for more details.
15
16  You should have received a copy of the GNU General Public License
17  along with this program; if not, write to the Free Software
18  Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston MA 02110-1301, USA.
19 --]]
20
21 -- Helper function to get a parameter's value in a URL
22 function get_url_param( url, name )
23     local _, _, res = string.find( url, "[&?]"..name.."=([^&]*)" )
24     return res
25 end
26
27 function get_arturl( path, video_id )
28     if string.match( vlc.path, "iurl=" ) then
29         return vlc.strings( get_url_param( vlc.path, "iurl" ) )
30     end
31     if not arturl then
32         return "http://img.youtube.com/vi/"..video_id.."/default.jpg"
33     end
34 end
35
36 -- Probe function.
37 function probe()
38     if vlc.access ~= "http" and vlc.access ~= "https" then
39         return false
40     end
41     youtube_site = string.match( string.sub( vlc.path, 1, 8 ), "youtube" )
42     if not youtube_site then
43         -- FIXME we should be using a builtin list of known youtube websites
44         -- like "fr.youtube.com", "uk.youtube.com" etc..
45         youtube_site = string.find( vlc.path, ".youtube.com" )
46         if youtube_site == nil then
47             return false
48         end
49     end
50     return (  string.match( vlc.path, "watch%?v=" ) -- the html page
51             or string.match( vlc.path, "watch_fullscreen%?video_id=" ) -- the fullscreen page
52             or string.match( vlc.path, "p.swf" ) -- the (old?) player url
53             or string.match( vlc.path, "jp.swf" ) -- the (new?) player url (as of 24/08/2007)
54             or string.match( vlc.path, "player2.swf" ) ) -- another player url
55 end
56
57 -- Parse function.
58 function parse()
59     if string.match( vlc.path, "watch%?v=" )
60     then -- This is the HTML page's URL
61         -- fmt is the format of the video
62         -- (cf. http://en.wikipedia.org/wiki/YouTube#Quality_and_codecs)
63         fmt = get_url_param( vlc.path, "fmt" )
64         while true do
65             -- Try to find the video's title
66             line = vlc.readline()
67             if not line then break end
68             if string.match( line, "<meta name=\"title\"" ) then
69                 _,_,name = string.find( line, "content=\"(.-)\"" )
70                 name = vlc.strings.resolve_xml_special_chars( name )
71                 name = vlc.strings.resolve_xml_special_chars( name )
72             end
73             if string.match( line, "<meta name=\"description\"" ) then
74                -- Don't ask me why they double encode ...
75                 _,_,description = string.find( line, "content=\"(.-)\"" )
76                 description = vlc.strings.resolve_xml_special_chars( description )
77                 description = vlc.strings.resolve_xml_special_chars( description )
78             end
79             if string.match( line, "<meta property=\"og:image\"" ) then
80                 _,_,arturl = string.find( line, "content=\"(.-)\"" )
81             end
82             if string.match( line, " rel=\"author\"" ) then
83                 _,_,artist = string.find( line, "href=\"/user/([^\"]*)\"" )
84             end
85             -- JSON parameters, also formerly known as "swfConfig",
86             -- "SWF_ARGS", "swfArgs" ...
87             if string.match( line, "PLAYER_CONFIG" ) then
88                 url_map = string.match( line, "\"url_encoded_fmt_stream_map\": \"(.-)\"" )
89                 if url_map then
90                     -- FIXME: do this properly
91                     url_map = string.gsub( url_map, "\\u0026", "&" )
92                     for url,itag in string.gmatch( url_map, "url=([^&,]+).-&itag=(%d+)" ) do
93                         -- Apparently formats are listed in quality order,
94                         -- so we can afford to simply take the first one
95                         if not fmt or tonumber( itag ) == tonumber( fmt ) then
96                             url = vlc.strings.decode_uri( url )
97                             path = url
98                             break
99                         end
100                     end
101                 end
102             -- There is also another version of the parameters, encoded
103             -- differently, as an HTML attribute of an <object> or <embed>
104             -- tag; but we don't need it now
105             end
106         end
107
108         if not arturl then
109             video_id = get_url_param( vlc.path, "v" )
110             arturl = get_arturl( vlc.path, video_id )
111         end
112
113         if not path then
114             vlc.msg.err( "Couldn't extract youtube video URL, please check for updates to this script" )
115             return { }
116         end
117         return { { path = path; name = name; description = description; artist = artist; arturl = arturl } }
118     else -- This is the flash player's URL
119         if string.match( vlc.path, "title=" ) then
120             name = vlc.strings.decode_uri(get_url_param( vlc.path, "title" ))
121         end
122         video_id = get_url_param( vlc.path, "video_id" )
123         arturl = get_arturl( vlc.path, video_id )
124         fmt = get_url_param( vlc.path, "fmt" )
125         if fmt then
126             format = "&fmt=" .. fmt
127         else
128             format = ""
129         end
130         if not string.match( vlc.path, "t=" ) then
131             -- This sucks, we're missing "t" which is now mandatory. Let's
132             -- try using another url
133             return { { path = "http://www.youtube.com/v/"..video_id; name = name; arturl = arturl } }
134         end
135         return { { path = "http://www.youtube.com/get_video.php?video_id="..video_id.."&t="..get_url_param( vlc.path, "t" )..format; name = name; arturl = arturl } }
136     end
137 end