]> git.sesse.net Git - vlc/blob - share/lua/playlist/youtube.lua
youtube.lua: update to new website changes
[vlc] / share / lua / playlist / youtube.lua
1 --[[
2  $Id$
3
4  Copyright © 2007-2009 the VideoLAN team
5
6  This program is free software; you can redistribute it and/or modify
7  it under the terms of the GNU General Public License as published by
8  the Free Software Foundation; either version 2 of the License, or
9  (at your option) any later version.
10
11  This program is distributed in the hope that it will be useful,
12  but WITHOUT ANY WARRANTY; without even the implied warranty of
13  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14  GNU General Public License for more details.
15
16  You should have received a copy of the GNU General Public License
17  along with this program; if not, write to the Free Software
18  Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston MA 02110-1301, USA.
19 --]]
20
21 -- Helper function to get a parameter's value in a URL
22 function get_url_param( url, name )
23     local _, _, res = string.find( url, "[&?]"..name.."=([^&]*)" )
24     return res
25 end
26
27 function get_arturl( path, video_id )
28     if string.match( vlc.path, "iurl=" ) then
29         return vlc.strings( get_url_param( vlc.path, "iurl" ) )
30     end
31     if not arturl then
32         return "http://img.youtube.com/vi/"..video_id.."/default.jpg"
33     end
34 end
35
36 -- Probe function.
37 function probe()
38     if vlc.access ~= "http" and vlc.access ~= "https" then
39         return false
40     end
41     youtube_site = string.match( string.sub( vlc.path, 1, 8 ), "youtube" )
42     if not youtube_site then
43         -- FIXME we should be using a builtin list of known youtube websites
44         -- like "fr.youtube.com", "uk.youtube.com" etc..
45         youtube_site = string.find( vlc.path, ".youtube.com" )
46         if youtube_site == nil then
47             return false
48         end
49     end
50     return (  string.match( vlc.path, "watch%?v=" ) -- the html page
51             or string.match( vlc.path, "watch_fullscreen%?video_id=" ) -- the fullscreen page
52             or string.match( vlc.path, "p.swf" ) -- the (old?) player url
53             or string.match( vlc.path, "jp.swf" ) -- the (new?) player url (as of 24/08/2007)
54             or string.match( vlc.path, "player2.swf" ) ) -- another player url
55 end
56
57 -- Parse function.
58 function parse()
59     if string.match( vlc.path, "watch%?v=" )
60     then -- This is the HTML page's URL
61         -- fmt is the format of the video: 18 is HQ (mp4)
62         fmt = get_url_param( vlc.path, "fmt" )
63         while true do
64             -- Try to find the video's title
65             line = vlc.readline()
66             if not line then break end
67             if string.match( line, "<meta name=\"title\"" ) then
68                 _,_,name = string.find( line, "content=\"(.-)\"" )
69                 name = vlc.strings.resolve_xml_special_chars( name )
70                 name = vlc.strings.resolve_xml_special_chars( name )
71             end
72             if string.match( line, "<meta name=\"description\"" ) then
73                -- Don't ask me why they double encode ...
74                 _,_,description = vlc.strings.resolve_xml_special_chars(vlc.strings.resolve_xml_special_chars(string.find( line, "content=\"(.-)\"" )))
75             end
76             if string.match( line, "subscribe_to_user=" ) then
77                 _,_,artist = string.find( line, "subscribe_to_user=([^&]*)" )
78             end
79             -- CURRENT: var swfConfig = { [a lot of stuff...], "video_id": "OHVvVmUNBFc", "sk": "WswKuJzDBsdD6oG3IakCXgC", "t": "OEgsToPDskK3zO44y0QN8Fr5ZSAZwCQp", "plid": "AARGnwWMrmGkbpOxAAAA4AT4IAA"};
80             -- OLD 1: var swfArgs = {hl:'en',BASE_YT_URL:'http://youtube.com/',video_id:'XPJ7d8dq0t8',l:'292',t:'OEgsToPDskLFdOYrrlDm3FQPoQBYaCP1',sk:'0gnr-AE6QZJEZmCMd3lq_AC'};
81             -- OLD 2: var swfArgs = { "BASE_YT_URL": "http://youtube.com", "video_id": "OHVvVmUNBFc", "l": 88, "sk": "WswKuJzDBsdD6oG3IakCXgC", "t": "OEgsToPDskK3zO44y0QN8Fr5ZSAZwCQp", "plid": "AARGnwWMrmGkbpOxAAAA4AT4IAA", "tk": "mEL4E7PqHeaZp5OG19NQThHt9mXJU4PbRTOw6lz9osHi4Hixp7RE1w=="};
82             -- OLD 3: 'SWF_ARGS': { [a lot of stuff...], "video_id": "OHVvVmUNBFc", "sk": "WswKuJzDBsdD6oG3IakCXgC", "t": "OEgsToPDskK3zO44y0QN8Fr5ZSAZwCQp", "plid": "AARGnwWMrmGkbpOxAAAA4AT4IAA"};
83             if ( string.match( line, "PLAYER_CONFIG" ) or string.match( line, "swfConfig" ) or string.match( line, "SWF_ARGS" ) or string.match( line, "swfArgs" ) ) and string.match( line, "video_id" ) then
84                 if string.match( line, "BASE_YT_URL" ) then
85                     _,_,base_yt_url = string.find( line, "\"BASE_YT_URL\": \"(.-)\"" )
86                 end
87                 _,_,t = string.find( line, "\"t\": \"(.-)\"" )
88                 -- vlc.msg.err( t )
89                 -- video_id = string.gsub( line, ".*&video_id:'([^']*)'.*", "%1" )
90                 fmt_url_map = string.match( line, "\"fmt_url_map\": \"(.-)\"" )
91                 -- FIXME: do this properly
92                 fmt_url_map = string.gsub( fmt_url_map, "\\u0026", "&" )
93                 if fmt_url_map then
94                     for itag,url in string.gmatch( fmt_url_map, "(%d+)|([^,]+)" ) do
95                         -- Apparently formats are listed in quality order,
96                         -- so we can afford to simply take the first one
97                         if not fmt or tonumber( itag ) == tonumber( fmt ) then
98                             -- do unescaping of /
99                             url = string.gsub( url, '\\/','/' )
100                             path = url
101                             break
102                         end
103                     end
104                 end
105             -- Also available on non-HTML5 pages: var swfHTML = (isIE) ? "<object [...]><param name=\"flashvars\" value=\"rv.2.thumbnailUrl=http%3A%2F%2Fi4.ytimg.com%2Fvi%2F3MLp7YNTznE%2Fdefault.jpg&rv.7.length_seconds=384 [...] &video_id=OHVvVmUNBFc [...] &t=OEgsToPDskK3zO44y0QN8Fr5ZSAZwCQp [...]
106             elseif string.match( line, "swfHTML" ) and string.match( line, "video_id" ) then
107                 _,_,t = string.find( line, "&t=(.-)&" )
108             -- Also available in HTML5 pages: videoPlayer.setAvailableFormat("http://v6.lscache4.c.youtube.com/videoplayback?ip=82.0.0.0&sparams=id%2Cexpire%2Cip%2Cipbits%2Citag%2Calgorithm%2Cburst%2Cfactor&algorithm=throttle-factor&itag=45&ipbits=8&burst=40&sver=3&expire=1275688800&key=yt1&signature=6ED860441298D1157FF3013A5D72727F25831F09.4C196BEA9F8F9B83CE678D79AD918B83D5E98B46&factor=1.25&id=7117715cf57d18d4", "video/webm; codecs=&quot;vp8.0, vorbis&quot;", "hd720");
109             elseif string.match( line, "videoPlayer%.setAvailableFormat" ) then
110                 url,itag = string.match( line, "videoPlayer%.setAvailableFormat%(\"(.-itag=(%d+).-)\",.+%)" )
111                 if url then
112                     -- For now, WebM formats are listed only in the HTML5
113                     -- section, that is also only when HTML5 is enabled.
114                     -- Format 45 is 720p, and 43 is lower resolution.
115                     if tonumber( itag ) == 45  or ( tonumber( itag ) == 43 and not webm_path ) then
116                         webm_path = url
117                     end
118                     -- Grab something if fmt_url_map failed
119                     if not path and ( not fmt or tonumber( itag ) == tonumber( fmt ) ) then
120                         path = url
121                     end
122                 end
123             end
124         end
125
126         if not video_id then
127             video_id = get_url_param( vlc.path, "v" )
128         end
129         arturl = get_arturl( vlc.path, video_id )
130
131         if not fmt then
132             -- Prefer WebM formats if this is an &html5=True URL
133             html5 = get_url_param( vlc.path, "html5" )
134             if html5 == "True" and webm_path then
135                 path = webm_path
136             end
137         end
138
139         if not path then
140             if not base_yt_url then
141                 base_yt_url = "http://youtube.com/"
142             end
143             if fmt then
144                 format = "&fmt=" .. fmt
145             else
146                 format = ""
147             end
148
149             if t then
150                 path = base_yt_url .. "get_video?video_id="..video_id.."&t="..t..format
151             else
152                 -- This shouldn't happen ... but keep it as a backup.
153                 path = "http://www.youtube.com/v/"..video_id
154             end
155         end
156         return { { path = path; name = name; description = description; artist = artist; arturl = arturl } }
157     else -- This is the flash player's URL
158         if string.match( vlc.path, "title=" ) then
159             name = vlc.strings.decode_uri(get_url_param( vlc.path, "title" ))
160         end
161         video_id = get_url_param( vlc.path, "video_id" )
162         arturl = get_arturl( vlc.path, video_id )
163         fmt = get_url_param( vlc.path, "fmt" )
164         if fmt then
165             format = "&fmt=" .. fmt
166         else
167             format = ""
168         end
169         if not string.match( vlc.path, "t=" ) then
170             -- This sucks, we're missing "t" which is now mandatory. Let's
171             -- try using another url
172             return { { path = "http://www.youtube.com/v/"..video_id; name = name; arturl = arturl } }
173         end
174         return { { path = "http://www.youtube.com/get_video.php?video_id="..video_id.."&t="..get_url_param( vlc.path, "t" )..format; name = name; arturl = arturl } }
175     end
176 end