Youtube Subtitle Downloader v2

download youtube COMPLETE subtitle

As of 02.08.2015. See ბოლო ვერსია.

  1. // ==UserScript==
  2. // @name Youtube Subtitle Downloader v2
  3. // @include http://*youtube.com/watch*
  4. // @include https://*youtube.com/watch*
  5. // @author Cheng Zheng
  6. // @copyright 2009 Tim Smart; 2011 gw111zz; 2013 Cheng Zheng;
  7. // @license GNU GPL v3.0 or later. http://www.gnu.org/copyleft/gpl.html
  8. // @require http://ajax.googleapis.com/ajax/libs/jquery/1.9.1/jquery.min.js
  9. // @version 2
  10. // @namespace https://greasyfork.org/users/5711
  11. // @description download youtube COMPLETE subtitle
  12. // ==/UserScript==
  13.  
  14.  
  15. /*
  16. Third Author : Cheng Zheng
  17. Email : guokrfans@gmail.com
  18. Last update : 2015/7/30
  19. Github: https://github.com/1c7/Youtube-Auto-Subtitle-Download
  20. Code comment are written in Chinese.
  21. If you need help, just let me know.
  22. */
  23.  
  24.  
  25.  
  26.  
  27. var PLAYER = unsafeWindow.document.getElementById('movie_player'),
  28. VIDEO_ID = unsafeWindow.ytplayer.config.args.video_id,
  29. TITLE = unsafeWindow.ytplayer.config.args.title,
  30. caption_array = [];
  31.  
  32.  
  33.  
  34.  
  35. /*
  36. process_time 这个函数是为了处理时间格式.
  37. 因为 Youtube 没直接提供 srt 的格式,
  38. Youtube 提供的格式类似这样: start="671.33" start="37.64" start="12" start="23.029"
  39. 671.33 这个是字幕开始的时间, 单位是秒. 小数点后是毫秒.
  40. 我们处理成 srt 格式的时间, 比如 00:00:00,090 00:00:08,460 00:10:29,350
  41. */
  42. function process_time(s){
  43. s = parseFloat(s).toFixed(3);
  44. // 超棒的函数, 可以把不论是整数还是小数它都给你弄成3位小数形式的数字.
  45. // 举个柚子:
  46. // 671.33 -> 671.330
  47. // 671 -> 671.000
  48. // 注意, 这个函数会四舍五入. 具体可以去读文档
  49.  
  50. var array = s.split('.');
  51. // 把开始时间根据句号分割
  52. // 671.330 会分割成数组: [671, 330]
  53.  
  54. var Hour = 0;
  55. var Minute = 0;
  56. var Second = array[0]; // 671
  57. var MilliSecond = array[1]; // 330
  58. // 先声明一下变量, 待会把这几个拼好就行了。
  59.  
  60. // 我们来处理秒数. 把"分钟"和"小时"除出来。
  61. if(Second >= 60){
  62.  
  63. Minute = Math.floor(Second / 60);
  64. Second = Second - Minute * 60;
  65. // 我们把 秒 拆成 分钟和秒, 比如121秒, 拆成2分钟1秒
  66.  
  67. Hour = Math.floor(Minute / 60);
  68. Minute = Minute - Hour * 60;
  69. // 我们把 分钟 拆成 小时和分钟, 比如700分钟, 拆成11小时40分钟
  70. }
  71. // 处理分钟,如果位数不够两位就变成两位,下面两个if语句的作用也是一样。
  72. if (Minute < 10){
  73. Minute = '0' + Minute;
  74. }
  75. // 处理小时
  76. if (Hour < 10){
  77. Hour = '0' + Hour;
  78. }
  79. // 处理秒
  80. if (Second < 10){
  81. Second = '0' + Second;
  82. }
  83.  
  84. return Hour + ':' + Minute + ':' + Second + ',' + MilliSecond;
  85. }
  86.  
  87.  
  88.  
  89.  
  90.  
  91. // 下载字幕用的函数.
  92. function download_subtitle (selector) {
  93.  
  94. var caption = caption_array[selector.selectedIndex - 1];
  95. if (!caption) return;
  96. language_name_1c7 = caption.lang_name;
  97.  
  98. var url = 'https://video.google.com/timedtext?hl=' + caption.lang_code
  99. + '&lang=' + caption.lang_code
  100. + '&name=' + caption.name
  101. + '&v=' + VIDEO_ID;
  102. console.log(url);
  103. // 加了这句之后, 下载字幕时控制台会输出字幕的url地址.
  104.  
  105. jQuery.get(url).done(function(r){
  106. var text = r.getElementsByTagName('text');
  107. // 拿到所有的text节点
  108. var result = "";
  109. // 保存结果的字符串
  110. for(var i=0; i<text.length; i++){
  111. var index = i+1;
  112. // 这个是字幕的索引, 从1开始的, 但是因为我们的循环是从0开始的, 所以加个1
  113. var content = text[i].textContent.replace(/\n/g, " ");
  114. // content 保存的是字幕内容 - 这里把换行换成了空格, 因为 Youtube 显示的多行字幕中间会有个\n, 如果不加这个replace. 两行的内容就会黏在一起.
  115. var start = text[i].getAttribute('start');
  116. //console.log(start);
  117. var end = $(text[i+1]).attr('start');
  118. if(!end){
  119. end = start + 5;
  120. }
  121. //console.log(end);
  122. // ==== 开始处理数据, 把数据保存到result里. ====
  123. result = result + index + '\r\n';
  124. // 把序号加进去
  125. var start_time = process_time( parseFloat(start) );
  126. result = result + start_time;
  127. //console.log(start_time);
  128. // 拿到 开始时间 之后往result字符串里存一下
  129. result = result + ' --> ';
  130. // 标准srt时间轴: 00:00:01,850 --> 00:00:02,720
  131. // 我们现在加个中间的箭头..
  132. var end_time = process_time( parseFloat(end) );
  133. result = result + end_time + '\r\n';
  134. //console.log(end_time);
  135. // 拿到 结束时间 之后往result字符串里存一下
  136. result = result + content + '\r\n\r\n';
  137. // 加字幕内容
  138. }
  139. result = result.replace(/&#39;/g, "'");
  140. // 字幕里会有html实体字符..所以我们替换掉
  141.  
  142.  
  143. var title = '(' + language_name_1c7 + ')' + TITLE + '.srt';
  144. downloadFile(title, result);
  145. // 下载
  146.  
  147. }).fail(function() {
  148. alert("Error: No response from server.");
  149. });
  150.  
  151.  
  152. selector.options[0].selected = true;
  153. // 下载完之后把选项框选回第一个元素. 也就是 Download captions.
  154. }
  155.  
  156.  
  157. // 载入字幕有多少种语言的函数, 然后加到那个选项框里
  158. function load_language_list (select) {
  159. GM_xmlhttpRequest({
  160. method: 'GET',
  161. url: 'https://video.google.com/timedtext?hl=en&v=' + VIDEO_ID + '&type=list',
  162. onload: function( xhr ) {
  163. var caption, option, caption_info,
  164. captions = new DOMParser().parseFromString(xhr.responseText, "text/xml").getElementsByTagName('track');
  165. if (captions.length === 0) {
  166. return select.options[0].textContent = 'No captions.';
  167. }
  168. for (var i = 0, il = captions.length; i < il; i++) {
  169. caption = captions[i];
  170. option = document.createElement('option');
  171. caption_info = {
  172. name: caption.getAttribute('name'),
  173. lang_code: caption.getAttribute('lang_code'),
  174. lang_name: caption.getAttribute('lang_translated')
  175. };
  176. caption_array.push(caption_info);
  177. option.textContent = caption_info.lang_name;
  178. select.appendChild(option);
  179. }
  180. select.options[0].textContent = 'Download captions.';
  181. select.disabled = false;
  182. }
  183. });
  184. }
  185.  
  186.  
  187.  
  188. function inject_our_script(){
  189. var div = document.createElement('div'),
  190. select = document.createElement('select'),
  191. option = document.createElement('option'),
  192. controls = document.getElementById('watch7-headline'); // 装视频标题的div
  193.  
  194. div.setAttribute( 'style', 'margin-bottom: 10px; display: inline-block; border: 1px solid rgb(0, 183, 90); cursor: pointer; color: rgb(255, 255, 255); border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: #00B75A;margin-left: 4px; ');
  195.  
  196. select.id = 'captions_selector';
  197. select.disabled = true;
  198. select.setAttribute( 'style', 'border: 1px solid rgb(0, 183, 90); cursor: pointer; color: rgb(255, 255, 255); background-color: #00B75A;');
  199. option.textContent = 'Loading...';
  200. option.selected = true;
  201. select.appendChild(option);
  202. // 添加这个选项, 这个选项默认被选中, 文字是"Loading..."
  203. select.addEventListener('change', function() {
  204. download_subtitle(this);
  205. }, false);
  206. // 事件侦听.
  207. div.appendChild(select);
  208. // 往新建的div里面放入select
  209. controls.appendChild(div);
  210. // 往页面上添加这个div
  211. load_language_list(select);
  212. // 这个是用来载入有多少字幕的函数, 不是下载字幕的函数
  213. var a = document.createElement('a');
  214. a.style.cssText = 'display:none;';
  215. a.setAttribute("id", "ForSubtitleDownload");
  216. var body = document.getElementsByTagName('body')[0];
  217. body.appendChild(a);
  218. // 这个元素用于下载.
  219. }
  220.  
  221.  
  222.  
  223.  
  224.  
  225. /*
  226.  
  227. 重点总结先:我没能解决必须手动刷新出按钮的问题。具体原因如下。
  228.  
  229. Youtube 的跳转方式是 Ajax, 而 Tampermonkey 的注入方式是刷新才注入.
  230. 这就造成了换了视频之后还得手动刷新一遍才行.
  231.  
  232. 为了不手动刷新,那必须有一种办法检测页面是否 Ajax 刷新了。如果刷新了就马上注入。
  233. 但是别忘了,你直接点左上角 LOGO 也是 Ajax 载入,然后首页当然不是播放页,我们就不用注入了。
  234.  
  235. 所以,
  236. 1. 得检测是否 Ajax 刷新完成了
  237. 2. 得检测是否是播放页。其他页面注入没用。
  238.  
  239.  
  240. 试过的一些方法如下:
  241. 1. 检测标题的 change event.
  242.  
  243. 这个是 Youtube 标题
  244. <span id="eow-title" class="watch-title " dir="ltr" title="Why Do We Wear Clothes?">
  245. Why Do We Wear Clothes?
  246. </span>
  247.  
  248. 但实际发现监听 change 没用, 这个是 Form Event.
  249. https://api.jquery.com/change/
  250.  
  251.  
  252. 如下这个也没用.
  253. $(document).ajaxComplete(function() {
  254. alert("asdasd");
  255. });
  256.  
  257. 没用
  258. $(unsafeWindow.document).ajaxComplete(function() {
  259. alert("asdasd");
  260. });
  261.  
  262.  
  263.  
  264. */
  265.  
  266. (function () {
  267.  
  268. inject_our_script();
  269. })();
  270.  
  271.  
  272.  
  273.  
  274.  
  275.  
  276. // 下面这个函数不是我写的。我之前写的那种下载方法在 Chrome 更新之后失效了。不能指定下载时的文件名。
  277. // 后来搜索了下找到这个解决方案就直接复制过来用了。
  278. // 复制自: http://www.alloyteam.com/2014/01/use-js-file-download/
  279. function downloadFile(fileName, content){
  280. var aLink = document.createElement('a');
  281. var blob = new Blob([content]);
  282. var evt = document.createEvent("HTMLEvents");
  283. evt.initEvent("click", false, false);
  284. aLink.download = fileName;
  285. aLink.href = URL.createObjectURL(blob);
  286. aLink.dispatchEvent(evt);
  287. }
  288.  
  289.  
  290.  
  291.  
  292.  
  293.