Merge branch 'PeterDing-iqiyi'

author Yen Chi Hsuan <yan12125@gmail.com>

Sat, 6 Jun 2015 18:59:27 +0000 (02:59 +0800)

committer Yen Chi Hsuan <yan12125@gmail.com>

Sat, 6 Jun 2015 18:59:27 +0000 (02:59 +0800)
author Yen Chi Hsuan <yan12125@gmail.com>
Sat, 6 Jun 2015 18:59:27 +0000 (02:59 +0800)
committer Yen Chi Hsuan <yan12125@gmail.com>
Sat, 6 Jun 2015 18:59:27 +0000 (02:59 +0800)
diff --git a/docs/supportedsites.md b/docs/supportedsites.md

index a421ae62bf95bd8173c0f6427163b25dd150ae18..d147b53fe60a5bba6f9d33d1fba684014513f83b 100644 (file)
--- a/docs/supportedsites.md
+++ b/docs/supportedsites.md
@@ -10,6 +10,7 @@
   - **56.com**
   - **5min**
   - **8tracks**
+ - **91porn**
   - **9gag**
   - **abc.net.au**
   - **Abc7News**
@@ -319,6 +320,7 @@
   - **Noco**
   - **Normalboots**
   - **NosVideo**
+ - **Nova**: TN.cz, Prásk.tv, Nova.cz, Novaplus.cz, FANDA.tv, Krásná.cz and Doma.cz
   - **novamov**: NovaMov
   - **Nowness**
   - **NowTV**
@@ -431,6 +433,8 @@
   - **smotri:user**: Smotri.com user videos
   - **Snotr**
   - **Sohu**
+ - **soompi**
+ - **soompi:show**
   - **soundcloud**
   - **soundcloud:playlist**
   - **soundcloud:set**
@@ -505,6 +509,7 @@
   - **Trilulilu**
   - **TruTube**
   - **Tube8**
+ - **TubiTv**
   - **Tudou**
   - **Tumblr**
   - **TuneIn**
diff --git a/test/test_aes.py b/test/test_aes.py

index 4dc7de7b5b8d55fc1d95296b58e076aba664e1cc..315a3f5ae6a597662d05f56e97672b4ff93aff10 100644 (file)
--- a/test/test_aes.py
+++ b/test/test_aes.py
@@ -39,7 +39,7 @@ class TestAES(unittest.TestCase):
          encrypted = base64.b64encode(
              intlist_to_bytes(self.iv[:8]) +
              b'\x17\x15\x93\xab\x8d\x80V\xcdV\xe0\t\xcdo\xc2\xa5\xd8ksM\r\xe27N\xae'
-        )
+        ).decode('utf-8')
          decrypted = (aes_decrypt_text(encrypted, password, 16))
          self.assertEqual(decrypted, self.secret_msg)
  
@@ -47,7 +47,7 @@ class TestAES(unittest.TestCase):
          encrypted = base64.b64encode(
              intlist_to_bytes(self.iv[:8]) +
              b'\x0b\xe6\xa4\xd9z\x0e\xb8\xb9\xd0\xd4i_\x85\x1d\x99\x98_\xe5\x80\xe7.\xbf\xa5\x83'
-        )
+        ).decode('utf-8')
          decrypted = (aes_decrypt_text(encrypted, password, 32))
          self.assertEqual(decrypted, self.secret_msg)
  
diff --git a/youtube_dl/extractor/empflix.py b/youtube_dl/extractor/empflix.py

index 9a5a8f4bb44039e6c52968801033a3d12a73d835..4827022e088cf33d064acf7ab8cebdadc0d743a0 100644 (file)
--- a/youtube_dl/extractor/empflix.py
+++ b/youtube_dl/extractor/empflix.py
@@ -26,6 +26,6 @@ class EMPFlixIE(TNAFlixIE):
          },
          {
              'url': 'http://www.empflix.com/videos/[AROMA][ARMD-718]-Aoi-Yoshino-Sawa-25826.html',
-            'matching_only': True,
+            'only_matching': True,
          }
      ]
diff --git a/youtube_dl/extractor/izlesene.py b/youtube_dl/extractor/izlesene.py

index 99a1361f844c15520c842cd9fffa1e5c2e9b6974..bc226fa67c064b991674a510b1eba54d40dc67e0 100644 (file)
--- a/youtube_dl/extractor/izlesene.py
+++ b/youtube_dl/extractor/izlesene.py
@@ -4,6 +4,7 @@ from __future__ import unicode_literals
  import re
  
  from .common import InfoExtractor
+from ..compat import compat_urllib_parse_unquote
  from ..utils import (
      determine_ext,
      float_or_none,
@@ -30,7 +31,7 @@ class IzleseneIE(InfoExtractor):
                  'description': 'md5:253753e2655dde93f59f74b572454f6d',
                  'thumbnail': 're:^http://.*\.jpg',
                  'uploader_id': 'pelikzzle',
-                'timestamp': 1404302298,
+                'timestamp': int,
                  'upload_date': '20140702',
                  'duration': 95.395,
                  'age_limit': 0,
@@ -46,7 +47,7 @@ class IzleseneIE(InfoExtractor):
                  'description': 'Tarkan Dortmund 2006 Konseri',
                  'thumbnail': 're:^http://.*\.jpg',
                  'uploader_id': 'parlayankiz',
-                'timestamp': 1163322193,
+                'timestamp': int,
                  'upload_date': '20061112',
                  'duration': 253.666,
                  'age_limit': 0,
@@ -67,9 +68,9 @@ class IzleseneIE(InfoExtractor):
  
          uploader = self._html_search_regex(
              r"adduserUsername\s*=\s*'([^']+)';",
-            webpage, 'uploader', fatal=False, default='')
+            webpage, 'uploader', fatal=False)
          timestamp = parse_iso8601(self._html_search_meta(
-            'uploadDate', webpage, 'upload date', fatal=False))
+            'uploadDate', webpage, 'upload date'))
  
          duration = float_or_none(self._html_search_regex(
              r'"videoduration"\s*:\s*"([^"]+)"',
@@ -86,8 +87,7 @@ class IzleseneIE(InfoExtractor):
  
          # Might be empty for some videos.
          streams = self._html_search_regex(
-            r'"qualitylevel"\s*:\s*"([^"]+)"',
-            webpage, 'streams', fatal=False, default='')
+            r'"qualitylevel"\s*:\s*"([^"]+)"', webpage, 'streams', default='')
  
          formats = []
          if streams:
@@ -95,15 +95,15 @@ class IzleseneIE(InfoExtractor):
                  quality, url = re.search(r'\[(\w+)\](.+)', stream).groups()
                  formats.append({
                      'format_id': '%sp' % quality if quality else 'sd',
-                    'url': url,
+                    'url': compat_urllib_parse_unquote(url),
                      'ext': ext,
                  })
          else:
              stream_url = self._search_regex(
-                r'"streamurl"\s?:\s?"([^"]+)"', webpage, 'stream URL')
+                r'"streamurl"\s*:\s*"([^"]+)"', webpage, 'stream URL')
              formats.append({
                  'format_id': 'sd',
-                'url': stream_url,
+                'url': compat_urllib_parse_unquote(stream_url),
                  'ext': ext,
              })
  
diff --git a/youtube_dl/extractor/nova.py b/youtube_dl/extractor/nova.py

index 4e999b2379a0310730e79abb14adf6da433d1c16..3f9c776ef665ab47624eeab7ba60f5754dbf213e 100644 (file)
--- a/youtube_dl/extractor/nova.py
+++ b/youtube_dl/extractor/nova.py
@@ -4,13 +4,17 @@ from __future__ import unicode_literals
  import re
  
  from .common import InfoExtractor
+from ..utils import (
+    clean_html,
+    unified_strdate,
+)
  
  
  class NovaIE(InfoExtractor):
      IE_DESC = 'TN.cz, Prásk.tv, Nova.cz, Novaplus.cz, FANDA.tv, Krásná.cz and Doma.cz'
-    _VALID_URL = 'http://(?:[^.]+\.)?(?P<site>tv(?:noviny)?|tn|novaplus|vymena|fanda|krasna|doma|prask)\.nova\.cz/(?:[^/]+/)+(?P<id>[^/]+)(?:\.html|/?)'
+    _VALID_URL = 'http://(?:[^.]+\.)?(?P<site>tv(?:noviny)?|tn|novaplus|vymena|fanda|krasna|doma|prask)\.nova\.cz/(?:[^/]+/)+(?P<id>[^/]+?)(?:\.html|/|$)'
      _TESTS = [{
-        'url': 'http://tvnoviny.nova.cz/clanek/novinky/co-na-sebe-sportaci-praskli-vime-jestli-pujde-hrdlicka-na-materskou.html',
+        'url': 'http://tvnoviny.nova.cz/clanek/novinky/co-na-sebe-sportaci-praskli-vime-jestli-pujde-hrdlicka-na-materskou.html?utm_source=tvnoviny&utm_medium=cpfooter&utm_campaign=novaplus',
          'info_dict': {
              'id': '1608920',
              'display_id': 'co-na-sebe-sportaci-praskli-vime-jestli-pujde-hrdlicka-na-materskou',
@@ -24,7 +28,7 @@ class NovaIE(InfoExtractor):
              'skip_download': True,
          }
      }, {
-        'url': 'http://tn.nova.cz/clanek/tajemstvi-ukryte-v-podzemi-specialni-nemocnice-v-prazske-krci.html',
+        'url': 'http://tn.nova.cz/clanek/tajemstvi-ukryte-v-podzemi-specialni-nemocnice-v-prazske-krci.html#player_13260',
          'md5': '1dd7b9d5ea27bc361f110cd855a19bd3',
          'info_dict': {
              'id': '1757139',
@@ -35,19 +39,46 @@ class NovaIE(InfoExtractor):
              'thumbnail': 're:^https?://.*\.(?:jpg)',
          }
      }, {
-        'url': 'http://novaplus.nova.cz/porad/policie-modrava/video/5591-policie-modrava-15-dil-blondynka-na-hrbitove/',
+        'url': 'http://novaplus.nova.cz/porad/policie-modrava/video/5591-policie-modrava-15-dil-blondynka-na-hrbitove',
          'info_dict': {
              'id': '1756825',
              'display_id': '5591-policie-modrava-15-dil-blondynka-na-hrbitove',
              'ext': 'flv',
              'title': 'Policie Modrava - 15. díl - Blondýnka na hřbitově',
-            'description': 'md5:d804ba6b30bc7da2705b1fea961bddfe',
+            'description': 'md5:dc24e50be5908df83348e50d1431295e',  # Make sure this description is clean of html tags
              'thumbnail': 're:^https?://.*\.(?:jpg)',
          },
          'params': {
              # rtmp download
              'skip_download': True,
          }
+    }, {
+        'url': 'http://novaplus.nova.cz/porad/televizni-noviny/video/5585-televizni-noviny-30-5-2015/',
+        'info_dict': {
+            'id': '1756858',
+            'ext': 'flv',
+            'title': 'Televizní noviny - 30. 5. 2015',
+            'thumbnail': 're:^https?://.*\.(?:jpg)',
+            'upload_date': '20150530',
+        },
+        'params': {
+            # rtmp download
+            'skip_download': True,
+        }
+    }, {
+        'url': 'http://fanda.nova.cz/clanek/fun-and-games/krvavy-epos-zaklinac-3-divoky-hon-vychazi-vyhrajte-ho-pro-sebe.html',
+        'info_dict': {
+            'id': '1753621',
+            'ext': 'mp4',
+            'title': 'Zaklínač 3: Divoký hon',
+            'description': 're:.*Pokud se stejně jako my nemůžete.*',
+            'thumbnail': 're:https?://.*\.jpg(\?.*)?',
+            'upload_date': '20150521',
+        },
+        'params': {
+            # rtmp download
+            'skip_download': True,
+        }
      }, {
          'url': 'http://sport.tn.nova.cz/clanek/sport/hokej/nhl/zivot-jde-dal-hodnotil-po-vyrazeni-z-playoff-jiri-sekac.html',
          'only_matching': True,
@@ -104,7 +135,7 @@ class NovaIE(InfoExtractor):
          config = self._download_json(
              config_url, display_id,
              'Downloading config JSON',
-            transform_source=lambda s: re.sub(r'var\s+[\da-zA-Z_]+\s*=\s*({.+?});', r'\1', s))
+            transform_source=lambda s: s[s.index('{'):s.rindex('}') + 1])
  
          mediafile = config['mediafile']
          video_url = mediafile['src']
@@ -125,14 +156,24 @@ class NovaIE(InfoExtractor):
          self._sort_formats(formats)
  
          title = mediafile.get('meta', {}).get('title') or self._og_search_title(webpage)
-        description = self._og_search_description(webpage)
+        description = clean_html(self._og_search_description(webpage, default=None))
          thumbnail = config.get('poster')
  
+        if site == 'novaplus':
+            upload_date = unified_strdate(self._search_regex(
+                r'(\d{1,2}-\d{1,2}-\d{4})$', display_id, 'upload date', default=None))
+        elif site == 'fanda':
+            upload_date = unified_strdate(self._search_regex(
+                r'<span class="date_time">(\d{1,2}\.\d{1,2}\.\d{4})', webpage, 'upload date', default=None))
+        else:
+            upload_date = None
+
          return {
              'id': video_id,
              'display_id': display_id,
              'title': title,
              'description': description,
+            'upload_date': upload_date,
              'thumbnail': thumbnail,
              'formats': formats,
          }
diff --git a/youtube_dl/extractor/pornovoisines.py b/youtube_dl/extractor/pornovoisines.py

index 9688ed94898de231e6c7f1c9dc28d3779da10311..eba4dfbb39576bff355b722c997dd31e07ce370f 100644 (file)
--- a/youtube_dl/extractor/pornovoisines.py
+++ b/youtube_dl/extractor/pornovoisines.py
@@ -34,7 +34,7 @@ class PornoVoisinesIE(InfoExtractor):
              'duration': 120,
              'view_count': int,
              'average_rating': float,
-            'categories': ['Débutante', 'Scénario', 'Sodomie'],
+            'categories': ['Débutantes', 'Scénario', 'Sodomie'],
              'age_limit': 18,
          }
      }
@@ -71,7 +71,7 @@ class PornoVoisinesIE(InfoExtractor):
          view_count = int_or_none(self._search_regex(
              r'(\d+) vues', webpage, 'view count', fatal=False))
          average_rating = self._search_regex(
-            r'Note : (\d+,\d+)', webpage, 'average rating', fatal=False)
+            r'Note\s*:\s*(\d+(?:,\d+)?)', webpage, 'average rating', fatal=False)
          if average_rating:
              average_rating = float_or_none(average_rating.replace(',', '.'))
  
diff --git a/youtube_dl/extractor/qqmusic.py b/youtube_dl/extractor/qqmusic.py

index b540033e25a8c8e033f9d7f7b49d6b6ae46f755b..bafa81c21c12f15ac8162f8303f56615124b260b 100644 (file)
--- a/youtube_dl/extractor/qqmusic.py
+++ b/youtube_dl/extractor/qqmusic.py
@@ -9,7 +9,6 @@ from .common import InfoExtractor
  from ..utils import (
      strip_jsonp,
      unescapeHTML,
-    js_to_json,
  )
  from ..compat import compat_urllib_request
  
@@ -19,10 +18,10 @@ class QQMusicIE(InfoExtractor):
      _VALID_URL = r'http://y.qq.com/#type=song&mid=(?P<id>[0-9A-Za-z]+)'
      _TESTS = [{
          'url': 'http://y.qq.com/#type=song&mid=004295Et37taLD',
-        'md5': 'bed90b6db2a7a7a7e11bc585f471f63a',
+        'md5': '9ce1c1c8445f561506d2e3cfb0255705',
          'info_dict': {
              'id': '004295Et37taLD',
-            'ext': 'm4a',
+            'ext': 'mp3',
              'title': '可惜没如果',
              'upload_date': '20141227',
              'creator': '林俊杰',
@@ -30,6 +29,12 @@ class QQMusicIE(InfoExtractor):
          }
      }]
  
+    _FORMATS = {
+        'mp3-320': {'prefix': 'M800', 'ext': 'mp3', 'preference': 40, 'abr': 320},
+        'mp3-128': {'prefix': 'M500', 'ext': 'mp3', 'preference': 30, 'abr': 128},
+        'm4a': {'prefix': 'C200', 'ext': 'm4a', 'preference': 10}
+    }
+
      # Reference: m_r_GetRUin() in top_player.js
      # http://imgcache.gtimg.cn/music/portal_v3/y/top_player.js
      @staticmethod
@@ -69,11 +74,22 @@ class QQMusicIE(InfoExtractor):
              'http://base.music.qq.com/fcgi-bin/fcg_musicexpress.fcg?json=3&guid=%s' % guid,
              mid, note='Retrieve vkey', errnote='Unable to get vkey',
              transform_source=strip_jsonp)['key']
-        song_url = 'http://cc.stream.qqmusic.qq.com/C200%s.m4a?vkey=%s&guid=%s&fromtag=0' % (mid, vkey, guid)
+
+        formats = []
+        for format_id, details in self._FORMATS.items():
+            formats.append({
+                'url': 'http://cc.stream.qqmusic.qq.com/%s%s.%s?vkey=%s&guid=%s&fromtag=0'
+                       % (details['prefix'], mid, details['ext'], vkey, guid),
+                'format': format_id,
+                'format_id': format_id,
+                'preference': details['preference'],
+                'abr': details.get('abr'),
+            })
+        self._sort_formats(formats)
  
          return {
              'id': mid,
-            'url': song_url,
+            'formats': formats,
              'title': song_name,
              'upload_date': publish_time,
              'creator': singer,
@@ -181,60 +197,49 @@ class QQMusicToplistIE(QQPlaylistBaseIE):
      _VALID_URL = r'http://y\.qq\.com/#type=toplist&p=(?P<id>(top|global)_[0-9]+)'
  
      _TESTS = [{
-        'url': 'http://y.qq.com/#type=toplist&p=global_12',
+        'url': 'http://y.qq.com/#type=toplist&p=global_123',
          'info_dict': {
-            'id': 'global_12',
-            'title': 'itunes榜',
+            'id': 'global_123',
+            'title': '美国iTunes榜',
          },
          'playlist_count': 10,
      }, {
-        'url': 'http://y.qq.com/#type=toplist&p=top_6',
+        'url': 'http://y.qq.com/#type=toplist&p=top_3',
          'info_dict': {
-            'id': 'top_6',
+            'id': 'top_3',
              'title': 'QQ音乐巅峰榜·欧美',
+            'description': 'QQ音乐巅峰榜·欧美根据用户收听行为自动生成，集结当下最流行的欧美新歌！:更新时间：每周四22点|统'
+                           '计周期：一周（上周四至本周三）|统计对象：三个月内发行的欧美歌曲|统计数量：100首|统计算法：根据'
+                           '歌曲在一周内的有效播放次数，由高到低取前100名（同一歌手最多允许5首歌曲同时上榜）|有效播放次数：'
+                           '登录用户完整播放一首歌曲，记为一次有效播放；同一用户收听同一首歌曲，每天记录为1次有效播放'
          },
          'playlist_count': 100,
      }, {
-        'url': 'http://y.qq.com/#type=toplist&p=global_5',
+        'url': 'http://y.qq.com/#type=toplist&p=global_106',
          'info_dict': {
-            'id': 'global_5',
-            'title': '韩国mnet排行榜',
+            'id': 'global_106',
+            'title': '韩国Mnet榜',
          },
          'playlist_count': 50,
      }]
  
-    @staticmethod
-    def strip_qq_jsonp(code):
-        return js_to_json(re.sub(r'^MusicJsonCallback\((.*?)\)/\*.+?\*/$', r'\1', code))
-
      def _real_extract(self, url):
          list_id = self._match_id(url)
  
          list_type, num_id = list_id.split("_")
  
-        list_page = self._download_webpage(
-            "http://y.qq.com/y/static/toplist/index/%s.html" % list_id,
-            list_id, 'Download toplist page')
-
-        entries = []
-        if list_type == 'top':
-            jsonp_url = "http://y.qq.com/y/static/toplist/json/top/%s/1.js" % num_id
-        else:
-            jsonp_url = "http://y.qq.com/y/static/toplist/json/global/%s/1_1.js" % num_id
-
          toplist_json = self._download_json(
-            jsonp_url, list_id, note='Retrieve toplist json',
-            errnote='Unable to get toplist json', transform_source=self.strip_qq_jsonp)
-
-        for song in toplist_json['l']:
-            s = song['s']
-            song_mid = s.split("|")[20]
-            entries.append(self.url_result(
-                'http://y.qq.com/#type=song&mid=' + song_mid, 'QQMusic',
-                song_mid))
+            'http://i.y.qq.com/v8/fcg-bin/fcg_v8_toplist_cp.fcg?type=%s&topid=%s&format=json'
+            % (list_type, num_id),
+            list_id, 'Download toplist page')
  
-        list_name = self._html_search_regex(
-            r'<h2 id="top_name">([^\']+)</h2>', list_page, 'top list name',
-            default=None)
+        entries = [
+            self.url_result(
+                'http://y.qq.com/#type=song&mid=' + song['data']['songmid'], 'QQMusic', song['data']['songmid']
+            ) for song in toplist_json['songlist']
+        ]
  
-        return self.playlist_result(entries, list_id, list_name)
+        topinfo = toplist_json.get('topinfo', {})
+        list_name = topinfo.get('ListName')
+        list_description = topinfo.get('info')
+        return self.playlist_result(entries, list_id, list_name, list_description)
diff --git a/youtube_dl/extractor/sunporno.py b/youtube_dl/extractor/sunporno.py

index 854d01beeb5cefd1f82d7991ee2c0ce75ad33dfa..e527aa97188b1860e054f8af7c7bd7a33301729e 100644 (file)
--- a/youtube_dl/extractor/sunporno.py
+++ b/youtube_dl/extractor/sunporno.py
@@ -44,7 +44,7 @@ class SunPornoIE(InfoExtractor):
              webpage, 'duration', fatal=False))
  
          view_count = int_or_none(self._html_search_regex(
-            r'class="views">\s*(\d+)\s*<',
+            r'class="views">(?:<noscript>)?\s*(\d+)\s*<',
              webpage, 'view count', fatal=False))
          comment_count = int_or_none(self._html_search_regex(
              r'(\d+)</b> Comments?',
diff --git a/youtube_dl/extractor/teamcoco.py b/youtube_dl/extractor/teamcoco.py

index b2a4b1fc05430558ad9b33a9aa3ce834107dc6e3..d1b7264b4ca4a0cb72e491da26d7f5bbc1cc66b7 100644 (file)
--- a/youtube_dl/extractor/teamcoco.py
+++ b/youtube_dl/extractor/teamcoco.py
@@ -51,6 +51,17 @@ class TeamcocoIE(InfoExtractor):
              'params': {
                  'skip_download': True,  # m3u8 downloads
              }
+        }, {
+            'url': 'http://teamcoco.com/video/full-episode-mon-6-1-joel-mchale-jake-tapper-and-musical-guest-courtney-barnett?playlist=x;eyJ0eXBlIjoidGFnIiwiaWQiOjl9',
+            'info_dict': {
+                'id': '89341',
+                'ext': 'mp4',
+                'title': 'Full Episode - Mon. 6/1 - Joel McHale, Jake Tapper, And Musical Guest Courtney Barnett',
+                'description': 'Guests: Joel McHale, Jake Tapper, And Musical Guest Courtney Barnett',
+            },
+            'params': {
+                'skip_download': True,  # m3u8 downloads
+            }
          }
      ]
      _VIDEO_ID_REGEXES = (
@@ -110,9 +121,23 @@ class TeamcocoIE(InfoExtractor):
          get_quality = qualities(['500k', '480p', '1000k', '720p', '1080p'])
          for filed in data['files']:
              if determine_ext(filed['url']) == 'm3u8':
-                formats.extend(self._extract_m3u8_formats(
-                    filed['url'], video_id, ext='mp4'))
+                # compat_urllib_parse.urljoin does not work here
+                if filed['url'].startswith('/'):
+                    m3u8_url = 'http://ht.cdn.turner.com/tbs/big/teamcoco' + filed['url']
+                else:
+                    m3u8_url = filed['url']
+                m3u8_formats = self._extract_m3u8_formats(
+                    m3u8_url, video_id, ext='mp4')
+                for m3u8_format in m3u8_formats:
+                    if m3u8_format not in formats:
+                        formats.append(m3u8_format)
+            elif determine_ext(filed['url']) == 'f4m':
+                # TODO Correct f4m extraction
+                continue
              else:
+                if filed['url'].startswith('/mp4:protected/'):
+                    # TODO Correct extraction for these files
+                    continue
                  m_format = re.search(r'(\d+(k|p))\.mp4', filed['url'])
                  if m_format is not None:
                      format_id = m_format.group(1)
diff --git a/youtube_dl/extractor/tnaflix.py b/youtube_dl/extractor/tnaflix.py

index 59af9aba06399cefcc6c2049c958dfb3819bb20a..c282865b2517d8cbd62df6f2dee0540146baae48 100644 (file)
--- a/youtube_dl/extractor/tnaflix.py
+++ b/youtube_dl/extractor/tnaflix.py
@@ -33,7 +33,7 @@ class TNAFlixIE(InfoExtractor):
          },
          {
              'url': 'https://www.tnaflix.com/amateur-porn/bunzHD-Ms.Donk/video358632',
-            'matching_only': True,
+            'only_matching': True,
          }
      ]
  
@@ -51,9 +51,8 @@ class TNAFlixIE(InfoExtractor):
  
          age_limit = self._rta_search(webpage)
  
-        duration = self._html_search_meta('duration', webpage, 'duration', default=None)
-        if duration:
-            duration = parse_duration(duration[1:])
+        duration = parse_duration(self._html_search_meta(
+            'duration', webpage, 'duration', default=None))
  
          cfg_url = self._proto_relative_url(self._html_search_regex(
              self._CONFIG_REGEX, webpage, 'flashvars.config'), 'http:')
@@ -62,14 +61,15 @@ class TNAFlixIE(InfoExtractor):
              cfg_url, display_id, note='Downloading metadata',
              transform_source=fix_xml_ampersands)
  
-        thumbnail = cfg_xml.find('./startThumb').text
+        thumbnail = self._proto_relative_url(
+            cfg_xml.find('./startThumb').text, 'http:')
  
          formats = []
          for item in cfg_xml.findall('./quality/item'):
              video_url = re.sub('speed=\d+', 'speed=', item.find('videoLink').text)
              format_id = item.find('res').text
              fmt = {
-                'url': video_url,
+                'url': self._proto_relative_url(video_url, 'http:'),
                  'format_id': format_id,
              }
              m = re.search(r'^(\d+)', format_id)
diff --git a/youtube_dl/extractor/turbo.py b/youtube_dl/extractor/turbo.py

index 29703a8a9a6ddf0981642c28cd2f1f68cc07c7b7..7ae63a4992a74368ec8b5f6a266a298cb6776b79 100644 (file)
--- a/youtube_dl/extractor/turbo.py
+++ b/youtube_dl/extractor/turbo.py
@@ -23,7 +23,7 @@ class TurboIE(InfoExtractor):
              'ext': 'mp4',
              'duration': 3715,
              'title': 'Turbo du 07/09/2014 : Renault Twingo 3, Bentley Continental GT Speed, CES, Guide Achat Dacia... ',
-            'description': 'Retrouvez dans cette rubrique toutes les vidéos de l\'Turbo du 07/09/2014 : Renault Twingo 3, Bentley Continental GT Speed, CES, Guide Achat Dacia... ',
+            'description': 'Turbo du 07/09/2014 : Renault Twingo 3, Bentley Continental GT Speed, CES, Guide Achat Dacia...',
              'thumbnail': 're:^https?://.*\.jpg$',
          }
      }
@@ -42,7 +42,7 @@ class TurboIE(InfoExtractor):
          title = xpath_text(item, './title', 'title')
          duration = int_or_none(xpath_text(item, './durate', 'duration'))
          thumbnail = xpath_text(item, './visuel_clip', 'thumbnail')
-        description = self._og_search_description(webpage)
+        description = self._html_search_meta('description', webpage)
  
          formats = []
          get_quality = qualities(['3g', 'sd', 'hq'])
diff --git a/youtube_dl/extractor/youtube.py b/youtube_dl/extractor/youtube.py

index aacb999ce9044ba07af7597d03b34e1aa37ebddd..419f7b01997519fe9a300d952d1e101b7ef9f805 100644 (file)
--- a/youtube_dl/extractor/youtube.py
+++ b/youtube_dl/extractor/youtube.py
@@ -1406,10 +1406,12 @@ class YoutubeChannelIE(InfoExtractor):
          channel_page = self._download_webpage(
              url + '?view=57', channel_id,
              'Downloading channel page', fatal=False)
-        channel_playlist_id = self._search_regex(
-            [r'<meta itemprop="channelId" content="([^"]+)">',
-             r'data-channel-external-id="([^"]+)"'],
-            channel_page, 'channel id', default=None)
+        channel_playlist_id = self._html_search_meta(
+            'channelId', channel_page, 'channel id', default=None)
+        if not channel_playlist_id:
+            channel_playlist_id = self._search_regex(
+                r'data-channel-external-id="([^"]+)"',
+                channel_page, 'channel id', default=None)
          if channel_playlist_id and channel_playlist_id.startswith('UC'):
              playlist_id = 'UU' + channel_playlist_id[2:]
              return self.url_result(
diff --git a/youtube_dl/version.py b/youtube_dl/version.py

index 6537101310684fe09d5d6327bab9d46106112cf4..9cf84ff712da103b9c3ce0b3e2f0c9386082e574 100644 (file)
--- a/youtube_dl/version.py
+++ b/youtube_dl/version.py
@@ -1,3 +1,3 @@
  from __future__ import unicode_literals
  
-__version__ = '2015.05.29'
+__version__ = '2015.06.04.1'
author	Yen Chi Hsuan <yan12125@gmail.com>
	Sat, 6 Jun 2015 18:59:27 +0000 (02:59 +0800)
committer	Yen Chi Hsuan <yan12125@gmail.com>
	Sat, 6 Jun 2015 18:59:27 +0000 (02:59 +0800)
docs/supportedsites.md		patch \| blob \| history
test/test_aes.py		patch \| blob \| history
youtube_dl/extractor/empflix.py		patch \| blob \| history
youtube_dl/extractor/izlesene.py		patch \| blob \| history
youtube_dl/extractor/nova.py		patch \| blob \| history
youtube_dl/extractor/pornovoisines.py		patch \| blob \| history
youtube_dl/extractor/qqmusic.py		patch \| blob \| history
youtube_dl/extractor/sunporno.py		patch \| blob \| history
youtube_dl/extractor/teamcoco.py		patch \| blob \| history
youtube_dl/extractor/tnaflix.py		patch \| blob \| history
youtube_dl/extractor/turbo.py		patch \| blob \| history
youtube_dl/extractor/youtube.py		patch \| blob \| history
youtube_dl/version.py		patch \| blob \| history