[facebook] Merge FacebookPostIE into FacebookIE

author Yen Chi Hsuan <yan12125@gmail.com>

Thu, 10 Mar 2016 06:33:48 +0000 (14:33 +0800)

committer Yen Chi Hsuan <yan12125@gmail.com>

Thu, 10 Mar 2016 06:59:30 +0000 (14:59 +0800)
author Yen Chi Hsuan <yan12125@gmail.com>
Thu, 10 Mar 2016 06:33:48 +0000 (14:33 +0800)
committer Yen Chi Hsuan <yan12125@gmail.com>
Thu, 10 Mar 2016 06:59:30 +0000 (14:59 +0800)
diff --git a/youtube_dl/extractor/__init__.py b/youtube_dl/extractor/__init__.py

index e07f724bf660ebbca0b5b4821e9a88be35f5cd73..98de5ddff3f6903f8af818d5dacba4edec6b99ac 100644 (file)
--- a/youtube_dl/extractor/__init__.py
+++ b/youtube_dl/extractor/__init__.py
@@ -212,10 +212,7 @@ from .everyonesmixtape import EveryonesMixtapeIE
  from .exfm import ExfmIE
  from .expotv import ExpoTVIE
  from .extremetube import ExtremeTubeIE
  from .exfm import ExfmIE
  from .expotv import ExpoTVIE
  from .extremetube import ExtremeTubeIE
-from .facebook import (
-    FacebookIE,
-    FacebookPostIE,
-)
+from .facebook import FacebookIE
  from .faz import FazIE
  from .fc2 import FC2IE
  from .fczenit import FczenitIE
  from .faz import FazIE
  from .fc2 import FC2IE
  from .fczenit import FczenitIE
diff --git a/youtube_dl/extractor/facebook.py b/youtube_dl/extractor/facebook.py

index 6c6c3b1bd460407322aab1f35ddd8e55cefaad17..23a6fcd88b6ffef90f3ce0fcdf7fe6abd770ca90 100644 (file)
--- a/youtube_dl/extractor/facebook.py
+++ b/youtube_dl/extractor/facebook.py
@@ -37,7 +37,8 @@ class FacebookIE(InfoExtractor):
                                  video/embed|
                                  story\.php
                              )\?(?:.*?)(?:v|video_id|story_fbid)=|
                                  video/embed|
                                  story\.php
                              )\?(?:.*?)(?:v|video_id|story_fbid)=|
-                            [^/]+/videos/(?:[^/]+/)?
+                            [^/]+/videos/(?:[^/]+/)?|
+                            [^/]+/posts/
                          )|
                      facebook:
                  )
                          )|
                      facebook:
                  )
@@ -50,6 +51,8 @@ class FacebookIE(InfoExtractor):
  
      _CHROME_USER_AGENT = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.97 Safari/537.36'
  
  
      _CHROME_USER_AGENT = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.97 Safari/537.36'
  
+    _VIDEO_PAGE_TEMPLATE = 'https://www.facebook.com/video/video.php?v=%s'
+
      _TESTS = [{
          'url': 'https://www.facebook.com/video.php?v=637842556329505&fref=nf',
          'md5': '6a40d33c0eccbb1af76cf0485a052659',
      _TESTS = [{
          'url': 'https://www.facebook.com/video.php?v=637842556329505&fref=nf',
          'md5': '6a40d33c0eccbb1af76cf0485a052659',
@@ -81,6 +84,15 @@ class FacebookIE(InfoExtractor):
              'title': 'When you post epic content on instagram.com/433 8 million followers, this is ...',
              'uploader': 'Demy de Zeeuw',
          },
              'title': 'When you post epic content on instagram.com/433 8 million followers, this is ...',
              'uploader': 'Demy de Zeeuw',
          },
+    }, {
+        'url': 'https://www.facebook.com/maxlayn/posts/10153807558977570',
+        'md5': '037b1fa7f3c2d02b7a0d7bc16031ecc6',
+        'info_dict': {
+            'id': '544765982287235',
+            'ext': 'mp4',
+            'title': '"What are you doing running in the snow?"',
+            'uploader': 'FailArmy',
+        }
      }, {
          'url': 'https://www.facebook.com/video.php?v=10204634152394104',
          'only_matching': True,
      }, {
          'url': 'https://www.facebook.com/video.php?v=10204634152394104',
          'only_matching': True,
@@ -164,9 +176,8 @@ class FacebookIE(InfoExtractor):
      def _real_initialize(self):
          self._login()
  
      def _real_initialize(self):
          self._login()
  
-    def _real_extract(self, url):
-        video_id = self._match_id(url)
-        req = sanitized_Request('https://www.facebook.com/video/video.php?v=%s' % video_id)
+    def _extract_from_url(self, url, video_id, fatal_if_no_video=True):
+        req = sanitized_Request(url)
          req.add_header('User-Agent', self._CHROME_USER_AGENT)
          webpage = self._download_webpage(req, video_id)
  
          req.add_header('User-Agent', self._CHROME_USER_AGENT)
          webpage = self._download_webpage(req, video_id)
  
@@ -196,6 +207,8 @@ class FacebookIE(InfoExtractor):
                      break
  
          if not video_data:
                      break
  
          if not video_data:
+            if not fatal_if_no_video:
+                return webpage, False
              m_msg = re.search(r'class="[^"]*uiInterstitialContent[^"]*"><div>(.*?)</div>', webpage)
              if m_msg is not None:
                  raise ExtractorError(
              m_msg = re.search(r'class="[^"]*uiInterstitialContent[^"]*"><div>(.*?)</div>', webpage)
              if m_msg is not None:
                  raise ExtractorError(
@@ -241,39 +254,36 @@ class FacebookIE(InfoExtractor):
              video_title = 'Facebook video #%s' % video_id
          uploader = clean_html(get_element_by_id('fbPhotoPageAuthorName', webpage))
  
              video_title = 'Facebook video #%s' % video_id
          uploader = clean_html(get_element_by_id('fbPhotoPageAuthorName', webpage))
  
-        return {
+        info_dict = {
              'id': video_id,
              'title': video_title,
              'formats': formats,
              'uploader': uploader,
          }
  
              'id': video_id,
              'title': video_title,
              'formats': formats,
              'uploader': uploader,
          }
  
-
-class FacebookPostIE(InfoExtractor):
-    IE_NAME = 'facebook:post'
-    _VALID_URL = r'https?://(?:\w+\.)?facebook\.com/[^/]+/posts/(?P<id>\d+)'
-    _TEST = {
-        'url': 'https://www.facebook.com/maxlayn/posts/10153807558977570',
-        'md5': '037b1fa7f3c2d02b7a0d7bc16031ecc6',
-        'info_dict': {
-            'id': '544765982287235',
-            'ext': 'mp4',
-            'title': '"What are you doing running in the snow?"',
-            'uploader': 'FailArmy',
-        }
-    }
+        return webpage, info_dict
  
      def _real_extract(self, url):
  
      def _real_extract(self, url):
-        post_id = self._match_id(url)
+        video_id = self._match_id(url)
+
+        real_url = self._VIDEO_PAGE_TEMPLATE % video_id if url.startswith('facebook:') else url
+        webpage, info_dict = self._extract_from_url(real_url, video_id, fatal_if_no_video=False)
  
  
-        webpage = self._download_webpage(url, post_id)
+        if info_dict:
+            return info_dict
  
  
-        entries = [
-            self.url_result('facebook:%s' % video_id, FacebookIE.ie_key())
-            for video_id in self._parse_json(
-                self._search_regex(
-                    r'(["\'])video_ids\1\s*:\s*(?P<ids>\[.+?\])',
-                    webpage, 'video ids', group='ids'),
-                post_id)]
+        if '/posts/' in url:
+            entries = [
+                self.url_result('facebook:%s' % video_id, FacebookIE.ie_key())
+                for video_id in self._parse_json(
+                    self._search_regex(
+                        r'(["\'])video_ids\1\s*:\s*(?P<ids>\[.+?\])',
+                        webpage, 'video ids', group='ids'),
+                    video_id)]
  
  
-        return self.playlist_result(entries, post_id)
+            return self.playlist_result(entries, video_id)
+        else:
+            _, info_dict = self._extract_from_url(
+                self._VIDEO_PAGE_TEMPLATE % video_id,
+                video_id, fatal_if_no_video=True)
+            return info_dict
author	Yen Chi Hsuan <yan12125@gmail.com>
	Thu, 10 Mar 2016 06:33:48 +0000 (14:33 +0800)
committer	Yen Chi Hsuan <yan12125@gmail.com>
	Thu, 10 Mar 2016 06:59:30 +0000 (14:59 +0800)
youtube_dl/extractor/__init__.py		patch \| blob \| history
youtube_dl/extractor/facebook.py		patch \| blob \| history