X-Git-Url: http://git.cielonegro.org/gitweb.cgi?a=blobdiff_plain;f=youtube_dl%2Fextractor%2Flifenews.py;h=f8cbca7b36afab1890b71806d6761bbe67d7d924;hb=1806a75415a3b62b07ab3fd282f915c6af14dfd3;hp=92031e84345ebc2b84028ef892242d3d92d94fb8;hpb=480065172d4c97f00973b3f0bf24cd1b8e567627;p=youtube-dl.git diff --git a/youtube_dl/extractor/lifenews.py b/youtube_dl/extractor/lifenews.py index 92031e843..f8cbca7b3 100644 --- a/youtube_dl/extractor/lifenews.py +++ b/youtube_dl/extractor/lifenews.py @@ -4,8 +4,11 @@ from __future__ import unicode_literals import re from .common import InfoExtractor +from ..compat import compat_urlparse from ..utils import ( + determine_ext, int_or_none, + remove_end, unified_strdate, ExtractorError, ) @@ -37,7 +40,6 @@ class LifeNewsIE(InfoExtractor): 'title': 'РСеÑи поÑвилоÑÑ Ð²Ð¸Ð´ÐµÐ¾ Ð·Ð°Ñ Ð²Ð°Ñа «ÐÑавÑм ÑекÑоÑом» ÐºÐ¾Ð»Ñ Ð¾Ð·Ð½ÑÑ Ð¿Ð¾Ð»ÐµÐ¹ ', 'description': 'ÐиÑели двÑÑ Ð¿Ð¾Ñелков ÐнепÑопеÑÑовÑкой облаÑÑи не пÑоÑÑили Ñадикалам ÑгÑÐ¾Ð·Ñ Ð»Ð¸ÑÐµÐ½Ð¸Ñ Ð¿Ð»Ð¾Ð´Ð¾ÑоднÑÑ Ð·ÐµÐ¼ÐµÐ»Ñ Ð¸ поÑли в лобовÑÑ. ', 'upload_date': '20150402', - 'uploader': 'embed.life.ru', } }, { 'url': 'http://lifenews.ru/news/153461', @@ -48,8 +50,10 @@ class LifeNewsIE(InfoExtractor): 'title': 'Ð ÐоÑкве ÑпаÑли поÑеÑÑвÑегоÑÑ Ð¼ÐµÐ´Ð²ÐµÐ¶Ð¾Ð½ÐºÐ°, коÑоÑÑй ÑпÑÑÑалÑÑ Ð½Ð° деÑеве', 'description': 'ÐаленÑкий Ñ Ð¸Ñник не Ñмог найÑи доÑÐ¾Ð³Ñ Ð´Ð¾Ð¼Ð¾Ð¹ и обÑел вÑеменное ÑбежиÑе на Ñополе недалеко Ð¾Ñ Ð¶Ð¸Ð»Ð¾Ð³Ð¾ маÑÑива, пока его не наÑла ÑоÑедÑÐºÐ°Ñ Ñобака.', 'upload_date': '20150505', - 'uploader': 'embed.life.ru', } + }, { + 'url': 'http://lifenews.ru/video/13035', + 'only_matching': True, }] def _real_extract(self, url): @@ -67,20 +71,20 @@ class LifeNewsIE(InfoExtractor): if not videos and not iframe_link: raise ExtractorError('No media links available for %s' % video_id) - title = self._og_search_title(webpage) - TITLE_SUFFIX = ' - ÐеÑвÑй по ÑÑоÑнÑм новоÑÑÑм â LIFE | NEWS' - if title.endswith(TITLE_SUFFIX): - title = title[:-len(TITLE_SUFFIX)] + title = remove_end( + self._og_search_title(webpage), + ' - ÐеÑвÑй по ÑÑоÑнÑм новоÑÑÑм â LIFE | NEWS') description = self._og_search_description(webpage) view_count = self._html_search_regex( r'