Script, Json — извлекаем данные

BeuatifulSoup извлекаем данные из script, json
пример:

{
	'@context': 'http://schema.org',
	'@type': 'VideoObject',
	'@id': 'https://rutube.ru/video/000a1390c546a1cec63f89cd0530be40/',
	'description': 'Автор и исполнитель собственных песен - Римма Чистякова',
	'duration': 'PT4M16S',
	'url': 'https://rutube.ru/video/000a1390c546a1cec63f89cd0530be40/',
	'name': '"Пепел весенних гроз" - песня на стихи и музыку Риммы Чистяковой',
	'thumbnail': '000a1390c546a1cec63f89cd0530be40',
	'thumbnailUrl': 'https://pic.rutube.ru/video/92/70/9270d24a8b85b07b65923e523b6a6a55.jpg?size=l',
	'uploadDate': '2019-03-05T17:55:52',
	'datePublished': '2019-03-05T17:55:53',
	'isFamilyFriendly': 'true',
	'genre': 'Люди и блоги',
	'embedUrl': 'https://rutube.ru/play/embed/12103461',
	'interactionStatistic': [{
			'@type': 'InteractionCounter',
			'interactionType': 'http://schema.org/WatchAction',
			'userInteractionCount': '1'
		}
	]
}

Python
#через суп находим объект Script с которым будем работать, если на странице несколько объектов ищем через soup.find_all далее обращаемся через [индекс] к нужному объекту

hits_count = soup.find("script") # нашли объект
hits_count = json.loads(hits_count.get_text()) # преобразуем в Python словарь
hits_count = hits_count['interactionStatistic'][-1]['userInteractionCount'] # извлекаем необходимое

# если объект Json преобразуем его в Python словарь, и так же извлекаем по ключам как показано выше.
преобразование в Python словарь

.json()

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *