Издательство ДМК Пресс
Официальный сайт издательства ДМК Пресс

Интернет-магазинdmkpress.help@gmail.com
+7 (499) 322-19-38

Издание книг dmkpress@gmail.comПишите на email

Оптовая продажа books@alians-kniga.ru+7 (499) 782-38-89

Моя корзина
В корзине нет ни одного товара

Скрапинг веб-сайтов с помощью Python

Скрапинг веб-сайтов с помощью Python
Автор: Митчелл Р.
Дата выхода: апрель 2016 года
Формат: 148 * 210 мм
Бумага: офсетная
Обложка: Мягкая обложка
Объем, стр.: 272
ISBN: 978-5-97060-223-2
Вес, гр.: 400

Оглавление и отрывки из глав

Файлы к книге

Купить электронную книгу

649 руб

Аннотация

Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью этого практического руководства вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц.
Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие, как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта. Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике.

Прочитав эту книгу, вы научитесь:
- выполнять парсинг сложных HTML страниц;
- сканировать веб-страницы и сайты;
- работать с API;
- применять несколько методов хранения собранных данных;
- скачивать, обрабатывать и извлекать данные из документов;
- использовать инструменты и методы для очистки плохо отформатированных данных;
- читать и записывать естественные языки;
- выполнять краулинг с использованием регистрационных форм;
- выполнять скрапинг Javascript-кода;
- обрабатывать изображения и распознавать текст.

Инструменты и примеры, приведенные в этой книге, позволяют  легко автоматизировать несколько повторяющихся задач, высвобождая время для решения более насущных проблем. Это легко читаемая, ориентированная на конкретный результат книга, рассказывающая о реальных проблемах и решениях. 

Опубликована рецензия на книгу на сайте Сергея Багузина.

Для добавление комментария необходимо Войти или Зарегистрироваться.

События

21 сентября 2018 года

Технологии машинного обучения 2018

Конференция ИД "Открытые системы"



21 сентября 2018 года

Сryptofest 2018

Все самое важное и актуальное на Сryptofest 2018



18 сентября 2018 года

MBLT DEV 2018

Архив новостей

Хотите получать информацию о новинках нашего издательства? Оставьте свой Email в форме ниже

Нажимая на кнопку «Подписаться», я даю согласие на обработку персональных данных