Издательство ДМК Пресс
Официальный сайт издательства ДМК Пресс

Интернет-магазинdmkpress.help@gmail.com
+7 (499) 322-19-38

Издание книг dmkpress@gmail.com Пишите на email

Оптовая продажа books@alians-kniga.ru+7 (499) 782-38-89

Моя корзина
В корзине нет ни одного товара

Скрапинг веб-сайтов с помощью Python

Скрапинг веб-сайтов с помощью Python
Автор: Митчелл Р.
Дата выхода: апрель 2016 года
Формат: 148 * 210 мм
Бумага: офсетная
Обложка: Мягкая обложка
Объем, стр.: 272
ISBN: 978-5-97060-223-2
Вес, гр.: 400

Оглавление и отрывки из глав

Файлы к книге

Купить электронную книгу

649 руб

Аннотация

Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью этого практического руководства вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц.
Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие, как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта. Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике.

Прочитав эту книгу, вы научитесь:
- выполнять парсинг сложных HTML страниц;
- сканировать веб-страницы и сайты;
- работать с API;
- применять несколько методов хранения собранных данных;
- скачивать, обрабатывать и извлекать данные из документов;
- использовать инструменты и методы для очистки плохо отформатированных данных;
- читать и записывать естественные языки;
- выполнять краулинг с использованием регистрационных форм;
- выполнять скрапинг Javascript-кода;
- обрабатывать изображения и распознавать текст.

Инструменты и примеры, приведенные в этой книге, позволяют  легко автоматизировать несколько повторяющихся задач, высвобождая время для решения более насущных проблем. Это легко читаемая, ориентированная на конкретный результат книга, рассказывающая о реальных проблемах и решениях. 

Опубликована рецензия на книгу на сайте Сергея Багузина.

Для добавление комментария необходимо Войти или Зарегистрироваться.

События

19 апреля 2019 года

Участие издательства ДМК Пресс на Knowledgeconf 2019

26 апреля состоится первая в России конференция по управлению знаниями в IT-компаниях  - Knowledgeconf 2019.

16 апреля 2019 года

Издательство ДМК Пресс информационный партнёр AppsConf 2019

 22 и 23 апреля дни работы конференции для разработчиков мобильных приложений AppsConf 

15 апреля 2019 года

DevOpsForum 2019

Международная конференция DevOpsForum 2019 состоится 20 апреля 2019 года в отеле Holiday Inn Moscow Sokolniki.

 

Архив новостей

Хотите получать информацию о новинках нашего издательства? Оставьте свой Email в форме ниже

Нажимая на кнопку «Подписаться», я даю согласие на обработку персональных данных