Машинное обучение с малым объемом кодирования: практическое введение в искусственный интеллект на основе проектов
ISBN | 978-601-08-4725-5 |
Количество страниц | 296 |
Формат издания | 165 x 215 мм |
Печать | Черно-белая |
Абель Майкл, Стриплинг Гвендолин
В книге подробно представлены три проблемно-ориентированных вида машинного обучения (Machine learning, ML): автоматизированное обучение AutoML без кодирования, обучение BigQuery ML с малым объемом кодирования и обучение с применением пользовательского кода на основе библиотек scikit-learn и Keras. При этом от читателя не требуется глубоких предварительных знаний в ML или программировании, но базовые навыки в этих областях будут полезны. Специализированные библиотеки, фреймворки ML, репозиторий GitHub и другие инструменты описаны по мере их необходимости. В каждом конкретном случае ключевые концепции ML раскрыты с использованием реальных наборов данных для решения реальных задач. Рассмотрено применение AutoML для прогнозирования продаж, использование BigQuery ML для обучения линейных регрессионных моделей, обучение пользовательских ML-моделей на Python для прогнозирования оттока клиентов и ряд других популярных бизнес-кейсов.
Вы узнаете:
- Как различать структурированные и неструктурированные данные и разбираться с проблемами, которые могут встретиться
- Как визуализировать и анализировать данные
- Как предварительно обрабатывать данные для ввода в модель машинного обучения
- Чем отличаются регрессионная и классификационная модели обучения с учителем
- Как сравнивать различные типы моделей ML и их архитектуры, начиная с моделей без кода и с малым объемом кода и заканчивая моделями пользовательского обучения
- Как проектировать, внедрять и настраивать модели ML
- Как экспортировать данные в репозиторий GitHub для хранения и управления ими
Для кого предназначена книга
Цель этой книги — научить читателей формулировать задачи ML для струк-турированных (табличных) данных, подготавливать свои данные для рабочих процессов ML.
Вы также научитесь создавать и применять модели ML с помощью различных решений без кода, с малым объемом кода и с привлечением базовых пользовательских кодов.
Вы пройдете пошаговые процедуры, позволяющие понять эти решения в контексте конкретной бизнес-задачи.
Основная аудитория этой книги — специалисты по бизнес-анализу, аналитике данных, студенты и начинающие гражданские специалисты по обработке данных.
Книга будет интересна людям, которые стремятся очень быстро научиться применять ML в своей работе, используя такие инструменты, как автоматизированное машинное обучение (AutoML), BigQuery ML (с применением SQL) и пользовательское машинное обучение на Python. Предполагается, что читатель имеет некоторое базовое знакомство с анализом данных
Что есть и чего нет в этой книге
Эта книга была написана, чтобы помочь вам сделать первые шаги в мире ML, а не для того, чтобы превратить вас в эксперта. Мы не рассматриваем тео-рию ML в деталях и не охватываем все области статистики и математики, требующиеся высококвалифицированному специалисту по обработке данных. Мы излагаем теорию, необходимую для проектов, описываемых в этой книге, а обсуждение более сложных задач выходит за рамки данной книги. Однако мы даем много ссылок на ресурсы, где вы можете погрузиться в ма-териал, вызывающий у вас дополнительный интерес.
Об авторах

Майкл Абель (Michael Abel), доктор философии, является техническим руководителем специализированной программы обучения в Google Cloud по углублению знаний облачных клиентов при помощи дифференцированных и нестандартных методов обучения. Ранее Абель был техническим тренером по обработке данных и машинному обучению в Google Cloud и преподавал следующие облачные курсы Google: «Машинное обучение в Google Cloud», «Погружение в продвинутые технологии Solutions Labs ML» и «Инжиниринг данных в Google Cloud». До прихода в Google Абель работал приглашенным профессором математики в Университете Дьюка, где он проводил математические исследования и преподавал математику для студентов старших курсов.

Гвендолин Стриплинг (Gwendolyn Stripling), доктор философии, является разработчиком контента в сфере искусственного интеллекта и машинного обучения в Google Cloud, помогая учащимся ориентироваться в области генеративного ИИ и AI/ML. Стриплинг — автор популярного видеоролика на YouTube «Introduction to Generative AI» («Введение в генеративный ИИ») и автор обучающего видео LinkedIn «Introduction to Neural Networks» («Введение в нейронные сети»). Стриплинг является адъюнкт-профессором и членом Коллегии Консультативного совета магистров бизнес-аналитикиУниверситета Golden Gate. Ранее Стриплинг работала инженером по анализу данных, облачным архитектором и техническим консультантом в компании Qlik, занимающейся анализом данных. Стриплинг с удовольствием выступает с докладами об искусственном интеллекте и ML. Она представляла свои работы в Калифорнийской школе бизнес-аналитики Barowsky при Доминиканском университете, школе бизнес-аналитики Ageno при Университете Golden Gate, на конференции Google Cloud NEXT и в венчурной программе Google Capitalist and Startup program.