Знание машинного обучения и глубоких концепций обучения важно, но недостаточно для того, чтобы вас приняли на работу. По словам менеджеров по найму, большинству соискателей не хватает навыков технологического производства для выполнения этой работы. Более 50% учебной программы по трамплину сфокусировано на навыках производства. В этом курсе вы разработаете систему машинного обучения / глубокого обучения, создадите прототип и развернете работающее приложение, к которому можно получить доступ через API или веб-сервис. Никакой другой bootcamp не делает этого.
На протяжении всего этого курса вы познакомитесь с различными инструментами и библиотеками, которые используются в области науки о данных и машинного обучения. Они включают в себя все, от библиотек ML до средств развертывания. Будут также переподготовки по передовым методам разработки программного обеспечения и основополагающим математическим концепциям, которые должен знать каждый инженер ML.
- Стек Науки Данных Питона: Панды, scikit-learn, Keras, TensorFlow.
- Инструменты разработки данных: Spark / PySpark, Luigi, Containers, AWS.
- Инструменты разработки программного обеспечения: непрерывная интеграция, контроль версий с помощью Git, ведение журнала, тестирование и отладка.
- Структуры данных и алгоритмы обновляют и оптимизируют Python для написания более быстрого кода.
Независимо от того, с какими данными вы работаете, сбор, очистка и управление этими данными будут важной частью вашей работы. В этом разделе вы научитесь собирать данные в масштабе от API, систем реального времени и веб-сайтов. Вы также научитесь эффективно и действенно преобразовывать эти данные для алгоритмов ML, чтобы сократить объем работ.
- пункт главы Сбор данных в масштабе от API, систем реального времени и веб-сайтов.
- пункт главы Эффективно и действенно преобразуйте эти данные, чтобы алгоритмы ML могли их обработать.
- пункт главы Используйте статистические выводы и тесты гипотез, чтобы получить представление о данных.
Машинное обучение machine learning объединяет аспекты информатики и статистики для извлечения полезных данных и прогнозов из данных. В этом разделе мы рассмотрим наиболее важные алгоритмы машинного обучения (контролируемые и неконтролируемые). Вы узнаете, когда эти алгоритмы полезны, предположения, которые они включают, компромиссы, которые они включают, и различные метрики, которые вы можете использовать, чтобы оценить, насколько хорошо работает ваш алгоритм. Самое главное, вы научитесь реализовывать их в масштабе.
- пункт главы Общие алгоритмы, такие как линейная регрессия, логистическая регрессия и статистическое моделирование.
- пункт главы Продвинутые алгоритмы, такие как Decision Tree, Random Forest, повышение градиента и кластеризация K-средних.
- пункт главы Концепции выбора, оценки и интерпретации моделей, такие как регуляризация, проклятие размерности и перекрестная проверка.
- пункт главы Контролируемое и неконтролируемое обучение.
- пункт главы Инструменты: scikit-learn, SparkML, системы Auto-ML.