Что будет
Программа «Аналитик данных»
Программа повышения квалификации направлена на получение компетенций, необходимых для выполнения вида профессиональной деятельности «Аналитик данных».
Аналитик данных — специалист, который работает с данными: собирает их, обрабатывает, изучает и интерпретирует. Выводы, которые делает аналитик, помогают принимать решения в бизнесе, в научных исследованиях, в менеджменте и в других областях.
В процессе обучения вы научитесь:
- Готовить данные для проведения аналитических работ по исследованию больших данных.
- Проводить аналитические исследования с применением технологий больших данных в соответствии с требованиями заказчика.
- Понимать принципы работы современных информационных технологий и программных средств, в том числе отечественного производства, и использовать их при решении задач профессиональной деятельности.
- Разрабатывать алгоритмы и программы, пригодные для практического применения.
- Классифицировать и идентифицировать задачи искусственного интеллекта, выбирать адекватные методы и инструментальные средства решения задач искусственного интеллекта.
- Разрабатывать и применять методы машинного обучения для решения задач.
- Использовать инструментальные средства для решения задач машинного обучения.
- Осуществлять сбор и подготовку данных для систем искусственного интеллекта.
- Использовать одну или несколько сквозных цифровых субтехнологий искусственного интеллекта.
Программа повышения квалификации предназначена для специалистов, имеющих высшее или среднее профессиональное образование в области информационных технологий (работа с данными и/или искусственным интеллектом / машинным обучением), а также лиц, получающих высшее или среднее профессиональное образование в области информационных технологий.
Программа повышения квалификации подойдет широкому кругу специалистов, в профессиональные задачи которых входит сбор и анализ большого количества информации для прогнозирования и управления процессами через цифровые данные.
Программа повышения квалификации требует следующих знаний и умений:
- Знания языка программирования Python на среднем уровне.
- Знание основ линейной алгебры, теории вероятностей и математической статистики.
Для успешного освоения программы требуется одна из следующих квалификаций:
- Разработчик на Python среднего уровня (предпочтительно).
- Разработчик на Python начального уровня .
- Разработчик на любом языке программирования среднего уровня.
Основные модули программы
- Введение в машинное обучение.
- Библиотеки Python для работы с данными.
- Классические алгоритмы машинного обучения.
- Глубокие нейронные сети.
- Нейронные сети для компьютерного зрения.
- Нейронные сети для обработки естественного языка.
После окончания обучения вы сможете работать аналитиком данных.
Результаты обучения
Знать:
- Современные методы и инструментальные средства анализа данных.
- Технологии и программное обеспечение анализа данных, в том числе отечественного производства.
- Алгоритмы машинного обучения.
- Теоретические и прикладные основы анализа больших данных.
- Современный опыт использования анализа больших данных.
- Типы больших данных: метаданные, полуструктурированные, структурированные, неструктурированные.
- Виды источников данных: созданные человеком, созданные машинами.
- Источники информации, в том числе информации, необходимой для обеспечения деятельности в предметной области заказчика исследования.
- Российские и международные стандарты информационной безопасности.
- Облачные технологии, облачные сервисы.
- Содержание и последовательность выполнения этапов аналитического проекта.
- Нейронные сети: полносвязные, свёрточные нейронные сети, методы обучения нейронных сетей.
- Семантический анализ: обработка естественного языка, сентиментный анализ, анализ текста.
- Алгоритмы машинного обучения: обучение с учителем, обучение без учителя.
- Машинное обучение: классификация, кластеризация, обнаружение выбросов.
- Анализ изображений.
- Лучшие практики применения искусственного интеллекта в различных проблемных и предметных областях.
- Модели искусственного интеллекта.
- Классы задач машинного обучения.
- Алгоритмы и методы машинного обучения.
- Метрики оценки качества решения задачи машинного обучения.
- Язык программирования Python.
- Библиотеки на Python для машинного обучения.
- Библиотеки на Python для работы с данными.
- Модели и методы искусственного интеллекта, используемые для решения задач компьютерного зрения.
- Модели и методы искусственного интеллекта, используемые для решения задач обработки естественного языка.
Уметь:
- Применять методы и инструментальные средства анализа данных для решения практических задач.
- Разрабатывать программы для решения практических задач с использованием машинного обучения.
- Определять требования к поставщикам данных из гетерогенных источников.
- Разрабатывать и оценивать модели больших данных.
- Проводить интеграцию и преобразование больших объемов данных.
- Оценивать соответствие наборов данных задачам анализа больших данных.
- Планировать аналитические работы с использованием технологий больших данных.
- Адаптировать и развертывать модели в предметной среде.
- Решать задачи классификации, кластеризации, регрессии.
- Решать проблемы переобучения и недообучения алгоритма.
- Формировать предложения по использованию результатов анализа.
- Оформлять результаты аналитического исследования для представления заказчику.
- Разъяснять заказчику результаты аналитической работы.
- Классифицировать и идентифицировать задачи систем искусственного интеллекта в зависимости от особенностей проблемной и предметной областей.
- Выбирает методы и инструментальные средства искусственного интеллекта для решения задач в зависимости от особенностей проблемной области.
- Собирать исходную информацию и формирует требования к решению задач с использованием методов искусственного интеллекта.
- Проводить анализ требований и определяет необходимые классы задач машинного обучения.
- Определять метрики оценки результатов моделирования и критерии качества построенных моделей.
- Принимать участие в оценке и выборе используемых методов машинного обучения.
- Осуществлять оценку и выбор инструментальных средств для решения поставленной задачи.
- Разрабатывать модели машинного обучения для решения задач.
- Осуществлять поиск данных в открытых источниках, специализированных библиотеках и репозиториях.
- Выполнять подготовку и разметку структурированных и неструктурированных данных для машинного обучения.
- Решать прикладные задачи и участвует в реализации проектов в области сквозной цифровой субтехнологии «Компьютерное зрение».
- Решать прикладные задачи и участвует в реализации проектов в области сквозной цифровой субтехнологии «Обработка естественного языка».
Владеть:
- Инструментальными средствами разработки алгоритмов машинного обучения.
- Инструментальными средствами решения задач искусственного интеллекта.
- Инструментальными средствами для решения задач машинного обучения на языке Python.
- Инструментальными средствами сбора и обработки данных на языке Python.
- Методами извлечения информации и знаний из гетерогенных, мультиструктурированных, неструктурированных источников, в том числе при потоковой обработке.
- Инструментами очистки данных для проведения аналитических работ.
- Технологиями анализа данных: статистический анализ, семантический анализ, анализ изображений, машинное обучение.
- Основами управления аналитическими работами.
- Методами и инструментами анализа требований к решению задач с использованием машинного обучения.
- Предварительно обученными моделями для решения задач компьютерного зрения.
- Предварительно обученными моделями для решения задач обработки естественного языка.
Стоимость обучения составляет 100 000 рублей и складывается из двух частей:
- средств Субсидии, предоставляемых Университетом 2035, в размере 76 000 рублей;
- внебюджетных средств, предоставляемых Получателем ПЦС и (или) Работодателем не из бюджетного источника, в размере 24 000 рублей.