О курсе
Курс по компьютерному зрению охватывает все аспекты работы с изображениями и видео с использованием методов машинного обучения и глубокого обучения. Вы научитесь решать практические задачи обработки изображений, от базовых операций до сложных систем распознавания.
Программа курса построена таким образом, чтобы дать вам как теоретические знания, так и практические навыки. Вы будете работать с реальными данными и создавать работающие системы компьютерного зрения.
Что вы изучите:
- Основы обработки изображений с OpenCV
- Классификация изображений с использованием CNN
- Детекция объектов (YOLO, R-CNN, SSD)
- Семантическая и instance сегментация
- Отслеживание объектов в видео
- Face recognition и pose estimation
- Transfer learning для CV задач
Программа курса
Модуль 1: Основы обработки изображений (3 недели)
- Работа с OpenCV
- Базовые операции с изображениями
- Фильтрация и трансформации
- Детектирование краев и контуров
Модуль 2: Классификация изображений (3 недели)
- CNN для классификации
- Transfer learning с предобученными моделями
- Data augmentation
- Fine-tuning моделей
Модуль 3: Детекция объектов (4 недели)
- YOLO архитектуры
- R-CNN семейство моделей
- SSD и RetinaNet
- Практика детекции в реальном времени
Модуль 4: Сегментация (2 недели)
- Семантическая сегментация
- Instance segmentation (Mask R-CNN)
- U-Net архитектура
Модуль 5: Продвинутые темы (2 недели)
- Отслеживание объектов
- Face recognition
- 3D vision основы
- Финальный проект
Требования
Необходимые знания:
- Хорошее знание Python
- Основы машинного обучения
- Понимание нейронных сетей
- Знание NumPy и основ работы с изображениями
- Желательно знание TensorFlow или PyTorch
Технические требования:
- Компьютер с GPU (NVIDIA рекомендуется)
- Минимум 16 GB RAM
- 100 GB свободного места на диске
- Стабильное высокоскоростное интернет-соединение
- Веб-камера (для некоторых практических заданий)