Этот проект демонстрирует подход глубокого обучения к семантической сегментации, используя набор данных для обучения модели, которая классифицирует каждый пиксель изображения.
- Предобработка изображений и масок
- Аугментация данных
- Обучение сверточной нейронной сети
- Оценка и визуализация результатов
- Клонируйте репозиторий:
git clone https://github.com/ne-olya/sem_seg.git
- Установите зависимости:
pip install -r requirements.txt
Откройте Jupyter Notebook:
- Запустите среду (например, Google Colab или локально)
- Выполните ячейки для предобработки данных и обучения модели
Используется сверточная нейронная сеть, разработанная для задач сегментации изображений. Она включает слои для извлечения признаков и увеличения разрешения для создания пиксельных предсказаний.
Проект использует [https://www.kaggle.com/datasets/kanametov/ph2dataset] для обучения и оценки.
- Порог предсказания: 0.5
- Размер батча: 25
- Результаты (эпохи, LR, IOU):
- 20 эпох: LR = 0.001 (Adam opt), IOU = 59%
- 30 эпох: LR = 0.001 (Adam opt), IOU = 68%
- 40 эпох: LR = 0.001 (Adam opt), IOU = 80%
- Порог предсказания: 0.5
- Размер батча: 25
- 40 эпох: LR = 0.001 (Adam opt), IOU = 70%
- Порог предсказания: 0.5
- Размер батча: 25
- 40 эпох: LR = 0.001 (Adam opt), IOU = 70%
- Порог предсказания: 0.5
- Размер батча: 10
- 20 эпох: LR = 0.001 (Adam opt), IOU = 32%
- Порог предсказания: 0.5
- Размер батча: 10
- 5 эпох: LR = 0.001 (Adam opt), IOU = 41%