Name: SAM 2
Author: Meta

Question 1

Что такое SAM 2 и для чего он нужен?

Accepted Answer

SAM 2 (Segment Anything Model 2) — открытая модель сегментации объектов от Meta, выпущенная 29 июля 2024 года. Она выделяет и отслеживает объекты на изображениях и в видео в реальном времени. Это НЕ чат-бот и не генератор — инструмент компьютерного зрения. Применяется в видеоредактировании (ротоскопинг, замена фона), разметке данных для CV, AR, робототехнике и научной визуализации.

Question 2

Чем SAM 2 отличается от первой SAM?

Accepted Answer

Первая SAM (2023) работала только с изображениями. SAM 2 объединила сегментацию изображений и видео в одной модели и добавила работу в реальном времени (~44 кадра/сек). Ключевая новинка — streaming memory: модель помнит объект между кадрами видео и продолжает отслеживать его даже при перекрытии или исчезновении из кадра. Это сделало SAM 2 пригодной для видео, а не только статичных картинок.

Question 3

Как пользоваться SAM 2?

Accepted Answer

SAM 2 — промпт-сегментация: вы указываете объект кликом, рамкой или маской на кадре, и модель выделяет его точной маской и отслеживает по всему видео. Попробовать можно в веб-демо Meta без установки. Для интеграции в проект нужно скачать код и веса с GitHub (facebookresearch/sam2), это требует Python и GPU. Готового приложения для обычного пользователя нет — это инструмент для разработчиков.

Question 4

Бесплатен ли SAM 2 и можно ли использовать коммерчески?

Accepted Answer

Да, SAM 2 полностью бесплатна и открыта под лицензией Apache 2.0 — максимально свободной, разрешающей коммерческое использование, модификацию и распространение без ограничений и отчислений. Можно встроить в свой продукт, дообучить на датасете SA-V (Meta его тоже открыла) и распространять. Платить нужно только за вычисления, если запускаете в облаке (AWS).

Question 5

Работает ли SAM 2 в России?

Accepted Answer

Да. Веса и код свободно качаются с GitHub и HuggingFace, не блокируются — модель запускается локально из России. Языковой интерфейс не нужен: SAM 2 работает с визуальными промптами (клик, рамка), а не с текстом, поэтому вопрос русского языка не актуален. Для запуска нужны Python и GPU (для реального времени). Это удобно — никаких региональных ограничений и оплаты.

Question 6

Какие требования к железу для SAM 2?

Accepted Answer

Для работы в реальном времени (~44 кадра/сек) нужна GPU. SAM 2 вышла в четырёх размерах: tiny и small запускаются на слабых видеокартах и быстрее, base+ и large точнее, но требуют больше ресурсов. На CPU модель работает, но медленно — реал-тайм только на GPU. Для разовой обработки фото подойдёт и слабое железо, для потокового видео нужна полноценная видеокарта.

Question 7

Актуальна ли SAM 2 в 2026 и какие альтернативы?

Accepted Answer

SAM 2 — рабочий инструмент, но в 2025 вышла SAM 3, для новых проектов стоит смотреть на неё. Альтернативы для сегментации: SAM 3 (свежее поколение Meta), специализированные CV-модели вроде Grounding DINO + SAM для текстовых промптов, коммерческие API сегментации. Для большинства задач выделения объектов в видео SAM 2/3 остаются стандартом де-факто в open-source компьютерном зрении.

SAM 2

Рейтинг и бенчмарки

Входные и выходные данные

Способы доступа

Сценарии использования

Тарифы и подписки — Meta

Плюсы и минусы

Подробный обзор

Что такое SAM 2

Как это работает

Скорость и архитектура

Где применяется

Лицензия, доступ и Россия

Часто задаваемые вопросы

Все эти инструменты — уже на Genova-ai

Другие модели Meta

Похожие модели