Google Veo 3: генерация видео от DeepMind
Видео‑модель Google с высоким качеством и генерацией аудио, доступна в экосистеме Gemini/Vertex. Коротко о модели закрытая Категория Video Вход текст, изображения Выход видео + аудио Доступ Gemini/Vertex AI Локально нет Веса нет Лучше всего: проекты под…
OpenAI Whisper: распознавание речи — гайд
OpenAI Whisper — это модель автоматического распознавания речи (ASR), которая превращает аудио в текст, а также поддерживает мультиязычную транскрибацию и перевод речи на английский. Официальный способ интеграции в продукты — через API модели whisper-1…
OpenAI GPT Image: генерация изображений через GPT
Нативно мультимодальная генерация и редактирование изображений через API. Сильная точность и текст в кадре. Коротко о модели закрытая Категория Images Вход текст, изображения Выход изображение Доступ OpenAI API Локально нет Веса нет Лучше всего:…
Cohere Command R/R+: корпоративные LLM с поиском
Модели для RAG‑сценариев и enterprise‑интеграций, устойчивы к длинным контекстам. Коротко о модели закрытая Категория LLM Вход текст Выход текст Доступ Cohere API Локально нет Веса нет Лучше всего: поиск по документам, корпоративные ассистенты…
ModelScope Text2Video: генерация видео по тексту
ModelScope Text2Video (Text-to-Video Synthesis) — это diffusion-модель для генерации видео по текстовому описанию: вы задаёте промт, а система синтезирует короткий ролик с движением и согласованными кадрами. Официальное описание, ограничения и примеры…
OpenAI Whisper: распознавание речи
Open‑source модель распознавания речи, популярна для локального STT. Коротко о модели open‑weight Категория Audio Вход аудио Выход текст Доступ open‑weight релиз Локально да Веса да Лучше всего: локальный STT, оффлайн‑распознавание Риски/ограничения:…
Playground v3: редактирование изображений с ИИ
Сервис для генерации изображений с удобным UI и быстрыми итерациями. Коротко о модели закрытая Категория Images Вход текст, изображения Выход изображение Доступ Playground web Локально нет Веса нет Лучше всего: быстрые концепты и вариации…
OpenAI Sora 2: генерация видео по тексту
Генерация видео из текста и изображений, с фокусом на реализм и синхронное аудио. Коротко о модели закрытая Категория Video Вход текст, изображения Выход видео + аудио Доступ Sora app / web Локально нет Веса нет Лучше всего: премиум‑визуал, рекламные…
Naver HyperCLOVA X: обзор и примеры
Naver HyperCLOVA X — семейство генеративных моделей от NAVER, ориентированное на глубокое понимание корейского языка и культурного контекста, а также на уверенную работу с английским и рядом прикладных задач (поиск, поддержка, аналитика, разработка).…
Snowflake Arctic: LLM для аналитики данных
Snowflake Arctic — это семейство enterprise-ориентированных LLM, созданных командой Snowflake AI Research и выпущенных с акцентом на открытость, эффективность и сильные результаты в задачах бизнеса: SQL, код и сложное следование инструкциям. Официальные…