ai - Страница 10 из 19 - Подробный обзор моделей ИИ и инструкций по взаимодействию с сетями ai.

Google Veo 3: генерация видео от DeepMind

От project

1 мин. чтения

Видео‑модель Google с высоким качеством и генерацией аудио, доступна в экосистеме Gemini/Vertex. Коротко о модели закрытая Категория Video Вход текст, изображения Выход видео + аудио Доступ Gemini/Vertex AI Локально нет Веса нет Лучше всего: проекты под…

OpenAI Whisper: распознавание речи — гайд

От project

Комментариев нет

5 Минут чтения

OpenAI Whisper — это модель автоматического распознавания речи (ASR), которая превращает аудио в текст, а также поддерживает мультиязычную транскрибацию и перевод речи на английский. Официальный способ интеграции в продукты — через API модели whisper-1…

OpenAI GPT Image: генерация изображений через GPT

От project

Комментариев нет

1 мин. чтения

Нативно мультимодальная генерация и редактирование изображений через API. Сильная точность и текст в кадре. Коротко о модели закрытая Категория Images Вход текст, изображения Выход изображение Доступ OpenAI API Локально нет Веса нет Лучше всего:…

Cohere Command R/R+: корпоративные LLM с поиском

От project

Комментариев нет

1 мин. чтения

Модели для RAG‑сценариев и enterprise‑интеграций, устойчивы к длинным контекстам. Коротко о модели закрытая Категория LLM Вход текст Выход текст Доступ Cohere API Локально нет Веса нет Лучше всего: поиск по документам, корпоративные ассистенты…

ModelScope Text2Video: генерация видео по тексту

От project

Комментариев нет

5 Минут чтения

ModelScope Text2Video (Text-to-Video Synthesis) — это diffusion-модель для генерации видео по текстовому описанию: вы задаёте промт, а система синтезирует короткий ролик с движением и согласованными кадрами. Официальное описание, ограничения и примеры…

OpenAI Whisper: распознавание речи

От project

Комментариев нет

1 мин. чтения

Open‑source модель распознавания речи, популярна для локального STT. Коротко о модели open‑weight Категория Audio Вход аудио Выход текст Доступ open‑weight релиз Локально да Веса да Лучше всего: локальный STT, оффлайн‑распознавание Риски/ограничения:…

Playground v3: редактирование изображений с ИИ

От project

Комментариев нет

1 мин. чтения

Сервис для генерации изображений с удобным UI и быстрыми итерациями. Коротко о модели закрытая Категория Images Вход текст, изображения Выход изображение Доступ Playground web Локально нет Веса нет Лучше всего: быстрые концепты и вариации…

OpenAI Sora 2: генерация видео по тексту

От project

Комментариев нет

1 мин. чтения

Генерация видео из текста и изображений, с фокусом на реализм и синхронное аудио. Коротко о модели закрытая Категория Video Вход текст, изображения Выход видео + аудио Доступ Sora app / web Локально нет Веса нет Лучше всего: премиум‑визуал, рекламные…

Naver HyperCLOVA X: обзор и примеры

От project

Комментариев нет

6 Минут чтения

Naver HyperCLOVA X — семейство генеративных моделей от NAVER, ориентированное на глубокое понимание корейского языка и культурного контекста, а также на уверенную работу с английским и рядом прикладных задач (поиск, поддержка, аналитика, разработка).…

Snowflake Arctic: LLM для аналитики данных

От project

Комментариев нет

5 Минут чтения

Snowflake Arctic — это семейство enterprise-ориентированных LLM, созданных командой Snowflake AI Research и выпущенных с акцентом на открытость, эффективность и сильные результаты в задачах бизнеса: SQL, код и сложное следование инструкциям. Официальные…