ai - Страница 18 из 19 - Подробный обзор моделей ИИ и инструкций по взаимодействию с сетями ai.

Meta MusicGen: создание музыки с ИИ

От project

6 Минут чтения

Meta MusicGen — это генеративная модель, которая создает музыкальные фрагменты по текстовому описанию и (в некоторых режимах) по заданной мелодии/аудио-подсказке. Практический ориентир для старта: официальный стек Meta для MusicGen — библиотека…

Adobe Firefly 4: ИИ для дизайна и графики

От project

Комментариев нет

1 мин. чтения

Коммерчески ориентированные модели с интеграцией в Adobe‑экосистему. Коротко о модели закрытая Категория Images Вход текст, изображения Выход изображение Доступ Adobe Firefly Локально нет Веса нет Лучше всего: дизайн‑процессы в Adobe Риски/ограничения:…

Databricks DBRX: руководство по запуску

От project

Комментариев нет

5 Минут чтения

Databricks DBRX — открытая (open) LLM от Databricks, созданная как практичный стандарт для высококачественных и при этом экономичных генеративных решений. Если нужна отправная точка для корпоративного ассистента, RAG-поиска по документации или генерации…

Deepgram Nova: разбор и инструкция по STT API

От project

Комментариев нет

5 Минут чтения

Deepgram Nova — это линейка моделей speech-to-text для точной расшифровки аудио и речи в реальном времени. В большинстве проектов специалисты выбирают nova-3 как универсальную модель для встреч, колл-центров, подкастов и шумных записей, а для разговорных…

Stable Diffusion XL: генерация изображений

От project

Комментариев нет

6 Минут чтения

Stable Diffusion XL (SDXL) — флагманская текст-в-изображение модель от Stability AI, рассчитанная на генерацию детализированных картинок в высоком базовом разрешении и с улучшенной композицией, цветом и реализмом. Для старта полезно ознакомиться с…

Anthropic Claude 2: обзор и примеры

От project

Комментариев нет

5 Минут чтения

Anthropic Claude 2 — это поколение языковой модели Claude, представленное Anthropic в 2023 году: оно стало заметным шагом вперёд по качеству рассуждений, коду и удобству диалога, а также по работе с длинным контекстом. Официальное описание и анонс…

Open Assistant: открытый ИИ-ассистент

От project

Комментариев нет

5 Минут чтения

Open Assistant — это открытый чат-ассистент от сообщества LAION, который можно персонализировать, расширять поиском и подключением внешних инструментов. Для подготовки материала использована официальный сайт Open Assistant, а сама статья оформлена так,…

Ideogram 3.0: дизайн и типографика с помощью ИИ

От project

Комментариев нет

1 мин. чтения

Сильная типографика и работа с текстом в изображениях. Полезно для постеров и брендинга. Коротко о модели закрытая Категория Images Вход текст, изображения Выход изображение Доступ Ideogram web/API Локально нет Веса нет Лучше всего: постеры, баннеры,…

AudioLDM 2: генерация аудио по текстовому описанию

От project

Комментариев нет

1 мин. чтения

Open‑weight генерация аудио и звуков по текстовому описанию. Коротко о модели open‑weight Категория Audio Вход текст Выход аудио Доступ open‑weight релизы Локально да Веса да Лучше всего: звуковые эффекты, саунд‑дизайн Риски/ограничения: нужна настройка…

Stable Audio: генерация музыки и звуков

От project

Комментариев нет

6 Минут чтения

Stable Audio — это модель Stability AI для генерации музыки, саунд-дизайна и фирменного аудио по текстовым промптам. Для подготовки материала использована официальная страница Stable Audio, а сама статья оформлена так, как требовалось в промте: с…