Статьи в категории AI и ML | KtoHto

AI и ML

Искусственный интеллект и нейросети

0 статей

Stan Brown·AI и ML·—

Локальная LLM на Ollama: гайд для разработчика

Пошаговый практический гайд по разворачиванию локальной LLM на Ollama, выбору модели, вызовам API и интеграции в разработку. Время выполнения — от 30 минут до нескольких часов в зависимости от модели и железа.

Читать далее10 мин·

010

Stan Brown·AI и ML·—

Как построить AI-редактор на OpenAI API

Пошаговое руководство по созданию редактора с генерацией и правками текста на базе OpenAI API с конкретными цифрами, архитектурой и примерами кода. Подходит для MVP и промышленного продукта в 2025–2026 годах.

Читать далее11 мин·

00

Stan Brown·AI и ML·—

Prompt caching: снижение стоимости в 3 раза

Пошаговое руководство по внедрению prompt caching для Claude с примерами кода, командами и расчётом экономии. Время выполнения: ~2–4 часа для прототипа, 1–2 дня для промышленной интеграции.

Читать далее8 мин·

00

Stan Brown·AI и ML·—

Сделал AI-поддержку для саас: детали 2026

Как мы внедрили AI-поддержку в SaaS-продукт и снизили среднее время решения инцидента почти на треть. Подробный разбор архитектуры RAG + агент, интеграции с Intercom, метрик и затрат за 2025–2026 годы.

Читать далее4 мин·

01

Stan Brown·AI и ML·—

Embeddings для семантического поиска на Python

Получите рабочий пайплайн: от установки окружения до индексации через FAISS и развёртывания простого API; время выполнения — 30–90 минут в зависимости от конфигурации. Примеры кода используют Python 3.11 и модели 2025 года.

Читать далее5 мин·

00

Stan Brown·AI и ML·—

OpenAI API через прокси: рабочая схема для РФ 2026

Как безопасно и стабильно подключить OpenAI API из России через прокси-сервер за пределами РФ. Пошаговая инструкция 2025–2026 с примером на Go, настройками прокси и стратегиями обхода rate limit.

Читать далее8 мин·

06

Stan Brown·AI и ML·—

Cursor vs Claude Code: реальный опыт 2026

Сравнение рабочих потоков Cursor и Claude Code: практические примеры, команды, замеры скорости и качества кода. Примерное время выполнения полного руководства — 90–150 минут.

Читать далее5 мин·

00

Stan Brown·AI и ML·—

Function calling в OpenAI API: рабочий пример

Пошаговый практический гайд по использованию function calling в OpenAI API с реальными примерами на 2025 год. Выполнение от начальной установки до безопасного запуска — около 40–70 минут.

Читать далее1 мин·

01

Stan Brown·AI и ML·—

RAG advanced: hybrid search и re-ranking

Гибридный поиск в RAG сочетает быстрый BM25 и семантические векторы, а re‑ranking с cross‑encoder повышает точность выдачи и сокращает хаос в ответах. Приведу рабочие рецепты, метрики и примеры кода с конкретными числами для 2025–2026 годов.

Читать далее13 мин·

00

Stan Brown·AI и ML·—

GigaChat API 2026: обзор для разработчика

Сравниваем GigaChat API и OpenAI API в 2026 году: архитектура, отличия в протоколах, цены и практические сценарии. Ключевой вывод: GigaChat полезен при локализации и контроле контента; OpenAI остаётся сильнее в экосистеме и универсальных задачах.

Читать далее10 мин·

02

Stan Brown·AI и ML·—

Fine-tuning Llama 3 на своих данных

Пошаговое руководство по подготовке данных, выбору архитектуры дообучения и запуску fine tuning Llama 3 на реальных задачах. Приведены команды, оценки стоимости и примеры кода для 2025–2026 годов.

Читать далее1 мин·

00

Stan Brown·AI и ML·—

Vector DB 2026: Qdrant vs Weaviate vs Milvus

Сравнение Qdrant, Weaviate и Milvus — какие задачи они решают, как ведут себя в бенчмарках 2025–2026, и за счёт чего отличаются стоимостью размещения. Ключевой инсайт: для 10M векторов чаще выгоден Qdrant по стоимости и удобству фильтров; для 1B — Milvus при наличии GPU-инфраструктуры, Weaviate — если нужна GraphQL-экосистема.

Читать далее12 мин·

00

Stan Brown·AI и ML·—

RAG с нуля: строим поиск по своим документам

Пошаговое руководство по настройке Retrieval-Augmented Generation для поиска по корпоративным документам и личным архивам. Практические рекомендации по чанкованию, выбору embeddings, хранению векторов и интеграции с LLM (с конкретными цифрами и кодом).

Читать далее10 мин·

01

Stan Brown·AI и ML·—

Частые вопросы про AI-разработку в 2026

Краткий FAQ для инженеров и менеджеров: ответы на типичные вопросы по выбору LLM, оценке стоимости, приватности и тестированию AI-сервисов в 2025–2026 годах.

Читать далее9 мин·

03

Stan Brown·AI и ML·—

LangGraph: оркестрация LLM-агентов

Пошаговый туториал по построению графа агентов с LangGraph, готовый к продакшену. Время выполнения по шагам: 60–120 минут в зависимости от окружения.

Читать далее4 мин·

01

Stan Brown·AI и ML·—

YandexGPT в бэкенде: практика интеграции

Пошаговое руководство по подключению YandexGPT 5 к серверному приложению: от получения ключа и настройки prompt'ов до rate limiting, мониторинга и RAG. Приведены рабочие команды, примеры кода и конкретные числа по задержкам, лимитам и стоимости (данные на 2025–2026 годы).

Читать далее2 мин·

00

Stan Brown·AI и ML·—

AI-агенты в продакшне 2026: полный гайд

Пошаговый практический гайд по внедрению ai агентов в продакшн с примерами кода, метриками и оценкой стоимости. Подходит для команд ML/DevOps и продакт-менеджеров в 2025–2026 годах.

Читать далее2 мин·

02

Stan Brown·AI и ML·—

MCP (Model Context Protocol) для разработчика

Пошаговый гайд по созданию сервера MCP, выбору инструментов, интеграции с Claude и отладке в 2025–2026 годах. Практические примеры кода, оценки стоимости и рекомендации по предотвращению распространённых ошибок.

Читать далее4 мин·

01

Stan Brown·AI и ML·—

AI-саммари статей на 10М токенов в месяц

Как организовать массовую трансформацию статей в короткие выдержки с Claude Haiku и снизить расходы на токены: этапы, код и расчёты на 2025–2026 годы.

Читать далее9 мин·

00

Stan Brown·AI и ML·—

Claude Sonnet 4.5 API: практика для backend

Практический гайд по интеграции Claude Sonnet 4.5 API в backend-приложение: аутентификация, стриминг, использование инструментов и кэширование подсказок. Время выполнения полного примера: 2–4 часа при наличии ключа и настроенного окружения.

Читать далее3 мин·

01

Stan Brown·AI и ML·—

GPT-4 Turbo vs Claude Opus: сравнение 2026

Сравнение GPT-4 Turbo и Claude Opus по ключевым метрикам — производительность, кодогенерация, стоимость и экосистема. Короткий вывод: для задач, где критичны задержка и масштабирование запросов — GPT-4 Turbo; для задач с повышенными требованиями к безопасности и управляемости — Claude Opus.

Читать далее11 мин·

02

Stan Brown·AI и ML·—

Multi-agent системы: паттерны 2026

Multi agent llm — это архитектурный подход, где решение разбивается на независимые агенты с разными ролями и контрактами обмена. Статья даёт практические паттерны 2025–2026 годов: роли, коммуникацию, координатор, фреймворки и критерия «overkill».

Читать далее10 мин·

00

Stan Brown·AI и ML·—

LLM evaluation: как тестировать prompts

Пошаговое руководство по созданию воспроизводимых LLM evaluation тестов для prompts с практическими рецептами, кодом и расчётом стоимости. Подойдёт для команд, которые интегрируют проверку prompts в CI и хотят перейти от ad-hoc опытов к устойчивой практике.

Читать далее3 мин·

00

Stan Brown·AI и ML·—

Streaming responses от LLM в Next.js

Пошаговый туториал по реализации потоковых ответов от LLM в приложении на Next.js: от Server-Sent Events до интеграции Vercel AI SDK и отмены запросов. Примерное время выполнения — 60–120 минут.

Читать далее3 мин·

00