Что такое embeddings?

Embeddings — это векторные представления текстов или других объектов в числовом пространстве фиксированной размерности. Для семантического поиска цель — отображать близкие по смыслу тексты в соседние вектора, чтобы близость векторов отражала смысловую близость. В 2025–2026 годах распространён подход: получить эмбеддинги с предобученных трансформеров и индексировать их в быстрых индексах, таких как FAISS, для миллионий документов.

Какую модель выбрать?

Выбор модели зависит от компромисса точность/скорость/память. В 2025 году распространены семейства: Mini/Small (например, all-MiniLM v2, 384D) — быстрые, образ ~50–150 MB, подходят для подсистем с ограниченным ресурсом, латентность Base/Medium (768D) — лучше качество при приемлемых ресурсах, размер модели 300–800 MB, требование RAM 4–8 GB. Large (1024–1536D и выше) — для задач высокой точности, размер 1–4 GB, GPU рекомендован; время эмбеддинга на CPU может быть >200 ms. Практический выбор: для большинства production-цепочек в 2025 годe разумен all-MiniLM-v2 (384D) или модель 768D, если требуется более точный поиск. Всегда измеряйте точность на своей валидационной выборке.

Как измерять похожесть?

Часто используются три метрики: cosine similarity, dot-product и L2 (евклидово расстояние). Для нормированных векторов cosine и dot эквивалентны по упорядочению. Dot полезен, когда длина векторов несбалансирована. L2 применим при использовании индексирования, чувствительного к норме векторов. Важно: измерения зависят от нормализации и размерности. В примерах ниже показано, как вычислять все три для пары векторов в Python и как выбирать порог для фильтрации ответов.

Embeddings для семантического поиска на Python

Embeddings для семантического поиска на Python | KtoHto

python3.11 -m venv venv_emb
source venv_emb/bin/activate
pip install --upgrade pip
pip install sentence-transformers==2.3.0 faiss-cpu==1.7.4 numpy==1.26 fastapi==0.98 uvicorn==0.22 psycopg[binary]==3.2

Collecting sentence-transformers==2.3.0
  Downloading sentence_transformers-2.3.0-py3-none-any.whl (120 kB)
Collecting faiss-cpu==1.7.4
  Downloading faiss_cpu-1.7.4-cp311-cp311-manylinux_2_31_x86_64.whl (45 MB)
Successfully installed sentence-transformers-2.3.0 faiss-cpu-1.7.4 numpy-1.26 ...

error: command 'gcc' failed with exit status 1

sudo apt update && sudo apt install build-essential python3.11-dev libatlas-base-dev -y
# затем повторить pip install

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
corpus = ['Как настроить PostgreSQL', 'Пример использования FAISS', 'Введение в embeddings']
embeddings = model.encode(corpus, convert_to_numpy=True)
print(embeddings.shape)

(3, 384)

OSError: Can't load model for 'all-MiniLM-L6-v2' from Hugging Face hub.
# fix: проверьте интернет и проброс прокси, или предварительно скачайте модель:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('/path/to/local/model')

import faiss
import numpy as np
# embeddings - numpy array shape (N, D)
d = embeddings.shape[1]
index = faiss.IndexFlatIP(d)  # для cosine предварительно нормализуем
faiss.normalize_L2(embeddings)
index.add(embeddings.astype(np.float32))
print('Indexed vectors:', index.ntotal)

Indexed vectors: 3

RuntimeError: Unsupported dtype: float64
# fix: привести в numpy.float32
index.add(embeddings.astype(np.float32))

query = 'как установить faiss'
q_vec = model.encode([query], convert_to_numpy=True)
faiss.normalize_L2(q_vec)
D, I = index.search(q_vec.astype(np.float32), k=5)
print('indices:', I)
print('scores:', D)

indices: [[1 0 2 -1 -1]]
scores: [[0.88 0.65 0.40 -0.01 -0.02]]

IndexError: index out of bounds
# fix: убедитесь, что k <= index.ntotal и что вектор q_vec корректной размерности

# Сохранение FAISS индекса
faiss.write_index(index, 'index.faiss')
# В PostgreSQL сохраняем метаданные (id -> текст)
# SQL пример:
-- CREATE TABLE documents(id SERIAL PRIMARY KEY, doc_id TEXT UNIQUE, text TEXT);
-- INSERT INTO documents(doc_id, text) VALUES ('doc-1', 'Как настроить PostgreSQL');

# Восстановление индекса
index2 = faiss.read_index('index.faiss')
print('Loaded index size:', index2.ntotal)

Loaded index size: 3

AssertionError: Error reading index: file not found
# fix: проверьте путь, права доступа, используйте полный путь и синхронизируйте файлы при развёртывании

from fastapi import FastAPI
from pydantic import BaseModel
app = FastAPI()
class Query(BaseModel):
    q: str

@app.post('/search')
def search(query: Query):
    q_vec = model.encode([query.q], convert_to_numpy=True)
    faiss.normalize_L2(q_vec)
    D, I = index.search(q_vec.astype(np.float32), k=5)
    # здесь запрос к PostgreSQL для метаданных по I
    return {'indices': I.tolist(), 'scores': D.tolist()}

# запуск: uvicorn main:app --host 0.0.0.0 --port 8000

Embeddings для семантического поиска на Python

Комментарии (0)

Что вы изучите

Требования

Что такое embeddings?

Какую модель выбрать?

Как измерять похожесть?

Шаг 1: Установка окружения

Шаг 2: Загрузка модели и создание эмбеддингов

Шаг 3: Индексация через FAISS

Шаг 4: Запросы и поиск по похожести

Шаг 5: Сохранение и восстановление индекса; интеграция с PostgreSQL

Шаг 6: Развёртывание простого API для поиска (FastAPI)