AI Runtime

Мозг GrandHub — мультимодельная архитектура

Три уровня AI под одним умным роутером. Каждый запрос получает оптимальную модель — быстро, качественно, экономно.

Flow запроса: от пользователя до ответа

💬Сообщение юзера

🛡️Guardian AI безопасность

🧠Smart Router выбор модели

💾buildContext() память + RAG

⚡AI Engine (Light/Pro/Ultra)

🔧Tool Use навыки

✅Ответ пользователю

Три модели — одна платформа

Smart Router автоматически выбирает модель под задачу

Быстрые задачи

GH-Light

Мгновенные реакции. Идеален для рутинных операций, не требующих глубокого мышления.

Скорость: < 500 мс

Цена: дёшево

Короткие ответы
Classify запросов
Извлечение фактов
Простые команды

Рабочая лошадка

GH-Pro

80% всех запросов. Оптимальный баланс скорости и качества для большинства задач.

Скорость: ~2 сек

Цена: баланс

Анализ документов
Написание текстов
Планирование задач
Сложные запросы

Тяжёлые задачи

GH-Ultra

Самая мощная модель. Используется только когда задача требует максимального качества.

Скорость: ~5-10 сек

Цена: дороже

Глубокий анализ
Стратегия
Юридические тексты
Исследования

Smart Router — автовыбор модели

function smartRouter(message, context) {
  const complexity = analyzeComplexity(message);
  const hasTools   = requiresTools(message, context);
  const isLong     = message.length > 500;

  // Light: быстрые и простые
  if (complexity === 'low' && !hasTools && !isLong) {
    return 'claude-3-haiku-20240307';
  }

  // Ultra: только когда реально нужно
  if (complexity === 'high' && (isLong || hasTools)) {
    return 'claude-3-opus-20240229';
  }

  // Pro: по умолчанию (80% запросов)
  return 'claude-3-5-sonnet-20241022';
}

Ключевые возможности AI Runtime

🧠

Tool Use

Навыки как инструменты. AI сам вызывает нужный skill.

📚

1M контекст

Помощник помнит месяцы разговоров без потери контекста.

⚡

Streaming

Ответы появляются в реальном времени — нет ожидания.

🔄

Retry Logic

Автоматический retry при ошибках API с экспоненциальной паузой.

Система памяти

Безопасность