Архитектура
AI Runtime
Мозг GrandHub — мультимодельная архитектура
Три уровня AI под одним умным роутером. Каждый запрос получает оптимальную модель — быстро, качественно, экономно.
Flow запроса: от пользователя до ответа
💬Сообщение юзера
🛡️Guardian AI безопасность
🧠Smart Router выбор модели
💾buildContext() память + RAG
⚡AI Engine (Light/Pro/Ultra)
🔧Tool Use навыки
✅Ответ пользователю
Три модели — одна платформа
Smart Router автоматически выбирает модель под задачу
Быстрые задачи
GH-Light
Мгновенные реакции. Идеален для рутинных операций, не требующих глубокого мышления.
Скорость: < 500 мс
Цена: дёшево
- Короткие ответы
- Classify запросов
- Извлечение фактов
- Простые команды
Рабочая лошадка
GH-Pro
80% всех запросов. Оптимальный баланс скорости и качества для большинства задач.
Скорость: ~2 сек
Цена: баланс
- Анализ документов
- Написание текстов
- Планирование задач
- Сложные запросы
Тяжёлые задачи
GH-Ultra
Самая мощная модель. Используется только когда задача требует максимального качества.
Скорость: ~5-10 сек
Цена: дороже
- Глубокий анализ
- Стратегия
- Юридические тексты
- Исследования
Smart Router — автовыбор модели
function smartRouter(message, context) {
const complexity = analyzeComplexity(message);
const hasTools = requiresTools(message, context);
const isLong = message.length > 500;
// Light: быстрые и простые
if (complexity === 'low' && !hasTools && !isLong) {
return 'claude-3-haiku-20240307';
}
// Ultra: только когда реально нужно
if (complexity === 'high' && (isLong || hasTools)) {
return 'claude-3-opus-20240229';
}
// Pro: по умолчанию (80% запросов)
return 'claude-3-5-sonnet-20241022';
}Ключевые возможности AI Runtime
🧠
Tool Use
Навыки как инструменты. AI сам вызывает нужный skill.
📚
1M контекст
Помощник помнит месяцы разговоров без потери контекста.
⚡
Streaming
Ответы появляются в реальном времени — нет ожидания.
🔄
Retry Logic
Автоматический retry при ошибках API с экспоненциальной паузой.