GrandHub
    Архитектура
    AI Runtime

    Мозг GrandHub — мультимодельная архитектура

    Три уровня AI под одним умным роутером. Каждый запрос получает оптимальную модель — быстро, качественно, экономно.

    Flow запроса: от пользователя до ответа

    💬Сообщение юзера
    🛡️Guardian AI безопасность
    🧠Smart Router выбор модели
    💾buildContext() память + RAG
    AI Engine (Light/Pro/Ultra)
    🔧Tool Use навыки
    Ответ пользователю

    Три модели — одна платформа

    Smart Router автоматически выбирает модель под задачу

    Быстрые задачи

    GH-Light

    Мгновенные реакции. Идеален для рутинных операций, не требующих глубокого мышления.

    Скорость: < 500 мс
    Цена: дёшево
    • Короткие ответы
    • Classify запросов
    • Извлечение фактов
    • Простые команды
    Рабочая лошадка

    GH-Pro

    80% всех запросов. Оптимальный баланс скорости и качества для большинства задач.

    Скорость: ~2 сек
    Цена: баланс
    • Анализ документов
    • Написание текстов
    • Планирование задач
    • Сложные запросы
    Тяжёлые задачи

    GH-Ultra

    Самая мощная модель. Используется только когда задача требует максимального качества.

    Скорость: ~5-10 сек
    Цена: дороже
    • Глубокий анализ
    • Стратегия
    • Юридические тексты
    • Исследования

    Smart Router — автовыбор модели

    function smartRouter(message, context) {
      const complexity = analyzeComplexity(message);
      const hasTools   = requiresTools(message, context);
      const isLong     = message.length > 500;
    
      // Light: быстрые и простые
      if (complexity === 'low' && !hasTools && !isLong) {
        return 'claude-3-haiku-20240307';
      }
    
      // Ultra: только когда реально нужно
      if (complexity === 'high' && (isLong || hasTools)) {
        return 'claude-3-opus-20240229';
      }
    
      // Pro: по умолчанию (80% запросов)
      return 'claude-3-5-sonnet-20241022';
    }

    Ключевые возможности AI Runtime

    🧠

    Tool Use

    Навыки как инструменты. AI сам вызывает нужный skill.

    📚

    1M контекст

    Помощник помнит месяцы разговоров без потери контекста.

    Streaming

    Ответы появляются в реальном времени — нет ожидания.

    🔄

    Retry Logic

    Автоматический retry при ошибках API с экспоненциальной паузой.