Часто задаваемые вопросы о локальном ИИ

Всё, что нужно знать перед внедрением нейросети в ваш бизнес.

Общие вопросы

Локальный (On-Premise) ИИ — нейросети работают на вашем оборудовании, в вашем контуре. Все данные (документы, письма, базы) обрабатываются на вашем сервере и никогда не передаются в интернет.

Zero-Knowledge архитектура — означает, что мы как разработчики и интеграторы не имеем технической возможности доступа к вашим данным. Векторные эмбеддинги (математическое представление документов) шифруются, и ключ расшифровки хранится только у вас. Даже имея физический доступ к серверу, мы не сможем прочитать документы без этого ключа.

Это фундаментально отличается от облачных API (ChatGPT, Claude), где каждое ваше сообщение отправляется на сервер третьей стороны.

1. Конфиденциальность. ChatGPT отправляет каждый ваш запрос в облако OpenAI. Ваши документы, письма и коммерческая информация проходят через чужие серверы. Локальный ИИ работает на вашем сервере — данные не покидают компанию.

2. Знание контекста. ChatGPT не знает ваши регламенты, ваших клиентов и историю сделок. Локальный ИИ индексирует всю вашу документацию и отвечает, опираясь на реальные данные компании.

3. Экономика. ChatGPT Pro — $200/мес на пользователя. 10 сотрудников = $24 000/год, каждый год. Локальный ИИ: один раз заплатили за внедрение — пользуетесь безлимитно.

4. Кастомизация. Вы не можете дообучить ChatGPT на своих данных. Локальную модель — можете.

Мы интегрируем 50+ корпоративных систем через RPA-конвейеры и API:

CRM: Bitrix24, AmoCRM, Salesforce
ERP/Учёт: 1С:Предприятие, SAP
Почта и документы: Outlook/Exchange, Google Workspace, OneDrive, Notion, Obsidian
Мессенджеры: Telegram, WhatsApp Business API
Специфические: СДЭК API, GetCourse, Excel/CSV
Legacy-системы: любые Windows-приложения через Win32 API (RPA)

Нет вашей системы? Спросите — скорее всего, сможем.

Технические вопросы

Пилотный проект (85 000 ₽): современный ПК или небольшой сервер с 32 ГБ ОЗУ и видеокартой NVIDIA RTX 3060/4060 (12 ГБ VRAM). Этого достаточно для облегчённых моделей: Phi-4, Saiga 8B.

Полная интеграция (250 000 ₽): сервер с 64 ГБ ОЗУ и GPU от NVIDIA RTX 4090 (24 ГБ) или профессиональной A5000. Запускаются DeepSeek-R1 (32B) и Llama 3.2 Vision.

Корпоративный кластер (от 600 000 ₽): кластер из 2-4 GPU (A6000 или A100). Оркестрация Llama 70B и автономных агентов. Мы консультируем по сборке и закупке оборудования под вашу нагрузку.

Нет своего сервера? Поможем подобрать и заказать оптимальную конфигурацию.

RPA (Robotic Process Automation) — программные роботы, которые извлекают данные из систем без нарушения корпоративных политик безопасности.

Пример из нашего кейса: клиент использовал корпоративный Outlook с жёсткими политиками безопасности. Облачные API были заблокированы службой безопасности. Мы написали RPA-бота, который через Win32 API (легитимный Windows-интерфейс) прочитал 21 000 писем, извлёк вложения, классифицировал их и передал в векторную базу ИИ. Служба безопасности подтвердила: политики не нарушены.

RPA — это мост между legacy-системами и современным ИИ. Без него многие внедрения в крупных компаниях просто невозможны.

Мы используем Open-Source модели (не требуют лицензионных отчислений):

DeepSeek-R1 — флагманская модель для сложного анализа: договоры, медицинские карты, финансовая аналитика.
Llama 3.2 Vision (11B/90B) — распознавание изображений: счета, накладные, чеки, фотографии документов.
Qwen 2.5 (32B/72B) — работа с русскоязычными документами: регламенты, CustDev, внутренняя документация.
Phi-4 (14B) — лёгкая модель для пилотных проектов, работает на бюджетном оборудовании.
Saiga 8B — русскоязычная модель для чат-ботов и простых задач.

Архитектура модель-независимая: можем заменить любую модель без перестройки системы.

Архитектура модель-независимая — мы не привязаны к конкретной модели. При выходе новой версии (например, DeepSeek-R2 или Llama 4) мы можем заменить ядро без перестройки конвейеров данных и интеграций.

Обновление моделей включено в договор поддержки. Вы не останетесь с «устаревшим ИИ» — это принципиальное отличие от проприетарных решений, где переход на новую версию = новый проект.

Безопасность и соответствие законодательству

Да. Локальное (Air-Gapped) развёртывание — ключевой фактор соответствия 152-ФЗ. Поскольку все данные обрабатываются на сервере внутри вашего контура и не передаются в интернет, система соответствует требованиям к обработке персональных данных, включая:

• Медицинскую тайну (ч. 1 ст. 13 ФЗ-323)
• Специальные категории персональных данных (ст. 10 ФЗ-152)
• Трансграничную передачу данных (ст. 12 ФЗ-152) — исключена, так как данные не покидают РФ

Мы подписываем DPA (Data Processing Agreement) и по запросу предоставляем пакет документов для Роскомнадзора: описание архитектуры, меры защиты, порядок обработки.

Три основные причины, по которым службы безопасности блокируют облачные ИИ:

1. Утечка данных. Всё, что вы отправляете в ChatGPT, попадает на серверы OpenAI в США. По условиям использования, ваши данные могут использоваться для обучения моделей. В 2024 году Samsung запретил ChatGPT после того, как инженеры загрузили исходный код в чат.

2. Нарушение NDA. Ваши договоры с клиентами почти наверняка запрещают передачу их данных третьим лицам. ChatGPT — третье лицо.

3. Нет контроля. Вы не знаете, где физически хранятся ваши данные, кто имеет к ним доступ и как они защищены. С локальным ИИ вы контролируете всё.

Да, это наш стандартный режим развёртывания для клиентов с повышенными требованиями безопасности. Модели загружаются один раз на физическом носителе и работают полностью изолированно. Не требуется даже локальная сеть с выходом в интернет.

Именно так мы работаем с медицинскими клиниками (152-ФЗ) и промышленными предприятиями, где служба безопасности запрещает любые облачные сервисы.

Стоимость и сроки

START — 85 000 ₽ (7-10 дней)
Пилотный проект. 1 канал данных (например, Telegram-бот). Модели: phi4, Saiga 8B. Подходит для проверки гипотезы и демонстрации руководству.

OPTIMUM — 250 000 ₽ (14-21 день) ★ Хит продаж
Полная интеграция: CRM + OneDrive + Outlook. Модели: DeepSeek-R1, Llama Vision. Визуализация графа знаний в Obsidian. Для компании с 10-50 сотрудников.

ENTERPRISE — от 600 000 ₽ (от 1 месяца)
Корпоративный кластер: ERP, 1С, СДЭК API. Оркестрация Llama 70B и авто-агентов. Консультация по сборке GPU-сервера.

Абонентской платы нет. Оплата один раз за внедрение. Поддержка после запуска — опционально, от 15 000 ₽/мес.

В стоимость включено:
Аудит — анализ ваших источников данных, процессов и выбор оптимальной архитектуры
Data Pipelines — настройка конвейеров извлечения данных из ваших систем (RPA + API)
Развёртывание моделей — установка и настройка нейросетей на вашем оборудовании
Векторная база — индексация документов, эмбеддинги, поиск (Qdrant)
Интеграция — подключение к CRM, почте, мессенджерам, 1С
Инструктаж — обучение сотрудников работе с системой
30 дней поддержки — сопровождение после запуска

В стоимость НЕ входит оборудование (сервер). Мы помогаем подобрать конфигурацию под ваш бюджет.

Пилот (START): 7-10 рабочих дней. Быстрый запуск на одном канале данных для проверки гипотезы.

Полная интеграция (OPTIMUM): 2-3 недели. Подключение CRM + документооборота, развёртывание основных моделей.

Корпоративный (ENTERPRISE): 1-2 месяца. Глубокий аудит, интеграция ERP, кастомные RPA-конвейеры, кластер из нескольких GPU.

Точный срок зависит от количества и сложности источников данных. На этапе аудита даём детальный план-график.

Остались вопросы?

Закажите бесплатный 30-минутный аудит. Разберём вашу задачу, оценим стоимость и сроки.

Из блога

Полезные статьи по теме