Что значит «локальный ИИ» и Zero-Knowledge архитектура?

Локальный (On-Premise) ИИ — нейросети работают на вашем сервере, без доступа в интернет. Данные не передаются в облака. Zero-Knowledge означает, что разработчик не имеет технической возможности доступа к вашим данным. Все векторы (эмбеддинги) шифруются ключом, который хранится только у вас.

Сколько стоит внедрение нейросети в бизнес?

Пилотный проект (пакет START) — 85 000 ₽. Включает: аудит, подключение 1 канала данных, развёртывание моделей phi4/Saiga 8B. Полная интеграция (OPTIMUM) — 250 000 ₽: CRM + OneDrive + Outlook, DeepSeek-R1, Llama Vision. Корпоративный кластер (ENTERPRISE) — от 600 000 ₽. Абонентской платы нет.

Какое оборудование нужно для локального ИИ?

Для пилотного проекта достаточно ПК с 32 ГБ ОЗУ и NVIDIA RTX 3060 (12 ГБ VRAM). Для полной интеграции — сервер с 64 ГБ ОЗУ и GPU от RTX 4090 (24 ГБ) или A5000. Для Enterprise — кластер из 2-4 GPU. Мы консультируем по подбору оборудования.

Чем локальный ИИ лучше ChatGPT?

Три главных отличия: 1) Конфиденциальность — ваши документы не покидают контур компании (ChatGPT отправляет всё в облако OpenAI). 2) Кастомизация — модель дообучается на ваших данных, знает ваши регламенты и термины. 3) Нет абонентской платы — один раз заплатили за внедрение, пользуетесь безлимитно.

Соответствует ли система 152-ФЗ для медицины?

Да. Локальное развёртывание (Air-Gapped) означает, что данные пациентов не попадают в интернет. Подписываем DPA (Data Processing Agreement). По запросу предоставляем пакет документов для Роскомнадзора.

Что такое RPA и зачем оно нужно?

RPA (Robotic Process Automation) — программные роботы, которые извлекают данные из ваших систем без нарушения политик безопасности. Например: робот читает письма Outlook через Win32 API (не через облако), забирает данные из 1С, сканирует PDF-счета. RPA собирает разрозненные данные в единый конвейер, который питает нейросеть.

Как обновляются модели ИИ?

Наша архитектура модель-независимая — мы не привязаны к конкретной модели. При выходе новой версии DeepSeek, Llama или Qwen заменяем ядро без перестройки системы. Обновление включено в договор поддержки.

Какие системы вы интегрируете?

50+ систем. Основные: 1С, Bitrix24, AmoCRM, Outlook/Exchange, Google Workspace, Notion, Obsidian, Telegram, OneDrive, СДЭК API, GetCourse. Под заказ — интеграция с любым API или legacy-системой через RPA-конвейер.

Сколько времени занимает внедрение?

START (пилот) — 7-10 дней. OPTIMUM (полная интеграция) — 14-21 день. ENTERPRISE — от 1 месяца. Сроки зависят от количества источников данных и сложности интеграции.

Есть ли поддержка после внедрения?

Да. 30 дней бесплатного сопровождения включены во все тарифы. Далее — опциональный договор поддержки от 15 000 ₽/мес: обновление моделей, мониторинг, дообучение на новых данных, консультации.

FAQ: Локальный ИИ для бизнеса | Ответы на вопросы

Локальный (On-Premise) ИИ — нейросети работают на вашем оборудовании, в вашем контуре. Все данные (документы, письма, базы) обрабатываются на вашем сервере и никогда не передаются в интернет.

Zero-Knowledge архитектура — означает, что мы как разработчики и интеграторы не имеем технической возможности доступа к вашим данным. Векторные эмбеддинги (математическое представление документов) шифруются, и ключ расшифровки хранится только у вас. Даже имея физический доступ к серверу, мы не сможем прочитать документы без этого ключа.

Это фундаментально отличается от облачных API (ChatGPT, Claude), где каждое ваше сообщение отправляется на сервер третьей стороны.

1. Конфиденциальность. ChatGPT отправляет каждый ваш запрос в облако OpenAI. Ваши документы, письма и коммерческая информация проходят через чужие серверы. Локальный ИИ работает на вашем сервере — данные не покидают компанию.

2. Знание контекста. ChatGPT не знает ваши регламенты, ваших клиентов и историю сделок. Локальный ИИ индексирует всю вашу документацию и отвечает, опираясь на реальные данные компании.

3. Экономика. ChatGPT Pro — $200/мес на пользователя. 10 сотрудников = $24 000/год, каждый год. Локальный ИИ: один раз заплатили за внедрение — пользуетесь безлимитно.

4. Кастомизация. Вы не можете дообучить ChatGPT на своих данных. Локальную модель — можете.

Мы интегрируем 50+ корпоративных систем через RPA-конвейеры и API:

CRM: Bitrix24, AmoCRM, Salesforce
ERP/Учёт: 1С:Предприятие, SAP
Почта и документы: Outlook/Exchange, Google Workspace, OneDrive, Notion, Obsidian
Мессенджеры: Telegram, WhatsApp Business API
Специфические: СДЭК API, GetCourse, Excel/CSV
Legacy-системы: любые Windows-приложения через Win32 API (RPA)

Нет вашей системы? Спросите — скорее всего, сможем.

Пилотный проект (85 000 ₽): современный ПК или небольшой сервер с 32 ГБ ОЗУ и видеокартой NVIDIA RTX 3060/4060 (12 ГБ VRAM). Этого достаточно для облегчённых моделей: Phi-4, Saiga 8B.

Полная интеграция (250 000 ₽): сервер с 64 ГБ ОЗУ и GPU от NVIDIA RTX 4090 (24 ГБ) или профессиональной A5000. Запускаются DeepSeek-R1 (32B) и Llama 3.2 Vision.

Корпоративный кластер (от 600 000 ₽): кластер из 2-4 GPU (A6000 или A100). Оркестрация Llama 70B и автономных агентов. Мы консультируем по сборке и закупке оборудования под вашу нагрузку.

Нет своего сервера? Поможем подобрать и заказать оптимальную конфигурацию.

RPA (Robotic Process Automation) — программные роботы, которые извлекают данные из систем без нарушения корпоративных политик безопасности.

Пример из нашего кейса: клиент использовал корпоративный Outlook с жёсткими политиками безопасности. Облачные API были заблокированы службой безопасности. Мы написали RPA-бота, который через Win32 API (легитимный Windows-интерфейс) прочитал 21 000 писем, извлёк вложения, классифицировал их и передал в векторную базу ИИ. Служба безопасности подтвердила: политики не нарушены.

RPA — это мост между legacy-системами и современным ИИ. Без него многие внедрения в крупных компаниях просто невозможны.

Мы используем Open-Source модели (не требуют лицензионных отчислений):

DeepSeek-R1 — флагманская модель для сложного анализа: договоры, медицинские карты, финансовая аналитика.
Llama 3.2 Vision (11B/90B) — распознавание изображений: счета, накладные, чеки, фотографии документов.
Qwen 2.5 (32B/72B) — работа с русскоязычными документами: регламенты, CustDev, внутренняя документация.
Phi-4 (14B) — лёгкая модель для пилотных проектов, работает на бюджетном оборудовании.
Saiga 8B — русскоязычная модель для чат-ботов и простых задач.

Архитектура модель-независимая: можем заменить любую модель без перестройки системы.

Архитектура модель-независимая — мы не привязаны к конкретной модели. При выходе новой версии (например, DeepSeek-R2 или Llama 4) мы можем заменить ядро без перестройки конвейеров данных и интеграций.

Обновление моделей включено в договор поддержки. Вы не останетесь с «устаревшим ИИ» — это принципиальное отличие от проприетарных решений, где переход на новую версию = новый проект.

Да. Локальное (Air-Gapped) развёртывание — ключевой фактор соответствия 152-ФЗ. Поскольку все данные обрабатываются на сервере внутри вашего контура и не передаются в интернет, система соответствует требованиям к обработке персональных данных, включая:

• Медицинскую тайну (ч. 1 ст. 13 ФЗ-323)
• Специальные категории персональных данных (ст. 10 ФЗ-152)
• Трансграничную передачу данных (ст. 12 ФЗ-152) — исключена, так как данные не покидают РФ

Мы подписываем DPA (Data Processing Agreement) и по запросу предоставляем пакет документов для Роскомнадзора: описание архитектуры, меры защиты, порядок обработки.

Три основные причины, по которым службы безопасности блокируют облачные ИИ:

1. Утечка данных. Всё, что вы отправляете в ChatGPT, попадает на серверы OpenAI в США. По условиям использования, ваши данные могут использоваться для обучения моделей. В 2024 году Samsung запретил ChatGPT после того, как инженеры загрузили исходный код в чат.

2. Нарушение NDA. Ваши договоры с клиентами почти наверняка запрещают передачу их данных третьим лицам. ChatGPT — третье лицо.

3. Нет контроля. Вы не знаете, где физически хранятся ваши данные, кто имеет к ним доступ и как они защищены. С локальным ИИ вы контролируете всё.

Да, это наш стандартный режим развёртывания для клиентов с повышенными требованиями безопасности. Модели загружаются один раз на физическом носителе и работают полностью изолированно. Не требуется даже локальная сеть с выходом в интернет.

Именно так мы работаем с медицинскими клиниками (152-ФЗ) и промышленными предприятиями, где служба безопасности запрещает любые облачные сервисы.

START — 85 000 ₽ (7-10 дней)
Пилотный проект. 1 канал данных (например, Telegram-бот). Модели: phi4, Saiga 8B. Подходит для проверки гипотезы и демонстрации руководству.

OPTIMUM — 250 000 ₽ (14-21 день) ★ Хит продаж
Полная интеграция: CRM + OneDrive + Outlook. Модели: DeepSeek-R1, Llama Vision. Визуализация графа знаний в Obsidian. Для компании с 10-50 сотрудников.

ENTERPRISE — от 600 000 ₽ (от 1 месяца)
Корпоративный кластер: ERP, 1С, СДЭК API. Оркестрация Llama 70B и авто-агентов. Консультация по сборке GPU-сервера.

Абонентской платы нет. Оплата один раз за внедрение. Поддержка после запуска — опционально, от 15 000 ₽/мес.

В стоимость включено:
• Аудит — анализ ваших источников данных, процессов и выбор оптимальной архитектуры
• Data Pipelines — настройка конвейеров извлечения данных из ваших систем (RPA + API)
• Развёртывание моделей — установка и настройка нейросетей на вашем оборудовании
• Векторная база — индексация документов, эмбеддинги, поиск (Qdrant)
• Интеграция — подключение к CRM, почте, мессенджерам, 1С
• Инструктаж — обучение сотрудников работе с системой
• 30 дней поддержки — сопровождение после запуска

В стоимость НЕ входит оборудование (сервер). Мы помогаем подобрать конфигурацию под ваш бюджет.

Пилот (START): 7-10 рабочих дней. Быстрый запуск на одном канале данных для проверки гипотезы.

Полная интеграция (OPTIMUM): 2-3 недели. Подключение CRM + документооборота, развёртывание основных моделей.

Корпоративный (ENTERPRISE): 1-2 месяца. Глубокий аудит, интеграция ERP, кастомные RPA-конвейеры, кластер из нескольких GPU.

Точный срок зависит от количества и сложности источников данных. На этапе аудита даём детальный план-график.

Часто задаваемые вопросы о локальном ИИ

Общие вопросы

Технические вопросы

Безопасность и соответствие законодательству

Стоимость и сроки

Остались вопросы?

Из блога

Внедрение ИИ в бизнес: дорожная карта 2026

Как посчитать ROI от внедрения ИИ: методика и калькулятор

Как выбрать языковую модель: Qwen, Llama или DeepSeek

Остались вопросы?

Заявка принята!