Ollama + n8n: запускаем локальный LLM без интернета и подписок

Введение

Использование облачных нейросетей (ChatGPT, Claude, Gemini) в автоматизации n8n открывает безграничные возможности. Но у этого подхода есть три фатальных недостатка: цена (за каждый токен нужно платить), зависимость от интернета (пропала связь — встали все бизнес-процессы) и самое главное — угроза утечки данных. Коммерческая тайна, персональные данные клиентов или исходный код вашей компании не должны уходить на серверы корпораций в США.

К счастью, революция open-source ИИ подарила нам выход. Сегодня мы разберем утилиту Ollama — инструмент, который позволяет запустить мощные языковые модели (такие как Llama 3 или DeepSeek R1) прямо на вашем собственном сервере или даже ноутбуке. В связке с n8n это дает вам полностью автономного, бесплатного и абсолютно приватного ИИ-агента.

Что такое Ollama и почему она произвела фурор?

До появления Ollama запуск локальной нейросети был задачей для суровых Data Science инженеров. Нужно было устанавливать Python, ставить кучу библиотек (PyTorch, Cuda), качать "сырые" веса моделей с HuggingFace (по 40-50 ГБ) и пытаться их запустить через терминал с огромным расходом оперативной памяти.

Ollama изменила всё. Она работает по принципу Docker, но для нейросетей. Вы устанавливаете легковесную программу, открываете терминал и пишете одну команду:

ollama run llama3.2

Всё! Программа сама скачивает нужную версию модели (часто уже квантованную/сжатую, чтобы влезть в 4-8 ГБ оперативной памяти), поднимает локальный API-сервер (по умолчанию на порту 11434) и открывает чат. Теперь к этому серверу можно подключать что угодно, включая n8n.

Системные требования: Потянет ли мой сервер?

Это самый частый вопрос. Нет, вам не обязательно покупать сервер за $5000 с топовой видеокартой Nvidia H100. Ollama отлично работает даже на CPU (хоть и медленнее) и поддерживает Apple Silicon (M1/M2/M3), выдавая там феноменальную скорость благодаря объединенной памяти.

Для легких задач (классификация текстов, вытаскивание сущностей из логов): Подойдет модель llama3.2:1b или qwen2.5:0.5b. Они требуют всего 2-3 ГБ ОЗУ и отлично работают на обычных VPS (даже на тарифах за 500 рублей/месяц).
Для средних задач (написание писем, анализ таблиц): Оптимальный выбор — llama3.1:8b или deepseek-r1:8b. Потребуется около 8-10 ГБ ОЗУ (или VRAM, если есть видеокарта).
Для тяжелых задач (кодинг, анализ сложных документов): Модели на 32B или 70B параметров. Здесь уже нужен серьезный выделенный сервер (Dedicated) с 64+ ГБ ОЗУ или двумя видеокартами RTX 3090/4090.

Установка и настройка связки Ollama + n8n

Предположим, у вас есть сервер на Ubuntu, где уже установлен Docker и крутится n8n. Давайте добавим туда Ollama.

Шаг 1: Установка Ollama

Выполните в терминале сервера одну команду (скрипт автоматически определит вашу ОС и наличие видеокарты):

curl -fsSL https://ollama.com/install.sh | sh

Шаг 2: Скачивание модели

Запустите скачивание модели Llama 3.2 (это займет пару минут в зависимости от интернета):

ollama pull llama3.2

Шаг 3: Настройка сетевого доступа (HOST)

По умолчанию Ollama слушает только localhost (127.0.0.1). Если ваш n8n запущен в Docker, для него localhost — это сам контейнер, а не ваш сервер. Поэтому n8n не сможет достучаться до Ollama. Нужно разрешить Ollama принимать запросы извне (или из сети Docker).
Отредактируйте сервис Ollama:

sudo vim /etc/systemd/system/ollama.service

Добавьте в блок [Service] строку Environment="OLLAMA_HOST=0.0.0.0". Затем перезапустите сервис:

sudo systemctl daemon-reload
sudo systemctl restart ollama

Шаг 4: Подключение в n8n

Откройте n8n. Создайте новый Workflow и добавьте ноду Ollama Chat Model (Она доступна в разделе Advanced AI). В настройках Credentials создайте новое подключение к Ollama и укажите базовый URL. Если n8n и Ollama на одном сервере, URL будет выглядеть так: http://172.17.0.1:11434 (172.17.0.1 — это стандартный IP-адрес хоста изнутри Docker-контейнера в Linux).

Далее в ноде выберите скачанную модель (llama3.2) и можете использовать её в любом AI-агенте n8n (Basic LLM Chain, AI Agent и т.д.).

Где это использовать? Три реальных примера

Анализ медицинских/финансовых документов: n8n считывает выписки со счетов клиента, передает локальной Ollama, она формирует сухой отчет и пушит в CRM. Данные клиента физически не покидают периметр вашей компании. Закон о персональных данных соблюден на 100%.
Бесконечный парсинг сайтов: Вам нужно спарсить 500 000 товаров с сайта конкурента и привести названия к единому формату. Использование GPT-4 стоило бы вам $500. Локальная Ollama сделает это бесплатно, пусть и за пару суток.
Автономная система (Работа на Edge-устройствах): Умный дом без интернета. Расписание, свет и камеры обрабатываются на локальном микро-компьютере (типа Raspberry Pi 5) с запущенной `qwen2.5:0.5b` и n8n, управляя устройствами мгновенно.

Заключение

Связка Ollama + n8n — это настоящий "убийца" SaaS-подписок на нейросети для бизнеса. Вы инвестируете один раз в железо (или арендуете недорогой VPS) и получаете свой собственный, безлимитный ИИ-движок, который работает без интернета, не подслушивает ваши разговоры и не запретит вам доступ из-за санкций. За этим подходом — будущее корпоративной безопасности.

Ollama + n8n: запускаем локальный LLM без интернета и подписок

Введение

Что такое Ollama и почему она произвела фурор?

Системные требования: Потянет ли мой сервер?

Установка и настройка связки Ollama + n8n

Шаг 1: Установка Ollama

Шаг 2: Скачивание модели

Шаг 3: Настройка сетевого доступа (HOST)

Шаг 4: Подключение в n8n

Где это использовать? Три реальных примера

Заключение

Полезные материалы по теме

Похожие темы:

Другие категории:

Поиск

Тренды недели

Быстрые разделы

Популярные теги

Аудит процессов за 30 минут