Conversar com modelos de IA locais

Por que modelos de IA locais?

Trabalhar localmente com modelos de IA oferece vantagens importantes:

Inherently seguro - Seus dados permanecem no seu próprio computador e nunca são enviados para servidores externos
Sem custos adicionais - Modelos locais não possuem custos de API por uso
Privacidade garantida - Ideal para documentos e informações sensíveis

Por que Ollama?

Ollama é uma ferramenta que permite rodar modelos de IA localmente com facilidade. Ele é instalado separadamente em cada computador, o que não impõe restrições de número de usuários — sem necessidade de servidor compartilhado.

Instalando o Ollama

Acesse a página de download do Ollama
Baixe a versão para o seu sistema operacional (Windows, macOS ou Linux)
Instale o Ollama seguindo o instalador
Após a instalação, o Ollama roda automaticamente em segundo plano

Instalar um modelo de linguagem

Após instalar o Ollama, você deve baixar pelo menos um modelo de linguagem:

Abra a interface do Ollama (via o ícone da bandeja do sistema ou terminal)
Baixe um modelo de linguagem à sua escolha

Modelo recomendado

Prefira um modelo que tenha capacidades de tool e vision:

Tool capabilities - O modelo pode usar todas as ferramentas disponíveis na aplicação, como busca na internet e geração de imagens
Vision capabilities - O modelo pode analisar e descrever imagens

Modelo recomendado

qwen3-vl:4b oferece um bom equilíbrio entre velocidade e capacidades de tool/vision. Instale este modelo via terminal:

ollama pull qwen3-vl:4b

Escolha de Modelo com base no hardware

O desempenho de um modelo depende fortemente do hardware do seu computador:

Hardware	Recomendação
Limitado (8GB RAM, sem GPU)	Opte por modelos menores (1-4B parâmetros)
Médio (16GB RAM, GPU básica)	Modelos até 7B parâmetros
Potente (32GB+ RAM, GPU moderna)	Modelos maiores podem ser usados (13B+)

Velocidade vs. qualidade

Um modelo menor geralmente oferece melhor velocidade, mas pode fornecer respostas menos precisas. Experimente para encontrar o melhor equilíbrio para a sua situação.

Configuração na aplicação de desktop

Assim que o Ollama estiver rodando com um modelo instalado, a aplicação de desktop detecta isso automaticamente. Você pode então selecionar o modelo local no chat como alternativa aos modelos em nuvem.

Modelos disponíveis com suporte a tool/vision

Veja a lista completa em ollama.com/library. Filtre por modelos com:

tag Tools para capabilities de ferramenta
tag Vision para reconhecimento de imagens

Opções populares:

qwen3-vl:4b - Compacto, rápido, tool + vision
llama3.2-vision - capabilities de visão
mistral - Rápidas tarefas gerais

Por que modelos de IA locais?​

Por que Ollama?​

Instalando o Ollama​

Instalar um modelo de linguagem​

Modelo recomendado​

Escolha de Modelo com base no hardware​

Configuração na aplicação de desktop​

Modelos disponíveis com suporte a tool/vision​

Por que modelos de IA locais?

Por que Ollama?

Instalando o Ollama

Instalar um modelo de linguagem

Modelo recomendado

Escolha de Modelo com base no hardware

Configuração na aplicação de desktop

Modelos disponíveis com suporte a tool/vision