Ir para o conteúdo principal

Conversar com modelos de IA locais

Por que modelos de IA locais?

Trabalhar localmente com modelos de IA oferece vantagens importantes:

  • Inherently seguro - Seus dados permanecem no seu próprio computador e nunca são enviados para servidores externos
  • Sem custos adicionais - Modelos locais não possuem custos de API por uso
  • Privacidade garantida - Ideal para documentos e informações sensíveis

Por que Ollama?

Ollama é uma ferramenta que permite rodar modelos de IA localmente com facilidade. Ele é instalado separadamente em cada computador, o que não impõe restrições de número de usuários — sem necessidade de servidor compartilhado.

Instalando o Ollama

  1. Acesse a página de download do Ollama
  2. Baixe a versão para o seu sistema operacional (Windows, macOS ou Linux)
  3. Instale o Ollama seguindo o instalador
  4. Após a instalação, o Ollama roda automaticamente em segundo plano

Instalar um modelo de linguagem

Após instalar o Ollama, você deve baixar pelo menos um modelo de linguagem:

  1. Abra a interface do Ollama (via o ícone da bandeja do sistema ou terminal)
  2. Baixe um modelo de linguagem à sua escolha

Modelo recomendado

Prefira um modelo que tenha capacidades de tool e vision:

  • Tool capabilities - O modelo pode usar todas as ferramentas disponíveis na aplicação, como busca na internet e geração de imagens
  • Vision capabilities - O modelo pode analisar e descrever imagens
Modelo recomendado

qwen3-vl:4b oferece um bom equilíbrio entre velocidade e capacidades de tool/vision. Instale este modelo via terminal:

ollama pull qwen3-vl:4b

Escolha de Modelo com base no hardware

O desempenho de um modelo depende fortemente do hardware do seu computador:

HardwareRecomendação
Limitado (8GB RAM, sem GPU)Opte por modelos menores (1-4B parâmetros)
Médio (16GB RAM, GPU básica)Modelos até 7B parâmetros
Potente (32GB+ RAM, GPU moderna)Modelos maiores podem ser usados (13B+)
Velocidade vs. qualidade

Um modelo menor geralmente oferece melhor velocidade, mas pode fornecer respostas menos precisas. Experimente para encontrar o melhor equilíbrio para a sua situação.

Configuração na aplicação de desktop

Assim que o Ollama estiver rodando com um modelo instalado, a aplicação de desktop detecta isso automaticamente. Você pode então selecionar o modelo local no chat como alternativa aos modelos em nuvem.

Modelos disponíveis com suporte a tool/vision

Veja a lista completa em ollama.com/library. Filtre por modelos com:

  • tag Tools para capabilities de ferramenta
  • tag Vision para reconhecimento de imagens

Opções populares:

  • qwen3-vl:4b - Compacto, rápido, tool + vision
  • llama3.2-vision - capabilities de visão
  • mistral - Rápidas tarefas gerais