8:21
youtube.com ha 3 dias SRT AI Coder TODAY

Como eu uso modelos de IA locais no VS Code (gratuitos e sem chave de API)

Desbloqueie o poder da inteligência artificial no seu VS Code com modelos locais gratuitos e sem chave de API.

SelfHosted AI Tecnologia VS Code

Conteudo

TLDR;

Você pode usar modelos de IA locais no VS Code sem chave de API conectando um runner local (ex.: Olama, Llama.cpp, LM Studio) ao editor por meio de uma extensão de local-LLM. Os passos são instalar o VS Code, rodar o runner e baixar o modelo desejado (o vídeo usa Gemma 4 8B), instalar e confiar em uma extensão de local-LLM no VS Code e configurar provedor/modelo e permissões de ferramentas. A necessidade de hardware varia com o modelo — variantes maiores exigem muito mais RAM/CPU/GPU, então escolha uma versão compatível com sua máquina (por exemplo, o autor usou a variante 8B no MacBook M4 Pro com 24 GB).

Resumo

Nick descreve como integrar modelos LLM ao Visual Studio Code para desenvolver um simples gerenciador de tarefas: após reinstalar o VS Code, ajustar tema e cores do editor, ele fecha o painel do Copilot e abre um projeto com um arquivo markdown listando tarefas. Para rodar o Gemma 4 localmente, escolhe o runner Olama e seleciona a variante de 8 bilhões de parâmetros compatível com seu MacBook M4 Pro; baixa o modelo, executa em modo chat para verificar funcionamento e então instala na extensão ‘Continue’ no VS Code para integrar modelos locais. Durante a configuração ajusta permissões das ferramentas, permitindo leitura e criação automática de arquivos e definindo confirmação para comandos no terminal; resolve problemas visuais trocando o tema para Solarized Dark. Com as configurações corretas, envia a primeira tarefa ao modelo, que inicialmente pausa por causa de permissões, mas após confirmação gera o arquivo HTML exibindo a lista de tarefas; repete o processo com a segunda tarefa. O vídeo enfatiza cuidado ao confiar em extensões, a flexibilidade de usar modelos pagos ou locais e mostra todo o passo a passo até o modelo executar ações no editor e aponta recursos e limitações importantes para desenvolvedores interessados no uso cotidiano.