Tu propia IA en casa.
Sin que nadie la espíe.
Qué es la IA local
y por qué importa
Cuando usas ChatGPT o Gemini, tu texto viaja por internet hasta los servidores de OpenAI o Google, se procesa allí, y la respuesta vuelve a tu pantalla. En ese proceso, la empresa ve lo que escribes, lo puede guardar y lo puede usar para lo que sus términos de servicio digan.
La IA local funciona diferente: el modelo se descarga en tu ordenador y se ejecuta ahí mismo. Ningún dato sale de tu máquina. No hay servidores externos, no hay cuentas que crear, no hay políticas de privacidad que leer con lupa.
La diferencia práctica es enorme. Con IA local puedes pedirle que revise documentos confidenciales de trabajo, contarle cosas personales para pedir consejo, trabajar con datos de clientes o pacientes, o simplemente tener la tranquilidad de que nadie está leyendo tus conversaciones.
La contrapartida es que necesitas un ordenador con suficiente potencia. No hace falta nada extraordinario, pero sí importa el hardware. Y los modelos locales, siendo honestos, no alcanzan el nivel de los mejores modelos en la nube para tareas muy complejas. Para el 80% de los usos cotidianos, sin embargo, son más que suficientes.
¿Mi ordenador
puede con esto?
Funciona, pero lento
- 8 GB de RAM
- CPU moderna (2019 o posterior)
- 10 GB de espacio libre
Experiencia fluida
- 16 GB de RAM o más
- GPU Nvidia con 6 GB VRAM+
- 20 GB de espacio libre
M1 / M2 / M3
- 8 GB RAM unificada (mínimo)
- 16 GB RAM (recomendado)
- 15 GB de espacio libre
Macs antiguos
- 16 GB RAM mínimo
- Solo modelos pequeños
- Más lento que Apple Silicon
Los Mac con chip Apple Silicon son imbatibles para IA local. Su memoria unificada les da una ventaja enorme. Un MacBook Air M2 con 16 GB corre modelos de 7B parámetros de forma fluida y sin ventilador.
Qué herramienta usar:
LM Studio, nuestra recomendación
LM Studio
Interfaz gráfica completa. Descarga modelos, chatea, ajusta parámetros. Lo más parecido a ChatGPT pero en tu ordenador. La opción recomendada para empezar.
Ollama
Más potente y flexible, pero requiere usar la terminal. Ideal si quieres integrarlo con otras herramientas. Con Open WebUI encima tienes interfaz visual.
Jan
Alternativa open source a LM Studio con interfaz gráfica. Menos pulida pero totalmente transparente en su código. Para quien valora el software libre por encima de todo.
Qué modelo elegir:
el cerebro de tu IA
Mistral 7B
El mejor equilibrio entre tamaño y calidad para la mayoría de ordenadores. Excelente en español, rápido y con licencia muy permisiva. El punto de partida ideal.
Llama 3.1 8B
El modelo de Meta. Muy capaz para razonamiento y tareas complejas. Ligeramente más grande que Mistral pero los resultados lo justifican.
Phi-3 Mini
Solo 3.8B parámetros. Corre en ordenadores más modestos y sorprende por su capacidad. Perfecto si tu RAM es limitada.
⚠️ Sobre los tamaños: los modelos vienen en versiones cuantizadas (Q4, Q5, Q8...). A mayor número, más calidad pero más peso y más RAM necesaria. Para empezar, descarga siempre la versión Q4_K_M: buen equilibrio para la mayoría de equipos.
La guía paso a paso:
de cero a chatear en 20 minutos
Descarga LM Studio
Ve a lmstudio.ai y descarga la versión para tu sistema operativo.
Abre LM Studio y ve al buscador de modelos
Al abrirlo verás una pantalla de bienvenida. En el menú de la izquierda, haz clic en el icono de la lupa. Esto te lleva al catálogo de modelos disponibles para descargar.
Busca y descarga Mistral 7B
En el buscador escribe "Mistral". Busca mistral-7b-instruct y selecciona la versión Q4_K_M. Haz clic en Download. Pesa unos 4 GB.
Carga el modelo
Ve a la sección de Chat (icono de bocadillo). En la barra superior, haz clic en el selector de modelo y elige Mistral. LM Studio lo cargará en RAM en unos segundos.
Escribe tu primer mensaje
Ya está. Escribe lo que quieras en el campo de texto y pulsa Enter. La IA responderá directamente desde tu ordenador, sin internet, sin cuentas, sin que nadie lo vea.
💬 Lo que más me sorprendió
La primera vez que le hice una pregunta compleja a Mistral en local y me respondió con coherencia y en español correcto me quedé un rato mirando la pantalla. No porque sea magia — sino porque es exactamente lo mismo que ChatGPT, pero corriendo en mi propio ordenador, sin internet, sin cuenta, sin que nadie en ningún servidor sepa lo que le estoy preguntando.
Para tareas del día a día — resumir un texto, explicar algo, ayudar a escribir un correo — es más que suficiente. Y hay algo psicológicamente diferente en saber que la conversación no sale de tu máquina.
¿Va lento? Es normal la primera vez, especialmente si tu ordenador usa solo la CPU. Si es demasiado lento, prueba con Phi-3 Mini, que es mucho más ligero.
¿No encuentras el modelo? Puedes buscar en Hugging Face (huggingface.co) y descargar el archivo .gguf manualmente. En LM Studio puedes cargar archivos locales desde el menú de modelos.
Para qué sirve
y para qué no
La IA local es muy buena para muchas cosas. Pero ser honesto sobre sus límites es parte del trato.
- Resumir documentos confidenciales — contratos, informes, correos. Pega el texto y pídele que lo resuma. Funciona muy bien sin que el documento salga de tu ordenador.
- Preguntas personales o sensibles — síntomas médicos, situaciones personales, temas que no quieres que queden en servidores externos. Ningún rastro.
- Ayudar a escribir y corregir — correos, textos, traducciones, reformular frases. El español es bueno con Mistral y Llama 3.
- Uso sin internet — funciona perfectamente en un avión, en el campo o con el wifi desactivado.
- Generar código — para proyectos que no quieres compartir con servidores externos.
- Información muy reciente — los modelos tienen una fecha de corte de conocimiento. No saben qué pasó la semana pasada.
- Búsquedas en internet — no puede buscar en la web por sí solo sin configuración adicional.
- Razonamiento muy complejo — para tareas muy avanzadas, los modelos grandes de ChatGPT o Claude siguen ganando. No es magia, es un trueque consciente.
Consejos para
sacarle más partido
El system prompt: dale personalidad a tu IA
LM Studio te permite configurar un "system prompt", un texto que le das a la IA al inicio de cada conversación para definir cómo debe comportarse.
Temperatura y otros parámetros
- Temperature 0.1–0.3: respuestas más precisas. Ideal para tareas técnicas, resúmenes o análisis de documentos.
- Temperature 0.7–0.9: respuestas más creativas. Mejor para escritura, lluvia de ideas o conversación.
- Temperature 1.0+: muy creativa. Para brainstorming, no para respuestas que necesiten ser correctas.
¿Quieres montar todo el sistema?
La IA local es una pieza más. Si quieres proteger también tu correo, tus búsquedas y tus contraseñas, la hoja de ruta de Privut te lleva paso a paso.
Ver la Hoja de Ruta →Preguntas frecuentes
¿Es tan buena la IA local como ChatGPT?
Para tareas del día a día — resumir textos, responder preguntas, ayudar a escribir — la diferencia es pequeña y muchas veces imperceptible. Para razonamiento muy complejo o conocimiento muy actualizado, los modelos grandes de OpenAI o Anthropic siguen siendo superiores. El trueque es claro: menos potencia a cambio de privacidad total y sin coste.
¿Funciona sin conexión a internet?
Sí, completamente. Una vez descargado el modelo, no necesitas internet para nada. Puedes usarlo en un avión, en una zona sin cobertura o con el wifi desactivado. Solo necesitas internet para descargar el modelo la primera vez.
¿Qué modelo es mejor para español?
Mistral 7B tiene muy buen rendimiento en español — es un modelo europeo (empresa francesa) entrenado con mucho texto en idiomas latinos. Llama 3 de Meta también funciona bien. Para modelos más grandes, Mixtral 8x7B es excelente pero requiere más RAM. Empieza con Mistral 7B y sube si lo necesitas.
¿Cuánto espacio ocupa en el disco?
Mistral 7B en versión Q4 ocupa unos 4 GB. Llama 3 8B ocupa unos 5 GB. Si descargas varios modelos para probar, puedes acumular 15-20 GB fácilmente. Puedes borrar los que no uses directamente desde LM Studio.
¿Ralentiza el ordenador mientras se usa?
Sí, mientras genera una respuesta usa bastante CPU o GPU. En ordenadores modernos esto no suele ser un problema — puedes seguir navegando mientras esperas la respuesta. Con LM Studio, cuando cierras el programa el modelo se descarga de la memoria y el ordenador vuelve al rendimiento normal.