El vibe coding promete que cualquiera puede programar cualquier cosa con Inteligencia Artificial. Algo de verdad hay, y no poco. Pero hay matices que los gurús de YouTube no cuentan, y TREINTA años de experiencia me dan perspectiva suficiente para contártelos.
El otro día mencioné AutoGen en el post de MarkItDown y me di cuenta de que nunca lo había usado. Así que me puse a investigar. Esto es lo que encontré sobre AutoGen, Microsoft Agent Framework y el fork AG2: qué son, para qué sirven, qué opina la gente y cuál deberías usar en 2026.
Una recepcionista de un cliente me encaró: que si no me daba vergüenza quitarles el trabajo. Le expliqué lo que llevo años defendiendo como desarrollador de agentes: yo no le quito el trabajo, le quito trabajo. Carga repetitiva, agendar citas, repetir la misma información cien veces al día. Eso es lo que delego en un agente. Pero el humano sigue siendo imprescindible, porque ni los agentes cubren el 100% de los casos ni la gente quiere hablar siempre con una máquina (yo el primero). Mi visión de cómo implementar Inteligencia Artificial en una empresa no pasa por sustituir a nadie.
Anthropic vuelve a tener problemas. Esta tarde, Claude está dando errores elevados en varios de sus modelos, y lo peor no es la caída en sí, sino que parecía resuelta y ha vuelto a fallar. A las 20:00 (hora peninsular) anunciaron que habían aplicado un fix y estaban monitorizando, pero quince minutos después reconocían que seguían viendo errores en Opus 4.8 y Haiku 4.5. La incidencia afecta a claude.ai, a la API, a Claude Code y a Claude Cowork, justo las herramientas con las que mucha gente trabaja a diario. Te cuento qué se sabe, a qué afecta exactamente y qué puedes hacer mientras dura.
El 9 de junio Anthropic soltó Claude Fable 5 como su modelo más capaz para el público general. El 12 de junio, a las 17:21 hora del Este, el gobierno de Estados Unidos le ordenó apagarlo mediante una directiva de control de exportación. Tres días de vida. El motivo oficial es un supuesto jailbreak del modelo, y Anthropic, que cumple la orden a regañadientes, dice que la técnica solo destapaba vulnerabilidades menores ya conocidas. Te cuento qué ha pasado, por qué un control de exportación termina apagando el modelo para todo el mundo y no solo para extranjeros, y qué significa esto si lo estabas usando.
Claude Cowork es lo nuevo de Anthropic: la potencia de Claude Code, pero para trabajo de oficina y gente que no programa. Organiza archivos, saca datos de facturas, prepara informes y ejecuta tareas programadas en tu ordenador. Te cuento qué es, en qué se diferencia del chat y de Claude Code, y por qué regalo 3 invitaciones a quien las quiera.
El 9 de junio Anthropic soltó Claude Fable 5, su modelo más capaz disponible para todo el mundo, y a la vez presentó Mythos 5, la misma bestia pero sin los frenos de seguridad y solo para un puñado de gente. Te cuento qué son, cuánto cuestan, por qué el detalle del clasificador que devuelve la pelota a Opus 4.8 es lo más interesante de todo, y hasta cuándo lo tienes gratis si pagas Pro, Max o Team. Spoiler: hasta el 22 de junio.
Si programas con Inteligencia Artificial sabes de lo que hablo: le dices que está equivocada, te discute, le pasas captura, y te da la razón. El baile de siempre. En este post te explico el truco que uso para que la Inteligencia Artificial deje de discutirme sin tener que demostrarle todo cada vez: un marcador de quién tiene razón. +1 para el acierto, -1 para el error. Y funciona.
Llevo meses construyendo skills para Claude Code que automatizan partes de mi flujo de trabajo. Ahora las publico en un repo público para que cualquiera pueda usarlas. La primera: save-image, que guarda automáticamente los screenshots que pegas mientras trabajas. Sin nombres de archivo, sin diálogos de exportación, sin interrupciones.
Me llega un proyecto con un requisito que cambia todo: los datos son sensibles y las conversaciones no pueden salir de la infraestructura del cliente. Así fue como acabé comparando en serio Dograh, Retell y VAPI. Precios reales, lo que te cuesta cada opción cuando el volumen crece, y por qué la privacidad es la pregunta que casi nadie hace cuando elige plataforma.
Después de publicar el post de las caídas, me puse a investigar. Lo que encontré no es un fallo de ingeniería: es lo que pasa cuando prometes capacidad que aún no tienes y lanzas seis productos en una semana.
Cuento cómo integré VAPI en marcosramirez.dev para tener un agente de voz en la web, por qué migré a Retell cinco días después, y cómo esa decisión arrastró consigo un cambio de arquitectura completo: de Cloudflare Pages a Cloudflare Workers, pasando por SSR, rutas de API y gestión segura de tokens. La historia de cómo una sola dependencia puede cambiar toda tu infraestructura.
Google acaba de anunciar Gemini 3.5 Flash en el Google I/O 2026. Lo he estado mirando con lupa porque llevo meses usando Gemini 3.0 Flash como modelo base en mis agentes de voz: es barato, rapidísimo y sigue instrucciones como nadie. La pregunta es si 3.5 mejora lo suficiente como para justificar el cambio, o si es uno de esos saltos de versión que solo cambia el número.
Manual completo de OpenCode: instalación, configuración, modelos, agentes, MCP, GitHub integration y casos de uso prácticos. La guía más detallada del agente de coding open-source.
Después de probar Claude Code, Cursor, Aider y otros agentes de Inteligencia Artificial para programación, encontré OpenCode: la mejor alternativa open-source con TUI avanzada. Te cuento por qué se convirtió en mi herramienta principal y cómo se compara con toda la competencia.
El 14 de abril de 2026, Anthropic lanzó las Rutinas en Claude Code en fase de vista previa de investigación. Esta funcionalidad permite configurar una vez un prompt, un repositorio y conectores, y ejecutar la automatización de forma recurrente en la infraestructura en la nube de Anthropic. A diferencia de /loop (limitado a la sesión) y las tareas programadas del Escritorio (que requieren que tu máquina esté encendida), las rutinas funcionan incluso con tu portátil apagado. En este análisis detallo cómo funcionan las tres modalidades de activación (programada, API y eventos de GitHub), los límites diarios según tu plan (5 en Pro, 15 en Max, 25 en Team/Enterprise) y el impacto en el consumo de tokens de la API. Comparo las ventajas frente a las tareas programadas de ChatGPT y explico por qué esta función posiciona a Claude Code como la herramienta líder para desarrolladores que necesitan automatización real en sus flujos de trabajo.
ChatLLM de Abacus.AI es un asistente profesional que te da acceso a más de 100 modelos de Inteligencia Artificial en una sola plataforma. Desde GPT-5.4 hasta Claude Opus 4.6, Gemini 3.1 Pro y Llama 4, todo en un mismo sitio por 10 $ al mes. Incluye generación de imágenes con Nano Banana Pro, vídeo con Sora 2, y DeepAgent para automatizar tareas complejas. Ideal para profesionales y equipos que necesitan acceso a la mejor Inteligencia Artificial sin pagar múltiples suscripciones por separado.
RouteLLM es el router inteligente de ChatLLM que analiza tu consulta y elige automáticamente el mejor modelo de Inteligencia Artificial. Sin pensar, sin cambiar de pestaña, sin pagar de más.
Agent Skills es el formato abierto que permite a cualquier agente de Inteligencia Artificial cargar conocimiento especializado bajo demanda: desde cómo escribir en tu blog hasta cómo cerrar un artículo con el CTA correcto. Un skill es simplemente una carpeta con un fichero SKILL.md, pero la idea detrás es poderosa: separar el conocimiento del agente de la herramienta que lo ejecuta. Adoptado por más de treinta herramientas (incluyendo Claude Code, Cursor, GitHub Copilot y Gemini CLI) está convirtiéndose en el estándar de facto. En este post explico cómo funciona, presento el ecosistema en agentskills.io y el directorio de skills.sh, y cuento cómo llevo meses usándolo en este blog sin saber que tenía nombre. Incluyo ejemplos reales del sistema de skills del blog: desde subskills jerárquicos de copywriting hasta un skill de captación de clientes sin una sola línea de código.
OpenRouter es un gateway unificado con más de 500 modelos de Inteligencia Artificial de docenas de proveedores mediante una sola API key y endpoint. Incluye casi 30 modelos gratuitos ideales para desarrollo, sin tarjeta de crédito. Su sistema de fallback automático cambia de modelo si uno falla, y su compatibilidad con OpenAI permite integrarlo fácilmente en herramientas como OpenCode y OpenClaw.
Guía completa con 13 reglas para reducir el consumo de tokens en Claude Code y cualquier asistente de código con Inteligencia Artificial. Incluye instrucciones detalladas para cada regla que puedes aplicar hoy mismo para ahorrar entre un 40 y un 60 por ciento en tu factura mensual.
Anthropic ha vivido un abril de 2026 para el olvido, con limitación de agentes gratuitos, cambios sin avisar en Claude Code, un nuevo tokenizador que encarece precios un 45% y errores de facturación como el caso Hermes. Repasamos una crisis de confianza que ha sacudido a la comunidad de desarrolladores este mes.
La subida de precios en Inteligencia Artificial beneficia a desarrolladores que usan la tecnología de forma eficiente. Con GitHub Copilot, Anthropic y OpenAI eliminando planes ilimitados, el mercado valora el talento humano que maximiza el rendimiento de cada crédito invertido. Analizamos el impacto de multiplicadores 27x y comparamos costes entre cloud vs hardware local como DGX Spark.
Explico mi transición a OpenClaw para gestionar a Lucía, mi agente de Inteligencia Artificial autónomo. Analizo las ventajas de la soberanía digital ejecutando modelos locales como GLM-5, Qwen 3, DeepSeek y Llama 4 a través de LM Studio y Ollama. Lucía ahora vive en WhatsApp, Discord y Telegram con contexto unificado, ejecuta tareas en segundo plano como redactar posts, gestionar correo, resumir YouTube, escribir código, administrar el Home Lab y monitorear mi conexión a internet. El futuro de la Inteligencia Artificial personal no está en aplicaciones cerradas, sino en sistemas como OpenClaw que te devuelven el control.
NVIDIA ofrece acceso gratuito a modelos de Inteligencia Artificial como DeepSeek V4 y GLM 5.1 mediante API en build.nvidia.com. Solo requiere verificación de teléfono móvil, no tarjeta de crédito. Compatible con librerías OpenAI, ideal para prototipado rápido, pruebas de concepto y desarrollo de agentes con contexto de hasta 1 millón de tokens.
Continúo el análisis técnico sobre agentes de IA, abordando los desafíos de latencia que afectan las conversaciones habladas. El LLM añade 600-1200ms de latencia, el TTS como ElevenLabs unos 600ms, y las herramientas y knowledge bases también suman tiempo. Explico cómo enseñarles a hablar correctamente ya que la plataforma que uses influye en la entonación, la importancia de los GuardRails para evitar alucinaciones y dar información no relevante, la seguridad para no revelar información confidencial incluyendo el prompt, cómo cumplir con el RGPD para dar datos privados a la persona correcta con multas importantes en Europa, y técnicas de debug cuando el agente da respuestas inesperadas.
Analizo con ojo crítico el auge de las agencias de IA, desmitificando la idea de que los agentes son 'inteligentes' por sí solos. Las IAs son imbéciles porque inventan cosas que parecen tener sentido pero no lo tienen. Desarrollar un agente no es 'leerle que haga algo y ya', requiere fundamentos de programación, estructuras de datos, visión de negocio, capacidad de análisis y prompt engineering. Explico los errores comunes que veo en consultorías: reservas a las 3AM porque no se considera el horario laboral, no tener en cuenta que el negocio usa agenda en papel, problemas legales con datos de clientes con multas hasta 600.000€ en Europa por no cumplir con el RGPD, y los costes reales de infraestructura incluyendo LLMs, voces como ElevenLabs, y plataformas como VAPI o Retell. También explico que para desarrollar agentes se necesitan conocimientos de programación, estructuras de datos como JSON, visión de negocio basada en experiencia, capacidad de análisis para prever casuísticas, y prompt engineering usando MarkDown. Detallo ejemplos reales de consultorías donde el agente no habla como debe, dice cosas en inglés, habla muy rápido, se salta números al deletrear, y no cambia de tono. Explico las diferencias entre plataformas como VAPI y Retell, y cómo montar tu propia infraestructura.
Detallo un método práctico para utilizar la Inteligencia Artificial en la planificación de menús semanales equilibrados. Usando ChatGPT versión de pago o gratuita con ajustes, puedes generar menús para dos personas considerando restricciones como diabetes, preferencias por temporada, hidratos de carbono nightly y limitaciones específicas. El proceso incluye dar instrucciones detalladas en formato Markdown con plantilla HTML para generar el menú, y proporcionar un listado organizado de platos por categorías como guisos, legumbres, carnes, pescados, pastas, ensaladas y más. También explico cómo adaptar las instrucciones para la versión gratuita reduciendo la carga cognitiva de la IA.