🚀 Ejército de APIs de IA para SMED Technology

Tu arsenal gratuito de inteligencia artificial para todos tus proyectos

Chatbots | n8n | Código | Análisis | RAG/OCR | Contenido | Asistentes

Verificado a Junio 2026 • Diego White, CEO SMED • Colombia / LATAM

⚙️ Ejército Organizado por Caso de Uso

Para cada frente de SMED, aquí está la API principal, su backup, la opción premium y cómo combinarlas.

🎯 Caso de Uso 🥇 Primaria 🥈 Backup 💎 Premium 🎤 Audio/Voz 🏗️ Arquitectura
🤖 CHATBOTS Cerebras Groq 3.1 8B DeepSeek Groq Whisper Cerebras (tiempo real) → Groq (respaldo) → DeepSeek (VIP)
⚙️ n8n WORKFLOWS OpenRouter Gemini Flash Mistral Groq Whisper OpenRouter (gateway) → ruteo inteligente según nodo
💻 CÓDIGO GitHub Models DeepSeek V3 Mistral Codestral - GitHub (reviews) → DeepSeek (generar) → Codestral (autocompletado)
📊 ANÁLISIS DE DATOS Gemini Flash GitHub Models DeepSeek R1 - Gemini (ingiere) → GitHub (reporte) → DeepSeek (insights)
📄 RAG/DOCUMENTOS Cohere Embed Gemini Flash NVIDIA NIM - Gemini (OCR) → Cohere (embeddings) → Qwen3 (responde)
✍️ CONTENIDO Gemini Flash DeepSeek Qwen3 (NIM) - Gemini (investiga) → DeepSeek (redacta) → GitHub (pule)
🎯 ASISTENTES DeepSeek Gemini Flash GitHub GPT-5 Groq Whisper Gemini (general) → DeepSeek (profundo) → GitHub (VIP)

🎯 Estrategia de Adopción: Qué Crear Primero

🥇 PRIORIDAD ALTA

Crear ya mismo, sin tarjeta, alto valor inmediato:

  1. Google Gemini (AI Studio) → multimodal + búsqueda web
  2. Cerebras → 1M tokens/día chatbots
  3. Groq → 14,400 req/día velocidad
  4. OpenRouter → gateway 28+ modelos
  5. GitHub Models → GPT-5/Claude gratis

🥈 PRIORIDAD MEDIA

Cuando crezca el volumen de uso:

  1. NVIDIA NIM (tel) → Qwen3 + 100+ modelos
  2. Mistral (tel) → 1B tokens/mes batch
  3. DeepSeek → mejor español + pay-as-you-go barato
  4. Cloudflare Workers → edge AI latencia mínima

🥉 ESPECÍFICA

Proyectos puntuales:

  1. Hugging Face → modelos especializados
  2. Cohere → embeddings (NO comercial)
  3. xAI Grok → datos en vivo X/Twitter

📋 Reglas Operativas del Ejército

Una sola cuenta por proveedor Crear varias para evadir límites = violación de ToS y riesgo de suspensión
OpenRouter como orquestador Failover automático entre modelos sin cambiar código
Especializar por tarea No usar el mismo modelo para todo. Asignar según fortaleza
⚠️
Datos sensibles de clientes Usar Groq o NVIDIA NIM (NO entrenan). Evitar Gemini/Mistral free
⚠️
Fallback de pago siempre listo DeepSeek pay-as-you-go es la opción más barata ($0.14/M)
⚠️
Monitorear cuotas en vivo Implementar backoff exponencial para errores 429. Revisar headers x-ratelimit-*
Cohere solo NO comercial Si SMED cobra por un proyecto, no usar su trial
Google: proyectos separados Activar billing = elimina free tier. Mantén uno para free, otro para pago

⚠️ Alertas Críticas a Junio 2026

Gemini Pro → Pago

El 1-abr-2026, los modelos Pro (2.5 Pro, 3.1 Pro) pasaron a SOLO PAGO. Solo Flash y Flash-Lite siguen gratis.

Google recortó cuotas

El 7-dic-2025 redujo límites free 50-80%. Pueden seguir bajando. Usar proyectos separados para pago.

NVIDIA adquirió Groq

Dic-2025 ($20B). GroqCloud sigue activo pero hay riesgo de cambios futuros. Tener fallback listo.

Datos + Entrenamientos

Gemini, Mistral, DeepSeek y xAI pueden usar tus prompts para entrenar en free tier. Groq y NVIDIA NIM NO.

Modelos preview deprecan

Muchos modelos "preview" pueden cambiar/desaparecer sin aviso. Revisar docs oficiales regularmente.

Límites por organización

Los límites de Groq, Google y otros son POR ORGANIZACIÓN, no por key. Múltiples keys = mismo límite.