Microcontroller circuit transmitting data to a digital cloud network representation

Del sketch al escritorio. Cierro el círculo

A lo largo de la semana os he mostrado cómo una idea en un simple boceto a mano alzada se convertía en una arquitectura real, donde Make orquestaba a tres agentes de IA (Investigador, Redactor y Director de Arte). Pero el verdadero reto estaba es hacer que la nube impactará en el mundo real, y ese es el paso que hoy os muestro.

Pero antes os dejo la referencia a los post anteriores relacionados:

Llegando al mundo físico 🔩🎛️

Para este final, he sacado a la IA de la pantalla y la he traído a mi escritorio. ¿Cómo? Construyendo un puente en tres pasos:

1️⃣ El Túnel (Ngrok)

El disparador en Make (orquestador): Al ejecutar el flujo, los módulos HTTP de Make envían un pequeño paquete de datos (formato JSON con {«encender»: true}). Make busca la dirección pública que hemos configurado en Ngrok y lanza el paquete a la red usando el protocolo estándar de internet (HTTP).

La nube necesita encontrar mi ordenador de forma segura. Ngrok crea ese túnel directo hacia un script local en mi equipo, esperando en el puerto establecido. 

Nuestra red local (el router de tu casa) está diseñada para bloquear peticiones externas por seguridad. Aquí es donde entra Ngrok. Al ejecutarlo en el terminal, Ngrok crea un «túnel» seguro desde mi Mac hacia el exterior. Cuando el paquete de Make llega a los servidores globales de Ngrok, este simplemente lo pasa por ese túnel, atravesando tu cortafuegos sin problemas, y lo entrega directamente en el puerto designado de mi ordenador.

De la Nube al Arduino
De la Nube al Arduino

2️⃣ El Puente físico 🔗

El servidor Node.js (escuchador): El script server.js está escuchando pacientemente en el puerto designado. Al recibir el paquete web, lo abre, y lee la orden de encendido. Make habla el idioma de la web (JSON/HTTP), pero la placa de Arduino habla el idioma eléctrico (0 y 1). Node.js actúa de traductor: toma la orden de la web y la convierte en un simple carácter de texto: el número ‘1’.

Cuando Make va realizando su trabajo, va lanzando los mensajes a ese script. Instantáneamente, la señal viaja por el conector micro-USB de mi Mac directo a la placa Arduino. 

3️⃣ El Mundo real 🎛️

Node.js envía carácteres ‘1’ a través de la salida serie del Mac, viajando por el cable físico Micro USB B directamente hacia la placa y hacia los pines indicados. El código en C++ que tengo preparado en el Arduino, que está en un bucle infinito escuchando el puerto serie, detecta los carácteres ‘1’. Al leerlos, ejecuta las instrucciones electrónicas: aplicar voltaje al Pin correspondiente, completando el circuito y encendiendo el LED que se le indique.

Nota: La IA gracias a su capacidad multimodal ayuda a identificar componentes, a determinar el valor de las resistencias (en mi caso con el daltonismo es una gozada) indicándonos con una foto su valor, se acabo buscar en las tablas.

Componentes
Componentes

La protoboard toma el control. Los LEDs del proceso van anunciando los pasos, la IA finaliza su redacción y, con un pitido del zumbador y todos los LEDs al mismo tiempo, el sistema me avisa físicamente de que tengo los dos correos listos para publicar.

La parte física: maqueta
La parte física: maqueta

Seguidamente os muestro mi bandeja de entrada tras enviar un mensaje con un tema a la dirección de correo de mi agente. Por cierto, he dejado parado el flujo en Make, ya que si recibiera un mensaje el flujo actuaría generando los correos y remitiéndolos al correo de origen, eso si yo me enteraría de la ejecución gracias a mi Arduino.

Resultado de una llamada
Resultado de una llamada

⭐️ Conclusión ⭐️

El Visual Thinking no es solo dibujar, es trazar el camino más limpio entre una idea y su ejecución.

En el vídeo os muestro como el flujo se completa en apenas un minuto: envío el correo de inicio, la IA procesa y las luces de mi mesa me avisan del éxito, y ya he recibido los correos con lo necesario para mi publicación. Es un vídeo sin demasiada edición, tan solo algunos cortes para encajar el audio, vamos nada espectacular. 

La tecnología es compleja, pero cuando la hacemos visual y tangible, se vuelve magia. Deja tus comentarios y si quieres más detalles indícame lo que necesites que te amplíe.👇

#VisualThinking #IA #Ngrok #Arduino #Automatizacion 

3D isometric data pipeline showing user request, data ingestion, validation, core processing, machine learning, data storage, real-time analytics, and user dashboard.

Del Sketch al escritorio: Píldora 3 – El Cerebro (Los Agentes)

Este post es continuación del post del Sketch al escritorio

En la Píldora 2 os presente al disparador de la Integración y hoy veremos “El cerebro”

🧠 El cerebro – Los Agentes

Siguiendo con la arquitectura del sistema que os presentaba, hoy entramos en el núcleo de la máquina. El correo ya ha entrado a través del WebHook en Make. ¿Y ahora qué?

Primero voy a pensar, ¿Cómo quiero que funcionen los agentes? ¿Qué esquema de agentes que necesito montar?, para dar respuesta a estas preguntas, como Visual Thinker, lo que utilizaré será un sketchnote del flujo…

Píldora 3: El cerebro
Píldora 3: El cerebro

Cuando ya lo tengo claro, voy a pasar a la acción. Utilizaré a Make como el director de orquesta para ir llamando consecutivamente a los tres agentes de Inteligencia Artificial que trabajaran en cadena:

1️⃣ El Investigador: Toma el tema y los detalles del correo, busca el contexto y estructura los datos en bruto. En un caso real ajustaríamos el modelo de IA a utilizar dependiendo de la calidad de las respuestas y del coste de los Tokens, ya que necesitaremos disponer de una cuenta de pago para usar la correspondiente API.

2️⃣ El Redactor: Coge esa investigación y la transforma en un post articulado, con el tono correcto para el blog. Ajustamos al modelo de IA más adecuado.

3️⃣ El Director de Arte: Analiza el texto final y diseña un prompt súper detallado para que yo pueda generar el sketchnote que lo acompañará. Ajustamos al modelo de IA más adecuado.

Listo, veamos como quedaría en Make usando tres modelos de IA de laboratorios diferentes…

Make - El cerebro tres modelos
Make – El cerebro tres modelos

Para mi caso de uso utilizaré únicamente Anthropic, así solo pago tokens en una de las plataformas, aunque en cada uno de los agentes utilizaré el modelo más eficiente en función de la tarea.

El cerebro - Solo con Anthropic
El cerebro – Solo con Anthropic

Todo esto estará orquestado visualmente dentro del mismo lienzo de Make y la información fluirá de un módulo de IA a otro, transformando una petición cruda de unas pocas líneas en dos correos de salida listos para publicar: uno con el texto y otro con las directrices visuales.

Mañana os presentaré el salto más arriesgado: sacar esta información de la nube y traerla al mundo físico. 

Conectaremos con mi escritorio. 🔌👇

#AgentesIA #Make #InteligenciaArtificial #ArquitecturaVisual

Colorful digital network diagram showing tasks, workflows, processes, and results interconnected with glowing lines and nodes

Del Sketch al escritorio: Píldora 2 – El Mapa y el primer paso: el Disparador

Este post es la continuación del post del Sketch al escritorio , si lo lees completo entenderás en que consiste la integración. En cualquier caso, 📅  ayer os enseñaba el boceto a mano alzada del caso de uso de un proyecto de integración que voy a desarrollar a lo largo de una semana completa.

Caso de Uso : IA
Caso de Uso : IA

Hoy paso del sketch a la pantalla 🖥️ y además abordare el primer reto técnico que se presenta ¿Cómo iniciar el proceso sin fricción?

Del sketch📝 a la pantalla 🖥️

Partiendo de la idea del Sketch presentado en el post anterior, he utilizado Gemini 3.1 PRO con un Prompt Multimodal en el que incorporo los siguientes elementos:

  • La imagen del sketch inicial.
  • El máximo contexto posible añadiendo un buen número de detalles. 
  • El stack de tecnologías que me gustaría utilizar:
    • Gmail para interactuar.
    • Make para integrar y orquestar las piezas.
    • Node.js para el servidor local
    • El IDE de Arduino para la integración física, vía la conexión por puerto serie.
  • Indicaciones de que me haga todas las preguntas necesarias, sobretodo en caso de ambigüedad, pero que tenga claramente definido el sistema.
  • Solicito explicitamente que me entregue un plan de implementación.

En un segundo Prompt añado la herramienta de “Crear Imagen” y añado más especificaciones de como me gustaría ver ahora el esquema, y le pido el esquema refinado con el siguiente resultado:

El esquema potenciado con IA
El esquema potenciado con IA

A partir de este esquema comienzo a trabajar en la implementación, y me enfrento al primer problema…

El primer reto 📱¿Cómo iniciar el proceso?

✉️ La respuesta es simple: un correo electrónico. En este sistema, un simple email actuará como el «disparador«. 

Para capturarlo, quiero utilizar Make, pero ahí es donde está el primer problema, ¿Cómo hago que Make este escuchando a Gmail para que nada más llegar el correo se dispare el flujo?

Gmail no me da esa funcionalidad, no lo permite por seguridad … ¿? … preguntemos a la IA🤖: La respuesta prácticamente automática es usar Make configurando un WebHook.

Make se quedará «escuchando» en la sombra, y en cuanto entra el correo con el asunto y las instrucciones clave, extrae el texto y da el pistoletazo de salida al resto del circuito. Lo increíble de configurar esto en Make es que el entorno de desarrollo es puramente visual. Construyes la lógica arrastrando módulos. Lo único que nos queda es vincular el correo de Gmail que quiero utilizar como receptor de las peticiones, y realizar la configuración de reenvío de correo automática al WebHook de Make.

El primer reto
El primer reto

En resumen, primer problema resuelto… Ahora puedo enviar un correo a la dirección de correo Gmail de mi Agente y llega sin problemas a Make que lo captura al instante.

Mañana os presento al «equipo» que toma el relevo una vez que Make recibe ese correo. 🤖👇 y que serán mis agentes en Claude de Anthropic

#Make #WebHooks #Automatizacion 

Caso de Uso : IA

Del sketch al escritorio: Cómo la IA te ayuda a dar vida a tus ideas

Sé sincero ✋. ¿Cuántas veces has esbozado la solución perfecta a un problema en una libreta, en un post-it, o en la mítica servilleta de cafetería… y luego la has abandonado por la pura pereza de «pasarla a limpio»?

Como profesionales atrapados en la cultura de la prisa y la burocracia, sabemos que nuestro cerebro va a mil por hora, pero nuestras herramientas digitales a veces nos frenan. Los que defendemos el Visual Thinking tenemos claro que la magia, la verdadera arquitectura de un sistema, nace en el caos de los trazos de nuestros esquemas iniciales.

El problema es la fricción. El esfuerzo de sentarse frente a la pantalla a arrastrar cajas y alinear flechas no aporta valor y en términos Lean, es puro muda (desperdicio).

Pero con la IA y sobre todo con la multimodal las reglas del juego han cambiado completamente.

🪄 La magia de la IA multimodal: La IA puede «ver» y “escuchar”

La Inteligencia Artificial supera ampliamente la barrera del texto. Ahora comprende el espacio, interpreta el caos de nuestras líneas y entiende la lógica detrás de nuestros sketches.

Para demostrar que esto no es teoría de manual, esta semana voy a construir en vivo un caso de uso real. Vamos a ir desde un sketch inicial hasta llegar incluso a la electrónica física utilizando iterativamente tres herramientas:

1. La captura del caos. El uso de bocetos e ideas. 

Caso de Uso : IA
Caso de Uso : IA

Todo empieza donde siempre: en un sketch, ya sea en papel o en nuestro iPad. Sin filtros, sin mucho más software. Solo con la idea cruda.

2. El Prompt visual. El análisis de la realidad.

Subimos una imagen a la IA. No le pedimos que «transcriba», le pedimos que comprenda. La IA infiere las conexiones, organiza flujos, nos devuelve estructuras técnicas listas para ser desarrolladas. Adiós al muda, resultados prácticamente directos. 

3. La ejecución. Implementación de software y hardware asistida.

A partir de esquemas, vamos a orquestar diferentes ecosistemas con diferentes herramientas que conectaran mundos diferentes. En el caso de uso que os mostraré encontraremos los siguientes:

  • Un Webhook que capturatrá un correo entrante con instrucciones clave.
  • Una orquestación que utilizará tres agentes de IA: un Investigador, un Redactor y un Director de Arte.
  • Estos agentes procesarán la información y devolverán el trabajo hecho: un post estructurado y el prompt exacto para el sketchnote que lo acompañará.
  • El toque final: A través del puerto serie de mi Mac, el sistema se comunicará con una pequeña placa Arduino que tengo en mi escritorio. Encenderá unos LEDs y emitirá un pitido. El mundo digital avisando al mundo físico de que el trabajo está terminado.

🔩 El caso de uso

El caso de uso es el que mostraba cuando hablaba de la captura del caos. La idea es que desde mi móvil envíe un mensaje a un agente para crear un post para mi blog. Esto desencadenará la llamada a los modelos de IA que necesite y cuando termine el procesamiento el sistema me retornara al correo el resultado. Adicionalmente, durante el proceso utilizaré un Arduino para que me vaya mostrando las fases del proceso vía LEDs y una señal sonora.

A lo largo de los próximos días, voy a abrir el capó de este caso de uso o maqueta. Publicaré píldoras técnicas desgranando cada paso (Webhooks, orquestación, integración de hardware) y terminaremos con un vídeo del sistema en plena acción.

La tecnología solo tiene sentido si nos ahorra tiempo y nos hace la vida más fácil. La IA no se queda atrapada en tu pantalla, te mostraré como enciende unos pequeños e inofensivos LEDs, pero como bien sabes en la actualidad se está utilizando en armas autónomas en conflictos armados reales.

¿Qué proceso real automatizarías tú? Te leo en comentarios 👇.

Stone path through forest with daytime greenery and nighttime glowing sparks

Podcast Episode: Sistemas de Pensamiento Visual

Juan: La hoja en blanco: ese momento en que tu cerebro decide que mirar el techo es más productivo que empezar a dibujar.

Elena: Hoy exploramos cómo el pensamiento visual y la inteligencia artificial pueden convivir sin que una aplaste a la otra, de la mano de jrgsanta en Don’t Give up! Empecemos por los sistemas de pensamiento visual.

Sistemas visuales: IA como acelerador, no como sustituto

Juan: La pregunta central aquí es cuándo la IA deja de ser una herramienta y empieza a ser una muleta. Hay una diferencia importante entre usarla para arrancar y dejar que marque el camino completo.

Elena: El post lo sitúa muy bien desde el principio: «El problema no es la falta de información, es el exceso y la necesidad instintiva y dolorosa de nuestro cerebro intentando evitar la incomodidad de no tener una respuesta inmediata.»

Juan: O sea, el bloqueo no es ignorancia, es sobrecarga. Y la IA puede ayudar a descomprimirla, pero solo si sabes exactamente para qué la estás usando.

Elena: Exacto. El post aplica la teoría de los dos sistemas de Kahneman al trabajo visual. El Sistema 1 es rápido e intuitivo; la IA encaja ahí perfectamente. Propone tres usos concretos: extraer los conceptos clave de un documento técnico largo, generar metáforas del mundo real para ideas abstractas, y pedir a la IA que describa qué elementos visuales colocaría en cada zona de la hoja antes de dibujar nada.

Juan: Tres formas de romper el hielo sin que el hielo te rompa a ti.

Elena: Pero el post es claro sobre el límite de ese enfoque: el resultado es, en sus palabras, «estadísticamente promedio». Útil, correcto, pero no brillante.

Juan: Y ahí llega la advertencia que realmente importa: si siempre dejas que el algoritmo dé el primer paso, el músculo del pensamiento propio se atrofia. Pasas de creador a corrector de ideas ajenas.

Elena: Por eso el post defiende el Sistema 2, el pensamiento lento. Garabatos, borrones, conexiones que no aparecen en ninguna documentación pero que tú sabes que funcionan. Ese destello, dice el texto, «es el resultado de la fricción de tu cerebro luchando contra la hoja en blanco.»

Juan: La fricción como característica, no como fallo del proceso.

Elena: La conclusión es equilibrio con intención: usa la IA para derribar el muro inicial, pero oblígate, de vez en cuando, a mirar la hoja en silencio antes de consultar al oráculo digital. El valor humano está en seleccionar, conectar y darle alma al resultado.

Juan: Y la próxima vez que el pensamiento visual encuentre a la inteligencia artificial, ya sabremos quién debe llevar el rotulador.


Elena: La incomodidad de la hoja en blanco como herramienta competitiva. Es una forma de ver el bloqueo que cambia bastante la relación con el proceso creativo.

Juan: Hasta la próxima, donde seguramente habrá más hojas en blanco esperando ser apropiadas.