Construir IA es fácil. Sostenerla no
Antes de la pandemia, las reuniones de proyecto eran algo manejable.
Se coordinaban con tiempo y dependían de la disponibilidad de salas físicas.
Con la virtualidad, todo cambió.
De pronto:
- tenías reuniones simultáneas
- saltabas de Teams a Google Meet
- y además debías documentar acuerdos
Al final del día, lo único que querías era desconectarte.
Pero aún te quedaba lo más pesado: resumir y dar seguimiento.
Ahí fue donde decidí construir algo.
El inicio: una automatización que parecía simple
Soy Project Manager, pero empecé como programadora.
Programo desde niña. Así que no me asustaba meterme a código.
La idea era simple:
👉 procesar audios de reuniones y generar resúmenes automáticamente
Pensé que me tomaría una o dos semanas.
No fue así.
Primer intento: APIs y resultados limitados
Usé:
- Node.js
- APIs de voice-to-text
- motor de Google en su versión gratuita
Procesé audios de 20 minutos.
Funcionaba… pero no era suficiente:
- errores en palabras
- problemas de interpretación
- resultados poco confiables
Ayudaba, pero no resolvía el problema.
El salto: Whisper y Python
A fines de 2022 descubrí Whisper.
Me impresionó su precisión…
pero había un detalle que no vi al inicio:
👉 las pruebas eran con audios cortos
👉 yo necesitaba procesar audios de 1 a 2 horas
Migré a Python.
Intenté procesar audios largos…
y el sistema colapsaba.
La solución técnica… y el inicio del problema real
Después de muchas pruebas encontré una solución:
👉 dividir el audio en segmentos y procesarlos
Funcionó.
Pero apareció otro problema:
👉 Whisper necesitaba GPU
👉 yo no tenía GPU
Ni en mi laptop ni en mi presupuesto.
Infraestructura real: donde todo cambia
Conseguí un servidor HP ProLiant Gen9.
Monté todo desde cero:
- Ubuntu
- Apache
- MySQL
- Python
- PHP
Después de meses de pruebas, errores y noches leyendo foros…
Logré procesar un audio de 1 hora.
Tiempo de procesamiento:
👉 45 minutos
No era perfecto… pero funcionaba.
Y eso, para alguien que construye, es un momento brutal.
El punto de quiebre
Luego armé un GPU server.
El tiempo bajó a:
👉 5 minutos por audio
Todo parecía ir bien.
Hasta que encontré el verdadero límite:
👉 no era multiusuario
👉 no corría procesos simultáneos
👉 solo funcionaba de forma secuencial
Para escalar, necesitaba:
- más infraestructura
- más capacidad de cómputo
- más inversión
Ahí entendí el problema real.
El aprendizaje (lo que nadie te dice sobre IA)
Crear una solución de IA no es lo difícil.
👉 Lo difícil es sostenerla.
Si trabajas on-premise:
- necesitas espacio físico
- mantenimiento
- energía
- operación
Si vas a la nube:
- pagas por consumo
- pagas por procesamiento
- pagas por almacenamiento
En mi caso, en 2022, el costo podía llegar a:
👉 $1500 a $2000 mensuales
Y eso sin siquiera escalar a nivel empresarial.
Lo que veo hoy en el mercado
Muchas empresas están invirtiendo en IA sin tener claro:
- dónde aplicarla
- cuánto cuesta sostenerla
- si realmente genera ROI
El problema no es técnico.
👉 Es de criterio.
Qué haría diferente hoy
ELISA no se convirtió en producto.
Se convirtió en algo más valioso:
👉 un framework propio
Hoy lo uso para:
- analizar soluciones
- evaluar viabilidad
- entender costos reales
Y sobre todo:
👉 tomar mejores decisiones
Cierre
La IA sí funciona.
Pero no es magia.
👉 Funciona cuando sabes dónde usarla, cuánto cuesta y cómo sostenerla.
No hay comentarios:
Publicar un comentario