Desde Sonora, la ciencia de datos se vuelve la base con la que empresas, gobiernos y proyectos tecnológicos empiezan a decidir cómo innovar
Grecia Bojórquez/NORO
En el Departamento de Matemáticas de la Universidad de Sonora, Julio Waissman habla de ciencia de datos sin separarla de la realidad económica y social que lo rodea. Para él, innovar hoy pasa por una idea simple: “Es muy importante tener información y tomar decisiones basadas en la evidencia, Y la evidencia siempre son datos”, dice para NORO.
Desde diagnósticos médicos hasta traductores automáticos, la ciencia de datos se ha vuelto una base silenciosa de la tecnología que se usa todos los días. Waissman recuerda que, con los registros actuales, ya no se depende solo de especialistas aislados.

“Actualmente disponemos de tantos datos […] sobre enfermedades y de tantos registros históricos que ahora podemos hacer modelos basados en esos datos para poder hacer diagnóstico médico”. El conocimiento experto ya no desaparece cuando la persona no está; se traduce en modelos que aprenden de esa experiencia acumulada.
Un cambio en cómo se construyen los modelos de ciencia de datos
La forma de trabajar con esos datos también cambió, ya que durante años, el aprendizaje automático se desarrollaba alrededor de problemas muy específicos. “Se hacían modelos de aprendizaje basados en datos para resolver una tarea particular”, explica Waissman. Cada modelo servía para una cosa y había que construirlo casi desde cero.

Con la llegada de los grandes modelos de lenguaje, el enfoque se movió hacia herramientas más flexibles. El profesor los describe como “modelos generalistasque se entrenaron con una cantidad ingente de datos, que utilizan una cantidad ingente de energía y que necesitan capacidades de cálculo impresionantes, pero que resuelven problemas en forma genérica”.

La misma base puede ayudar a escribir, traducir, programar o analizar información, y eso abre un nuevo ritmo de desarrollo. Waissman considera que“ahora los grandes modelos de lenguaje es la tecnología disruptiva del momento”, comparable a lo que fue internet cuando salió del ámbito académico.
Al mismo tiempo, lanza una advertencia que también funciona como guía para emprendedores: “Hay una tendencia de querer resolver todo con modelos de aprendizaje genéricos como LLM, que es en muchos casos matar moscas a cañonazos”. No todo problema requiere la herramienta más compleja.
Empresas y gobiernos que empiezan a pensar en datos
En el sector privado, esa lógica ya está instalada en las grandes corporaciones. Waissman describe un patrón que se repite: “Todas las empresas grandes ya tienen todas su área de ingeniería de datos, para asegurarse que siempre tienen sus datos, tienen su área de ciencia de datos, pues están tomando decisiones basadas en datos”. Nombra a Bimbo, PepsiCo o FEMSA como ejemplos de compañías donde estos equipos ya forman parte de la operación diaria.

Las empresas medianas y pequeñas también se ven involucradas en este cambio, aunque no siempre con la misma velocidad. El académico lo formula en términos de competencia: “Quien no empiece a tomar decisiones basadas en datos va a empezar a estar en desventaja respecto a su competencia”.
Muchas organizaciones se encuentran todavía en la etapa de inteligencia de negocios, pero desde ahí empiezan a incorporar modelos que predicen consumo, ajustan inventarios o ayudan a entender mejor a sus clientes.

En el ámbito público, Sonora ofrece una muestra de cómo este lenguaje se traslada a la política. El estado cuenta con una agencia de transformación digital y un área dedicada a datos abiertos.
Además, la Universidad de Sonora colabora con el Centro Nacional de Control de Energía (CENACE) en un proyecto para la región: “Hacemos modelos de predicción del consumo de energía eléctrica en la zona noroeste para ayudarles en los procesos de pronóstico […] que ayuda a la operación de la red eléctrica y también a los costos de la compra de energía”. Innovar, en este caso, significa pronosticar mejor un servicio esencial.
Cuando el problema no es la falta de datos
Waissman detecta una confusión frecuente dentro de las organizaciones: “El problema es cuando piensan que el área de manejo de datos es equivalente a una persona que sepa moverle al Excel”. Los datos están, pero sin un proceso claro se convierten en tablas sueltas, no en decisiones informadas.

Para el profesor, la diferencia está en seguir una metodología completa. Habla de equipos que “conozcan todo el proceso, toda la metodología, que sepan desde el almacenamiento, la ingesta, el procesamiento […] y luego poder hacer análisis exploratorios de esos datos, encontrar, hacer hallazgos, y luego poder hacer modelos que ayuden a predecir”.
A eso se suma la capacidad de traducir esos resultados a un lenguaje accesible para quienes deciden presupuestos, prioridades o políticas. Sin esa traducción, el nuevo lenguaje de la innovación se queda en un idioma que pocos hablan.
Sesgos y trabajo en equipo
Convertir la ciencia de datos en base de la innovación también implica hacerse cargo de sus efectos. Los modelos aprenden del mundo tal como ha sido, con sus desigualdades. “Los datos de nuestra sociedad reproducen un montón de sesgos misóginos, clasistas, racistas, que se reproducen”, señala Waissman. Al usarlos para automatizar decisiones laborales, financieras o administrativas, esos sesgos pueden reforzarse sin que nadie los cuestione.
El académico menciona los casos de traductores o sistemas de reclutamiento que terminan asociando ciertos cargos o profesiones a un solo género. Frente a ello, propone dos rutas: limpiar los datos desde el preprocesamiento y recurrir a métodos de explicabilidad para revisar qué factores influyen en las decisiones de un modelo.

Desde su mirada, la inteligencia artificial explicable “permite tratar de explicar cuáles son los principales factores por los que se toma una decisión” y detectar cuándo se están reproduciendo patrones que no se quieren mantener.
En medio de estos retos, Waissman vuelve a la formación y al trabajo colectivo. “La ciencia de datos implica un buen conocimiento teórico, un buen conocimiento técnico y un buen conocimiento de tu negocio”, define el profesor.
Y matiza que ninguna persona lo cubre todo.“Al final de cuentas, esto se hace en grupos de trabajo multidisciplinarios y con gente con muchas habilidades”.
Ese trabajo en equipo es, en buena medida, el lugar donde este nuevo lenguaje de la innovación se vuelve útil para más personas. Cuando conecta a emprendedores, gobiernos, universidades y ciudadanía alrededor de una misma pregunta, qué está pasando en realidad, y de una misma apuesta, la de decidir con evidencia lo que se quiere transformar.










