Voy a empezar con algunas preguntas que considero importantes no sólo para el ámbito laboral, de hecho, se las hago a mis hijos o a personas no tan cercanas a IT.
Cuando ves contenidos en redes sociales, internet o que te llega en algún grupo de whatsapp ¿Te preguntás o sabés de dónde proviene ese dato? ¿Estás seguro de la validez o precisión de esa información? ¿Está chequeada la fuente?
Otra pregunta: ¿Sabés por qué te aparecen en tu celular, redes sociales, app de música o en el buscador ciertas publicidades, posteos, artículos o datos relacionados a temas de tu interés o relativos a tus actividades?
Y podría seguir con otras relativas a: quién entrenó - y con qué datos - los modelos que estás consultando….
En las tendencias de este año queda claro que los focos de “preocupación y ocupación” de la arquitectura empresarial (con énfasis en la arquitectura de datos), más que quedar como algo ya resuelto e incorporado en la estrategia de cada organización y en las habilidades de las personas, siguen siendo el gran desafío.
¿Por qué? Porque la calidad del input - lo que podía verse como “un issue” para un proceso, sistema transaccional o para el Business Intelligence - con la masividad en el uso de la IA, hoy se vuelve “el issue” por ser exponencial su impacto (rapidez y alcance).
Entonces,
el desafío sigue siendo garantizar los datos (la materia prima) con la que todos estos modelos trabajan. Que sean los correctos.
Pensemos también, que los mismos datos generados por esos modelos, pueden ser input para nuestros transaccionales o aplicaciones analíticas. Es decir, a las fuentes de datos del BI se le estarán sumando los datos resultantes de la IA generativa…
“Para 2025 los expertos predicen que hasta el 90% del contenido online se generará mediante IA”
Fuente: Webinar Qlik donde menciona esta frase de Nina Schick interview with Yahoo Finance Live, January 7, 2023
La clave está en esta frase: “
de Big Data a Better Data”.
¿Cómo lograrlo?
Según las tendencias 2024 de Qlik, a las características ya conocidas del Big Data (Volumen, Velocidad y Variedad) se les deben sumar:
- Validez:
- El origen de los datos importa
- La proliferación de desarrolladores sin experiencia exige conocimientos de IA
- Fusión de la ingeniería de datos, la analítica y la ciencia de datos
- Valor:
- Datos como producto que se puedan rastrear
- Automatización e IA crean un círculo virtuoso
- La IA personalizada se vuelve fundamental para el negocio
Este año Qlik identificó diez tendencias relacionadas con la IA, los datos, la analítica y la automatización que ayudarán a las organizaciones con un RoadMap para garantizar que todos los datos sean fiables y tengan valor en la economía de la IA.
A continuación, copio un extracto de las tendencias tomada de la siguiente publicación de Qlik:
https://www.qlik.com/us/bi/data-trends
- Hybrid AI bridges the maturity gap
Whether ML or augmentations, it’s time to put traditional AI into production and scale, especially in well-established use cases like fraud analytics and churn analysis.
- Generative AI for insights: Supercharging the data consumer experience
This user base appreciates auto-generated visualizations and insights, enhanced with explanations in natural language
- The age of unstructured data is now
By using knowledge graphs and vector databases, complemented by RAG (Retrieval, Augmentation, Generation), the opportunities for combining structured and unstructured data in a trusted way are endless.
- From BI to AI and back again, business analysis is changing
We'll toggle between these two different modes — enabled by embeddability, connectivity, and APIs — to get maximum benefits from each platform.
- Data origin matters: Understanding your data’s DNA
We need a mechanism to clearly label and signpost data, using techniques of provenance and cryptography alongside techniques we haven’t yet invented to create the equivalent of a "DNA test for your data".
- The rise of novice developers demands AI literacy
With an explosion of apps built by the ‘everyday developer,’ organizations must take steps to educate their workforce in the benefits and pitfalls of generative AI.
- Data engineering, analytics, and data science are merging
This will empower business analysts, for example, who can now go back earlier in the pipeline to do data management and preparation tasks. That same analyst can also apply advanced statistical models to the data and tools they work with every day, without needing to export it to an advanced workbench.
- Automation and AI create a virtuous cycle
So far, LLMs and generative AI have mainly been used to support reasoning and conduct analysis, rather than for iPaaS and actioning. Now, there are several exciting efforts underway to support the latter, including an approach to LLMs that involves synergizing reasoning and action.
- Last-mile AI customization becomes critical for business
Your proprietary organizational data will be a valuable raw material here and “solution fabrics” will emerge where domain-specific data and apps can be shared and traded.
- Data as a product that can be traded
The concept of treating data as a valuable asset or product means it can be surfaced in a catalogue, used for various purposes internally, and even evolve into a tradable good. Like with music’s rise of streaming platforms, creators of quality data products must have more exchanges on which to trade them.
Cada tendencia es para analizarla en detalle y definir cómo impacta en tu estrategia de IT y analítica.
Como conclusión, me quedo con algunos dilemas a resolver mencionados por Qlik y los focos de ocupación de la arquitectura empresarial que hacía mención al principio, puestos en valor nuevamente como parte de las tendencias 2024:
Para ver la webinar con la charla completa de Dan Sommer (Senior Director, Market Intelligence Lead) te dejo el link: "Bridging the Trust Gap in Generative AI: The Big to Better Data Imperative."
Nota: “IA generativa” porque genera contenido y lo hace adaptándose a los cambios en los datos de entrada
(*) Los datos sintéticos son aquellos que no son generados por personas, sino por algoritmos.