El perfil del “científico de datos” (data scientist) es una figura muy demandada en el mercado laboral, pero con escasa oferta en ambientes profesionales puesto que debe poseer conocimientos de computación, bases de datos, IA, aprendizaje automático y estadística, entre otros.

Los modelos y técnicas que se encuentran en tendencia en cuanto a Inteligencia Artificial (IA), surgieron hace varias décadas y, apenas, han sufrido variaciones desde su concepción. Por ejemplo, los modelos basados en redes neuronales artificiales, en particular los denominados de Deep Learning (algoritmos que buscan relaciones profundas en datos numéricos, usando estructuras de redes neuronales artificiales y una computación muy intensa), tienen su origen en propuestas presentadas en los años siguientes a la Segunda Guerra Mundial, así lo revela un estudio de OBS Business School.

Básicamente, se le puede considerar la disciplina del ámbito de la computación y los sistemas de información que pretende simular computacionalmente comportamientos humanos que pueden ser considerados como inteligentes. Hay diversas ramas dentro de la IA, como la Visión Artificial o la Robótica, además de la proliferación del almacenamiento y uso de datos de forma masiva.

El informe de OBS, explica que allí entra a jugar un papel relevante la ‘analítica de datos’, la cual se suele enmarcar como una parte esencial de lo que se denomina ‘Inteligencia de Negocio’ (Business Intelligence, BI) y se suele definir como la capacidad de transformar datos en información para ayudar a gestionar una empresa desde los procesos, aplicaciones y prácticas que apoyen la toma de decisiones ejecutivas.

“La BI se suele dividir en dos grandes grupos, la primera es operacional: trata de los informes estándar, descripciones de los datos (información), funciones al nivel operacional con los trabajadores, clientes, usuarios y socios. La segunda está enfocada en la analítica, táctica y Estratégica, donde se pretende dar soporte a los ejecutivos y a los gestores en niveles tácticos que contribuyen a la estrategia global de la empresa o institución. Suele contemplar análisis estadístico, modelos predictivos y de extrapolación, pronósticos y optimización”, informó José Ángel Olivas Varela, Profesor y Colaborador de OBS Business School.

Algunas aplicaciones a la medicina y otros ámbitos

Como se ha visto, los Sistemas de Ayuda a la Decisión (Decision Support Systems DSS) son herramientas computacionales que proporcionan consejos para la mejora en la toma de decisiones. Hay una gran cantidad de aplicaciones de este tipo de sistemas. Si se centraran en sistemas de medicina, se puede citar algunos ejemplos. El primero tiene que ver con el concepto de “enfermedades borrosas”, implantado en un sistema para diagnosticar y tratar fibromialgia, que obtuvo el premio al mejor trabajo en el congreso de la Asociación Española para la Inteligencia Artificial en 2015.

En ese trabajo se propone el uso del concepto de “prototipo deformable borroso” para caracterizar enfermedades que pueden ser confundidas o que incluso no están perfectamente caracterizadas o asumidas por toda la comunidad médica.

En el segundo ejemplo se muestra el diseño de un sistema de ayuda a la decisión en oncología a partir de la detección, clasificación y uso de las expresiones causales y condicionales en textos médicos, en este caso de la Mayo Clinic y del Mount Sinai Hospital. Todo eso, es parte de un programa que permite identificar causales y condicionales en documentos de texto y que las clasifica entre 20 tipos posibles de las tres estructuras condicionales básicas del idioma inglés (first, second, y third), así como entre otro tipo de estructuras del estilo de “due to” o “causes”. Una vez identificadas y clasificadas estas oraciones caudales, se genera de forma automática el grafo causal, que puede ser de ayuda en la toma de decisiones, tanto en el diagnóstico como en el tratamiento, al igual que en la explicación o en cualquier otro tipo de conocimientos relacionados.

Al igual, se han propuesto y diseñado aplicaciones a otros diversos campos basadas en modelos sofisticados de IA:

  • Prevención de incendios forestales: A partir de “ciclos de incendios” entre periodos de lluvias, el sistema permite aconsejar sobre la optimización de recursos (cantidad, prioridades u horarios), basado en su capacidad de anticiparse al número de incendios esperable en cada zona concreta.
  • Ingeniería del software y sistemas de información: Se elaboró para el tratamiento de datos sobre diversos elementos y factores considerados en metodologías y ciclos de vida de desarrollo de software, como por ejemplo la “comunicación entre equipos” o la “dificultad de la tarea”, tareas complejas de estimar de forma precisa.
  • Control de tráfico: Descubriendo y estableciendo patrones de los flujos de tráfico a partir de los datos que se disponen, regula la sincronización de los semáforos de una determinada zona.

El ‘científico de datos’, la profesión más demandada en IA

“En la actualidad “científico de datos” (data scientist) es una figura muy demandada, pero con escasa oferta en ambientes profesionales puesto que debe poseer conocimientos de computación, bases de datos, IA, aprendizaje automático, estadística, visualización, reconocimiento de patrones, sociología, psicología, KDD y Minería de Dato. Además, debe ser capaz de seleccionar y guiar las herramientas y técnicas más adecuadas para cada problema y objetivos concretos. Evidentemente, hoy en día no es fácil encontrar profesionales con un perfil tan completo”, reveló el profesor de OBS.

Para cerrar, expresó que la necesidad de un análisis inteligente de datos en todas las empresas y entidades provoca la demanda de diversos profesionales de múltiples ámbitos. En particular, son especialmente requeridos titulados en matemáticas y estadística, por su capacidad para entender los rudimentos formales de la mayoría de los algoritmos de aprendizaje automático y poder diseñar y modificar algoritmos de este tipo. Sin embargo, resulta claro que los directores de proyectos de esta naturaleza deben tener una formación más amplia, incluso más allá de la ciencia de datos.