Ciência de Dados e Inteligência Artificial: o binômio fundamental das tecnologias exponenciais
A Ciência de Dados (Data Science) pode ser resumida como o estudo da origem da informação, tendo como ponto inicial a identificação de padrões que vão desde a análise do controle dos processos e o fluxo das informações, até a detecção de oportunidades e vantagens competitivas que aqueles dados podem oferecer. É a partir disso que teremos a representação de como essas informações podem se tornar um recurso valioso na tomada de decisões e na criação de estratégias de negócio no mundo corporativo.
A Ciência de Dados envolve desde a mineração e exploração de grandes quantidades de dados até a produção de algoritmos matemáticos para estreitar pesquisas, obter linhas de tendência e demonstrar possibilidades de variação em função de tempo, sazonalidade e frequência, contando com outras variáveis também. Ela é responsável, ainda, pela análise de dados de diferentes fontes, muitas vezes acumulados em ambientes de Big Data, onde temos informações estruturadas, semi-estruturadas ou não estruturadas.
Para a análise dos dados, ao contrário do que se imagina, a matemática pura ministrada em cursos de engenharia é de grande importância, já que, por meio dela, é possível dominar e empregar modelos matemáticos e estatísticos que serão fundamentais para segregar os dados, criar indicadores e modelos regressivos importantes para a análise preditiva (de tendência), uma vez que estuda-se o comportamento para, só então, derivar a sua evolução ao longo de uma linha de tempo ainda desconhecida, com alta taxa de assertividade.
Um exemplo clássico do uso de modelos estatísticos é a previsão do PIB brasileiro, que parte de um histórico e projeta uma margem de variação e do crescimento econômico. Quanto mais as informações se tornam importantes, maior será o rigor na formação dos modelos regressivos, que podem se basear em modelos auto regressivos, medianos, lineares, logarítmicos, vetoriais, entre outros. Dispomos, atualmente, de ferramentas e linguagens poderosas como Map R (R Studio), Python, Scala, e até mesmo o velho conhecido Excel, que é utilizado em larga escala quando se trata de análise preditiva.
Para ser eficaz, o cientista de dados deve possuir domínio sobre as linguagens acima, bem como ter conhecimentos avançados sobre a linguagem SQL, bancos e mineração de dados e habilidades estatísticas com cálculos matemáticos e estatísticos empregados nos modelos regressivos e progressivos.
A cooperação entre Ciência de Dados e Inteligência Artificial
A Inteligência Artificial se baseia em ciência de dados para o desenvolvimento de aprendizado de máquina, algo que é muito importante aos profissionais da área. Um estudo da Gartner, por exemplo, estima que, até 2020, 40% das tarefas executadas por esses especialistas serão automatizadas.
Menciono esse ponto porque a inteligência artificial como aprendizagem de máquina é capaz de processar grandes quantidades de dados, algo inatingível para um ser humano. Além disso, o aprendizado de máquina aperfeiçoa os modelos por meio de algoritmos preditivos e análise regressiva.
Mas esse não é o fim do cientista de dados, pois a capacidade de discernimento, educação e experiência são inerentes ao ser humano, e não se aplicam a máquinas. Ao contrário disso, o profissional continua evoluindo diariamente em suas fórmulas matemáticas para aproximar cada vez mais as suas previsões à realidade.
O impulsionamento da tecnologias exponenciais, contudo, só é possível graças ao binômio que engloba Ciência de Dados e Inteligência Artificial – conhecido por Big Data Analytics – uma aliança que vem para enriquecer os dois componentes e afirmar que o futuro depende, cada vez mais, de conjunções tecnológicas como essas.
Júlio Bregeiro é Senior Solutions Architect na GFT Brasil
Artigo publicado originalmente em CIO