Este artigo aborda os tipos e as vantagens da produtização de dados (Data Products) para a maturidade de Data Analytics & AI.

Identificar as melhores oportunidades de produtos de dados exige casar a perspectiva de produto e negócios com a perspectiva de tecnologia e dados. Gerentes de produto, UX Research e líderes de negócios tradicionalmente têm forte intuição e conhecimento de domínio para identificar as principais necessidades não resolvidas do usuário e do negócio. Enquanto isso, cientistas e engenheiros de dados têm um olho clínico para identificar soluções viáveis baseadas em dados e uma forte intuição sobre o que pode ser dimensionado e como.

Os produtos de dados, no sentido de que demandam uma categoria própria, são produtos cujo objetivo principal está centrado nos dados.

A “produção” da ciência de dados é uma jornada que envolve a tradução de insights obtidos de análises exploratórias em modelos escaláveis que podem potencializar produtos de dados. Isso envolve focar na implantação de modelos em sistemas de produção, automatizá-los e dimensioná-los de maneira eficaz. Gerar valor por meio da criação de produtos de ciência de dados ajuda as organizações a escalar a cadeia de valor de dados e análises para atingir uma maturidade significativa do sistema de dados.

Exemplos – Data Product

O Gmail é um produto de dados? Não, o Gmail é um serviço de e-mail cujo objetivo principal é permitir a comunicação escrita assíncrona entre indivíduos. A classificação de nossos e-mails pelo Gmail em Importantes e Não Importantes é, no entanto, um produto de dados. O objetivo principal é classificar e-mails, e isso é centrado no processamento de linguagem natural. 

O Instagram é um produto de dados? Não. Mas grande parte de sua funcionalidade, se considerada como produtos discretos, são produtos de dados, por exemplo: marcação, pesquisa, descoberta

O Google Analytics é um produto de dados? Sim, seu objetivo principal é trazer uma compreensão quantitativa do comportamento online para o usuário. Aqui os dados são centrais para a interação com o usuário e, ao contrário dos outros produtos mencionados até agora, são explícitos em seu uso

Types Of Data Products - triggo.ai
Tipos de Produtos de Dados

Dados brutos

Começando com dados brutos, estamos coletando e disponibilizando os dados como estão (talvez estejamos realizando algumas pequenas etapas de processamento ou limpeza). O usuário pode então optar por usar os dados conforme apropriado, mas a maior parte do trabalho é feita do lado do usuário/analista. 

Dados derivados

Ao fornecer aos usuários dados derivados, estamos fazendo parte do processamento do nosso lado. Poderíamos, no caso de dados de clientes, enriquecer atributos adicionais, como atribuir um segmento de clientes a cada cliente, ou poderíamos adicionar a probabilidade de clicar em um anúncio ou de comprar um produto de uma determinada categoria. 

Algoritmos

Em seguida, temos algoritmos, ou algoritmos como serviço. Recebemos alguns dados, os executamos por meio do algoritmo, seja aprendizado de máquina ou não, e retornamos informações ou insights. Um bom exemplo seria o Google Image, o usuário faz upload de uma foto e recebe um conjunto de imagens iguais ou semelhantes ao upload. Nos bastidores, o produto extrai características, classifica a imagem e a combina com as imagens armazenadas, retornando as mais semelhantes. 

Apoio à decisão

Aqui estamos procurando fornecer informações ao usuário para ajudá-lo na tomada de decisão, mas não estamos tomando a decisão por conta própria. Painéis de análise como Google Analytics, Flurry ou WGSN se enquadram nessa categoria. 

A intenção é fornecer ao usuário informações relevantes em um formato de fácil digestão para permitir que ele tome melhores decisões. No caso do Google Analytics, isso pode significar mudar a estratégia editorial, resolver vazamentos no funil de conversão ou dobrar a estratégia de um determinado produto. O importante a ser lembrado aqui é o seguinte: enquanto tomamos decisões de design na coleta, derivação e na escolha de quais dados exibir e como exibi-los, o usuário ainda tem a tarefa de interpretar os próprios dados. 

Tomada de decisão automatizada

Aqui terceirizamos toda a inteligência dentro de um determinado domínio. As recomendações de produtos da Netflix ou o Discover Weekly do Spotify seriam exemplos comuns. Carros autônomos ou drones automatizados são manifestações mais físicas desse ciclo de decisão fechado.

Pense no médio e longo prazo

Os melhores produtos de dados melhoram com o tempo, assim como um bom vinho. Isto é verdade por duas razões: 

Primeiro, as aplicações de produtos de dados geralmente aceleram a coleta, o que, por sua vez, melhora as soluções. Considere um produto de recomendações alimentado por dados de perfil de feedbacks dos usuários. Com dados de perfil limitados hoje, as recomendações iniciais (ou “partida a frio”) podem não ser inspiradoras. Mas, se os usuários estiverem mais dispostos a preencher um perfil quando ele for usado para personalizar sua experiência, o lançamento de recomendações acelerará a coleta de perfis, melhorando o serviço ao longo do tempo. 

Em segundo lugar, muitos produtos de dados podem ser desenvolvidos para alimentar várias aplicações, criar efeitos de rede por meio de dados compartilhados. Se os dados produzidos por cada aplicação realimentam as bases de dados subjacentes, isso melhora as soluções, o que, por sua vez, gera mais utilização e, portanto, coleta de dados, e o ciclo virtuoso continua. O gráfico de habilidades do Coursera é um exemplo.

Gráfico de Habilidades - Data Product - triggo.ai
Reprodução: Gráfico de Habilidades do Coursera

Uma série de algoritmos mapeiam uma biblioteca robusta de habilidades para conteúdo, carreiras e alunos. O grafo alimenta uma variedade de aplicações relacionadas à descoberta no site, muitos das quais geram dados de treinamento que fortalecem o gráfico e, por sua vez, melhoram suas aplicações.

Grande foco no desempenho de curto prazo pode resultar em subinvestimento em oportunidades promissoras de médio ou longo prazo. De maneira geral, a importância dos dados de alta qualidade não pode ser exagerada, os investimentos na coleta e armazenamento devem ser priorizados em todas as etapas.

Conclusão

Em resumo, cada vez mais as organizações vão pensar em resolver seus problemas e criar novas soluções construindo data products.

Ter uma visão clara para esta perspectiva e estratégia requer novas competências, que vão além do pipeline de Analytics & AI, dependem muito da maturidade e sinergia de toda a organização, com alinhamentos de negócios, técnicos e metodologias de produtização de dados.

Se você quiser entender melhor como Data Products pode mudar a forma como os dados são tratados e vistos na sua empresa, clique aquiSomos especializados em construir Data Products confiáveis e soluções analíticas e estamos prontos para ajudar você nesta jornada.