Curiosidade – O nascimento de um modelo preditivo

1

Um modelo preditivo é o resultado da combinação de dados e matemática, onde o aprendizado pode ser transformado na criação de uma função de mapeamento entre um conjunto de campos de dados de entrada e uma resposta ou variável de destino.

Para desenvolver um modelo preditivo, primeiro, é preciso montar o conjunto de dados que será utilizado para o treinamento. Para isso, um conjunto de campos de entrada que representa um cliente, por exemplo, é reunido a um registro. Esse registro pode conter recursos, como idade, gênero, CEP, número de itens adquiridos nos últimos seis meses e número de itens retornados, combinados a uma variável de destino que pode ser utilizada para informar se o cliente migrou ou não para o concorrente no passado. O registro de um cliente pode ser matematicamente descrito como um vetor em um espaço de recurso multidimensional, já que diversos recursos estão sendo utilizados para definir o objeto do tipo de cliente. Quando todos os registros de cliente estiverem reunidos, eles se tornam um conjunto de dados que pode conter milhões de registros.

As técnicas de modelagem preditiva permitem o desenvolvimento de modelos preditivos precisos, contanto que existam dados suficientes e que a qualidade dos dados não seja uma preocupação. Dados inválidos geram modelos inválidos, independentemente da qualidade da técnica preditiva. Como diz o ditado, entra lixo, sai lixo.

Fonte: IBM

Imagens X assimilação de dados

1

O cérebro humano é incapaz de processar grande volume de dados, no entanto, as empresas geram, diariamente, toneladas de dados que são transformadas em informações e que devem ser assimiladas…pelo cérebro humano. Felizmente, há algo para ajudar seu cérebro não apenas a imaginar as informações de sua corporação, mas a consumi-las: as imagens.

A visualização de dados é a representação dos mesmos em um formato pictórico ou gráfico. O objetivo da visualização é simplificar o valor dos dados, promover a compreensão sobre eles, e comunicar conceitos e ideias importantes. A visualização é a maneira mais fácil para que o nosso cérebro receba e interprete grandes quantidades de informação. Ela dá aos profissionais a capacidade de usar os dados de forma intuitiva, sem conhecimentos técnicos aprofundados. Mesmo usuários iniciantes podem criar visualizações de dados que sejam significativas, como gráficos de pizza, gráficos de linha, gráficos de bolhas e mapas de calor.

Visualizações de dados avançadas suportam técnicas analíticas mais profundas e complexas. Os profissionais podem não somente perceber o que aconteceu, mas também prever o que poderá acontecer, usando gráficos ricos para derivar rapidamente ações empresariais. O fato é que, quando as pessoas fazem a transição de planilhas para visualizações de dados, elas são capazes de registrar os valores que estão vendo como um todo.

Por este motivo, o SAS disponibilizou um e-book que traz algumas razões pelas quais você não pode ficar sem a visualização de dados. Para ver o e-book completo, clique aqui.

Para ler a matéria completa, clique aqui.

Fonte: SAS

Seguradoras buscam alternativas no BA para combater o aumento de fraudes

1

O SAS, recentemente, realizou uma pesquisa com seguradoras nos Estados Unidos. O resultado apontou que somente 13% dos entrevistados usavam uma variedade de técnicas, incluindo Business Analytics e Advanced Analytics; e apenas 21% monitoravam a incidência de fraude em tempo real. E constatou que, dentre as companhias que fazem o uso do BA, 57% tiveram um crescimento anual de 4% na detecção de fraudes. Já as seguradoras sem soluções automatizadas de detecção, ou somente baseadas em regras de negócios, apenas 16% tiveram um crescimento similar.

Entre os maiores obstáculos enfrentados por muitas seguradoras estão as falhas em seus sistemas de detecção, soluções ultrapassadas, dificuldades no processo de integração de dados, e atividades de terceiros que resultam em dados incompletos ou não confiáveis.

Para minimizar os riscos, o SAS oferece as soluções de Analytics Avançadas, que fornecem uma abordagem para detecções. Normalmente, elas começam pela extração de dados existentes de seguradoras para ‘limpá-los’ e qualifica-los, se necessário. A tecnologia pode conectar os dados para fornecer uma investigação cautelosa dos clientes da empresa. Depois desse processo, a abordagem analítica híbrida deve ser aplicada, incorporando desde regras de negócios, passando por detecções de anomalias, modelos preditivos, mineração de textos e análise de redes de relacionamentos.

Para ler a matéria completa, clique aqui.

Fonte: SAS.com

 

Como utilizar o Hadoop com outras ferramentas

2

Você certamente já teve as seguintes dúvidas: “a utilização do Hadoop tem impacto na visualização e nas análises?” ou “como posso preparar os dados em Hadoop?”, ou ainda “que tipo de técnicas analíticas estão disponíveis para analisar dados no Hadoop?”.

Pensando em responder essas (e outras) dúvidas, o SAS junto com a TDWI elaborou o paper “Eight Considerations for Utilizing Big Data Analytics with Hadoop”, que tem como objetivo elucidar a forma como todas estas ferramentas interagem. Uma espécie de check-list que pode e deve ser usada como ajuda na exploração da análise do big data.

Fonte: SAS