Recent twitter entries...

Notinha rápida

0
Olá, pessoal!

Essa pequena nota é pra dar uma satisfação pra vcs sobre o sumiço dos autores do blog. É o seguinte: nós casamos. Também estou em um emprego novo e isso tá me deixando sem tempo pra escrever. Por favor, nos desculpem. Já, já estaremos recheando o blog com coisas novas.

Abraços!

Rede Neural Artificial - Um cérebro amigo

0
Olá!

Vc sabia que as redes neurais artificiais são importantíssimas pra a inteligência de negócios? Pois é. O post de hj vai falar sobre esse "cérebro amigo" da inteligência artificial. :-)

E querido amigo, querida amiga, elas tem muitas utilidades. Sabe aquela ligação que vc recebe da operadora de cartão de crédito perguntando se vc está mesmo em tal lugar comprando tal coisa? É uma rede neural artificial dizendo que aquela compra fugiu do seu padrão e que talvez não seja vc comprando. Em outras palavras, alguém pode estar se passando por vc e usando seu cartão para fazer compras. As RNAs podem te mostrar informações até então desconhecidas e são usadas em previsões de séries temporais, segmentações, reconhecimento de padrões, aproximação de funções, entre outros. Bom, deixa eu explicar melhor.

As redes neurais artificiais são programas de computador modelados de forma que imitem o comportamento do cérebro humano, ou seja, aprendem, erram e fazem descobertas. Assim como o nosso cérebro é composto por bilhões de neurônios, as RNAs também são formadas por unidades que nada mais são que pequenos módulos que simulam o funcionamento de um neurônio. Estes módulos recebem e transmitem informações.

As RNAs adquirem conhecimento através da experiência, isto é, através de um treinamento com regras que elas precisam pra resolver um determinado problema. A idéia é que ela aprenda essas regras e não decore os exemplos que são apresentados no treinamento dela. Costumamos dizer que a rede tem que ficar generalizada e não especialista, ou seja, ela tem que responder corretamente a qualquer padrão (dados de entrada) que for passado a ela e não somente responder à padrões iguais aos exemplos do treinamento.

Outra característica delas é o fato de poderem fazer associações entre padrões diferentes. Assim, a rede pode tratar de fotos de pessoas, sintomas de doenças, leitura de sensores e características de clientes.

Então, dependendo do problema que vc tenha existe um tipo de aprendizado pra sua rede neural artificial te ajudar. São basicamente 3 e estão abaixo:

- Aprendizado supervisionado: nesse caso, a RNA recebe um conjunto de dados de entrada e um conjunto de dados de saída que mostra como o primeiro conjunto deve responder. Dentro da rede ocorrem ajustes até que o erro de resposta entre o primeiro e o segundo conjunto seja aceitável. Exemplo: A rede deve reconhecer as letras do alfabeto. O primeiro conjunto de dados são as letras escritas à mão por alguém. O segundo conjunto tem o alfabeto escrito em letra de forma. Como a rede já está treinada, ela deve dizer corretamente qual é a letra que alguém está escrevendo, comparando com alfabeto em letra de forma.

- Aprendizado não-supervisionado: nesse caso, a rede se auto-organiza, ou seja, não é apresentado um conjunto de dados de saída pra que ela compare os resultados. A própria rede se organiza formando vários grupinhos dos dados de entrada que contenham características semelhantes. Exemplo: Uma rede que precise separar uma lista de clientes em vários perfis diferentes. Ela analisa cada um e vai agrupando os que têm características parecidas, formando uma lista de clientes segmentada.

- Híbrido: nesse último caso, a rede utiliza os dois tipos de apresendizado acima, o supervisionado e o não-supervisionado. Dessa forma, elas trabalham em conjunto e se completam. Exemplo: Uma das camadas da rede é auto-organizável e separa os clientes em perfis diferentes. Outra camada da rede é supervisionada e aprende os vários perfis de clientes. Assim, quando chega um cliente novo na sua lista, a segunda camada da rede é capaz de dizer a que grupo ele pertence.

As RNAs não servem pra tomar a decisão por vc. Aliás, nenhuma inteligência artificial deve substituir o homem e sim apoiar as decisões dele (pelo menos na inteligência de negócios :P). Então, ninguém precisa ficar com medo de perder o emprego pra uma máquina não, tá?

Essa explicação toda é bem básica e serve pra quem não sabia ainda que a inteligência artificial é uma ferramenta forte na área da inteligência de negócios. Agora é só colocar a cabeça pra funcionar e adaptar essa mais nova ferramenta aos seus trabalhos. ;-)

Na internet tem vários tutoriais mais técnicos e completos sobre Redes Neurais Artificiais. Vale consultar vários pra entender melhor. Um livro legal que eu usei pra estudar e que tem várias técnicas para BI é o Sistemas Inteligentes, da Solange Oliveira Rezende e editora Manole.

Mais tarde eu explico melhor cada tipo de rede e dou a lista de ferramentas open source e gratuitas que têm as redes implementadas!

Bjinhus pra vcs! :)

Pentaho

1
Oi, pessoal!

Neste dia gostoso de chuvinha e tempinho frio aqui no Rio, aproveito pra abrir o blog com uma ferramenta open source de BI lindíssima: o Pentaho (se fala pentárro, mas tem gente que fala pentarrô).

No sábado eu fiz um curso desta ferramenta na Linux Solutions com o professor Caio Moreno e caí de amores por ela.

De acordo com o professor, atualmente, o Pentaho é a plataforma de inteligência de negócios de código aberto mais popular e poderosa do mundo. Ela está sendo usada, por exemplo, pelo SERPRO, Motorola, Mozilla e um monte de outras empresas.

Seu uso em parte é gratuito e em parte pago. Mas dá pra se virar muito bem somente usando a versão community, que é como a gratuita é chamada.

O Pentaho foi desenvolvido em Java e por isso pode ser usado em qualquer sistema operacional. Além disso, podemos acessar nosso portal Bi Pentaho em celulares que utilizem o Google Android com o IT4biz Mobile 1.0, por exemplo.

Entre as funcionalidades do Pentaho está a possibilidade de realizar consultas a bases de dados, extrair relatórios, analisar informações (OLAP), construir painéis para controle gerencial (dashboards), extrair dados (ETL) e realizar mineração de dados (data mining).

O conjunto de suites do Pentaho responsáveis pela listinha aí de cima são:

- Kettle: ferramenta de ETL desenvolvida pelo pessoal que trabalhou no SAS e na Informatica (do Power Center). Também é conhecida como PDI (Pentaho Data Integration), integra uma lista grandona de SGBD's e seu ambiente gráfico é bem amigável, cheio de componentes que é só clicar a arrastar pra traçar o processo de transformação.

- Mondrian (nome bonito, né?): servidor OLAP, responsável por mostrar os cubos e deixar que o usuário brinque com as informações.

- PSW ou Pentaho Scheme Workbench: ferramenta responsável pelo processo de criação de cubos. Uma vez que as dimensões e a tabela fato estejam criadas, os cubos também podem ser montados em XML e alterados em qualquer editor de texto.

- Pentaho Reporting: ferramenta também conhecida por PRD (Pentaho Report Designer), que auxilia na criação de relatórios. Muito fácil, com o esquema de arrastar componentes pra lá e pra cá.

- Dashboards: ferramenta para construção de painéis personalizados para acessar as informações manipuladas pelo Pentaho, ou seja, possibilita a criação de um painel bem bonito pra chefe nenhum botar defeito. A versão enterprise (não gratuita) do Pentaho tem o Dashboard Designer, que é uma interface bem amigável, também do tipo arrata componentes pra lá e pra cá que facilita bastante o desenvolvimento dos painéis. Pros usuários da versão community resta escolher entre a API do Pentaho que permite a programação dos dashboards usando Java/JSP/JSF ou o framework CDF (Community Dashboard Framework). Ambos dão um pouquinho mais de trabalho, mas nada impossível.

- Data Mining com Weka: o Pentaho utiliza o Weka, que é uma ferramenta à parte, pra fazer o processo de mineração dos dados. Assim como o dashboard, aqui vc também tem a opção gratuita e a paga. Na primeira, a integração acontece com um plugin da seguinte forma: vc classifica e clusteriza seu modelo de dados no Weka. Depois, no Kettle, vc insere esse resultado como se fosse um dos passos do fluxo de transformação e alacazan! Esse plugin, chamado Weka Scoring Plugin acrescenta uma coluna com o resultado da mineração na saída desse modelo. Na versão paga, os algoritmos de data mining são apresentados como componentes de tranformação do Kettle, facilitando bastante a construção do modelo, uma vez que está tudo sendo feito no mesmo lugar. Mais uma vez, tudo acaba tendo seu jeito de fazer
gratuitamente.

Vc pode conhecer o Pentaho melhor aqui.

Pra baixar e instalar os arquivos do Pentaho é meio chatinho, pq vc tem que fazer várias configuração, copiando e colando arquivos de um lado pra outro. Mas não tem problemas, pq o resultado é encantador. Então, pra facilitar a vida, o BIOS vai montar um tutorial maneiro já já.

Então é isso! Espero que consigam um aumento ou um emprego melhor com isso. ;)

Bjinhus!

*Post escrito com a colaboração de Thiago Pappacena.