Oi, pessoal!
Neste dia gostoso de chuvinha e tempinho frio aqui no Rio, aproveito pra abrir o blog com uma ferramenta open source de BI lindíssima: o Pentaho (se fala pentárro, mas tem gente que fala pentarrô).
No sábado eu fiz um curso desta ferramenta na
Linux Solutions com o professor
Caio Moreno e caí de amores por ela.
De acordo com o professor, atualmente, o Pentaho é a plataforma de inteligência de negócios de código aberto mais popular e poderosa do mundo. Ela está sendo usada, por exemplo, pelo SERPRO, Motorola, Mozilla e um monte de outras empresas.
Seu uso em parte é gratuito e em parte pago. Mas dá pra se virar muito bem somente usando a versão community, que é como a gratuita é chamada.
O Pentaho foi desenvolvido em Java e por isso pode ser usado em qualquer sistema operacional. Além disso, podemos acessar nosso portal Bi Pentaho em celulares que utilizem o Google Android com o
IT4biz Mobile 1.0, por exemplo.
Entre as funcionalidades do Pentaho está a possibilidade de realizar consultas a bases de dados, extrair relatórios, analisar informações (OLAP), construir painéis para controle gerencial (dashboards), extrair dados (ETL) e realizar mineração de dados (data mining).
O conjunto de suites do Pentaho responsáveis pela listinha aí de cima são:
- Kettle: ferramenta de ETL desenvolvida pelo pessoal que trabalhou no SAS e na Informatica (do Power Center). Também é conhecida como PDI (Pentaho Data Integration), integra uma lista grandona de SGBD's e seu ambiente gráfico é bem amigável, cheio de componentes que é só clicar a arrastar pra traçar o processo de transformação.
- Mondrian (nome bonito, né?): servidor OLAP, responsável por mostrar os cubos e deixar que o usuário brinque com as informações.
- PSW ou Pentaho Scheme Workbench: ferramenta responsável pelo processo de criação de cubos. Uma vez que as dimensões e a tabela fato estejam criadas, os cubos também podem ser montados em XML e alterados em qualquer editor de texto.
- Pentaho Reporting: ferramenta também conhecida por PRD (Pentaho Report Designer), que auxilia na criação de relatórios. Muito fácil, com o esquema de arrastar componentes pra lá e pra cá.
- Dashboards: ferramenta para construção de painéis personalizados para acessar as informações manipuladas pelo Pentaho, ou seja, possibilita a criação de um painel bem bonito pra chefe nenhum botar defeito. A versão enterprise (não gratuita) do Pentaho tem o Dashboard Designer, que é uma interface bem amigável, também do tipo arrata componentes pra lá e pra cá que facilita bastante o desenvolvimento dos painéis. Pros usuários da versão community resta escolher entre a API do Pentaho que permite a programação dos dashboards usando Java/JSP/JSF ou o framework CDF (Community Dashboard Framework). Ambos dão um pouquinho mais de trabalho, mas nada impossível.
- Data Mining com Weka: o Pentaho utiliza o Weka, que é uma ferramenta à parte, pra fazer o processo de mineração dos dados. Assim como o dashboard, aqui vc também tem a opção gratuita e a paga. Na primeira, a integração acontece com um plugin da seguinte forma: vc classifica e clusteriza seu modelo de dados no Weka. Depois, no Kettle, vc insere esse resultado como se fosse um dos passos do fluxo de transformação e alacazan! Esse plugin, chamado Weka Scoring Plugin acrescenta uma coluna com o resultado da mineração na saída desse modelo. Na versão paga, os algoritmos de data mining são apresentados como componentes de tranformação do Kettle, facilitando bastante a construção do modelo, uma vez que está tudo sendo feito no mesmo lugar. Mais uma vez, tudo acaba tendo seu jeito de fazer
gratuitamente.
Vc pode conhecer o Pentaho melhor
aqui.
Pra baixar e instalar os arquivos do Pentaho é meio chatinho, pq vc tem que fazer várias configuração, copiando e colando arquivos de um lado pra outro. Mas não tem problemas, pq o resultado é encantador. Então, pra facilitar a vida, o BIOS vai montar um tutorial maneiro já já.
Então é isso! Espero que consigam um aumento ou um emprego melhor com isso. ;)
Bjinhus!
*Post escrito com a colaboração de Thiago Pappacena.