Preparando o ambiente

O Pentaho PDI usa o ambiente Java para ser executado. Nesse momento o recomendável é ter a versão 8 do Java instalado.

Abra o terminal e digite o seguinte comando para saber se o Java está instalado e qual sua versão:

java -version

Caso ainda não tenha o Java instalado, execute os comandos abaixo para adicionar o repositório e instalar os aplicativos:

sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-installer
sudo apt-get install oracle-java8-set-default

Agora vamos validar a varável de ambiente JAVA_HOME. Digite o seguinte comando:

env | grep JAVA_HOME

Se não obtiver nenhum resultado, essa variável deverá ser definida no arquivo ~/.bashrc adicionado a seguinte linha:

export JAVA_HOME=/usr/lib/jvm/java-8-oracle

Salve e execute o comando abaixo para recarregar o valor das varáveis no ambiente sem necessitar dar reboot ou reiniciar a sessão do usuário:

source .bashrc

Instalando o PDI (Kettle)

O aplicativo possui todos os arquivos necessários para a execução e deve ser baixado do site oficial nesse link:

http://community.pentaho.com/projects/data-integration/

O pacote pode ser descompactado dentro que qualquer pasta. Se for do usuário, sugiro criar uma pasta Aplicativos e descompactar dentro dela. Se for do sistema, descompacte dentro da /opt.

Executando o aplicativo

É importante verificar se possui o pacote abaixo instalado antes de executar o aplicativo pela primeira vez:

sudo apt-get install libwebkitgtk-1.0-0

Dentro da pasta data-integration que foi descompactada, altere a permissão do arquivo spoon.sh para execução:

chmod +x spoon.sh

Depois disso é só executar esse arquivo que o PDI deverá abrir.

 

Uma forma de bloquear o envio de emails para servidores provedores de SPAM na Internet é utilizar os parâmetros abaixo no Postfix.

No Webmin, essa configuração fica em Servers -> Postfix Mail Server -> SMTP Server Options -> Restrictions on recipient addresses.

permit_mynetworks, permit_sasl_authenticated, reject_non_fqdn_hostname, reject_non_fqdn_sender, reject_non_fqdn_recipient, reject_unauth_destination, reject_unauth_pipelining, reject_invalid_hostname, reject_rbl_client bl.spamcop.net, reject_rbl_client cbl.abuseat.org, reject_rbl_client dnsbl.sorbs.net, reject_rbl_client zen.spamhaus.org

Para executar o Pentaho Data Integration (PDI) no Windows 7 32bits, siga as orientações abaixo.

  • Instalar a JRE e a JDK do Java no Windows (escolher a versão i586 que corresponde a arquitetura de 32bits)
  • Definir as duas variáveis de ambiente abaixo no Windows (troque o caminho de acordo com a versão do Java instalado):
    • PENTAHO_JAVA_HOME=C:\Program Files\Java\jre1.8.0_144
    • JAVA_HOME=C:\Program Files\Java\jre1.8.0_144
  • Editar o arquivo spoon.bat e trocar o valor do xmx para 1536

Ao executar o .bat, aguarde alguns segundos antes de desistir :). Aplicativos desse porte demoram um pouco para iniciar em ambientes 32bits.

Por padrão o VIM começa no modo de compatibilidade. Isso significa que a maioria dos bons recursos estão desligados. A maneira mais fácil de ativá-los é criar um arquivo $HOME/.vimrc. Veja um exemplo:

:syntax on
:autocmd FileType * set formatoptions=tcql nocindent comments&
:autocmd FileType c,cpp set formatoptions=croql cindent comments=sr:/*,mb:*,ex:*/,://
:
:set autoindent
:set autowrite
:ab #d #define
:ab #i #include
:ab #b /********************************************************
:ab #e ********************************************************/
:ab #l /*——————————————————*/
:set sw=4
:set notextmode
:set notextauto
:set hlsearch
:set incsearch
:set textwidth=70

Dependendo da configuração do seu web site, algumas regras do Apache podem esconder as pastas ocultas. No processo de renovação do certificado automatizado no Virtualmin a pasta .well_know é usada. Para fazer com que tudo ocorra sem erros, coloque as seguintes regras no arquivo .htaccess:

RewriteCond %{REQUEST_URI} !^/.well-known/*
RewriteRule "(^|/)\." - [F]

É muito comum instalar o WordPress em uma subpasta da raiz do web server para manter a organização da estrutura. Mas, isso não significa que desejamos que os nossos visitantes digitem, por exemplo, o nome da pasta depois do domínio. Apenas o domínio é o suficiente nesse caso.

Para obter esse tipo de resultado, deixe o campo “Endereço do site (URL)” como o domínio, sem a pasta e insira os seguintes dados no arquivo .htaccess na pasta raiz html:

# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{HTTP_HOST} ^(www.)?rdconsolo.com.br$
RewriteCond %{REQUEST_URI} !^/wordpress/
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.*)$ /wordpress/$1
RewriteRule ^(/)?$ wordpress/index.php [L]
</IfModule>
# END WordPress

No processo de instalação do WordPress em servidores CentOS, acabei recebendo o erro 500 do web server Apache.

Analisando o error_log o termo abaixo me chamou a atenção:

mod_fcgid: read data timeout

Pesquisando na Internet, descobri a configuração que estava causando esse erro e realizei a alteração no arquivo httpd.conf:

mod_fcgid: read data timeout

Se seu web server é compartilhado, observe o domínio específico que está realizando a instalação.

edit: em servidores Debian, observar os arquivos de configuração individual em “/etc/apache2/sites-available/”.

edit2: em servidores com Virtualmin, escolha o domínio desejado, em Configuration -> Website Options, altere o valor de “Maximum PHP script run time”.