O que é ETL?

ETL é a junção das siglas em inglês Extract, Transform e Load, em português Extração, Transformação e Carregamento. O ETL tornou-se um termo muito comum na área de Business Intelligence e tratamento de dados, pois lida com um desafio recorrente da área que é manipular os dados, aplicando regras para a sua limpeza, optimização e inserção em outra ferramenta, como um data warehouse ou dashboard.

Qual é a importância do ETL?

O ETL é sem dúvidas uma das fases mais críticas do tratamento de dados, principalmente quando há a necessidade de consolidar dados de diferentes fontes, o que adiciona uma camada de complexidade a tarefa. Mas, é de suma importância para consolidar dados de diversos lugares e tratar tais dados com regras, que muitas vezes não são possíveis de serem aplicadas direto na ferramenta de armazenagem inicial do dado.

Fluxo para processamento de dados

Algumas ferramentas de ETL:

Existem algumas ferramentas que possibilitam você fazer ETL de dados, mas também existe a possibilidade de você criar um middleware, ou seja, uma camada intermediária, desenvolvida com código proprietário para solucionar uma necessidade específica. São exemplos de ferramentas de ETL:

IBM Atmosphere DataStage

SAP BusinessObjets Data Services 

Microsoft SQL Server Integration Services (SSIS)

Oracle Data Integration

Adverity

Mas, é importante salientar que ETL é um processo, portanto, existe mais ferramentas e formas de fazer e certamente se você precisa extrair, tratar e carregar o dado, mesmo que num Excel ou Google Sheets, de certa forma você já está fazendo um processo rústico de ETL.