Data profiling is being done at different stages of data warehouse developing stages. The purpose of data profiling is to identify the wrong data at the initial stage of data so that it can be corrected at the right time. On the other hand, data mining is the process of identifying patterns in the pre-built database. It is the process of evaluating the existing database and turning raw data into useful information. Data Mining involves evaluating the large blocks of datasets to draw patterns and trends in the database. We can break the data mining process into five steps gathering the data and loading it into the database.
O perfil de dados além de permitir descobrir se os dados são adequados para análise, o que reforça a posição de seguir ou não com o projeto, ele ajudar a identificar e corrigir problemas de qualidade de dados nos dados de origem, mesmo antes de começar a movê-los para o banco de dados de destino. A mineração de dados reúne um conjunto de esforços para descobrir padrões em bases de dado. A partir dos padrões descobertos, têm-se condições de gerar conhecimento útil para o processo da tomada de decisão.
Data mining is the tool or process by using which we can extract knowledge or information from a large amount of data.
But coming to Data Profiling, it is the process of cleaning data, checking and converting the data into a desirable format so that, we can apply a particular tool on it to extract the knowledge.
Data profiling can be sub process of data mining. Where data mining is concern on mining the available information from the data. Data profiling aims to organize the data in order to make better mining for the data.