Os outliers são valores anormais em uma base de dados que fogem do padrão dos demais (afastados da média). Sua origem pode ter diversas fontes, tais como causalidades, erros no preenchimento dos dados ou fraudes.
Para cada problema deve-se ter um tipo de tratamento com esses dados fora dos padrões, como remover o registro caso ele não se encaixe na situação, manter o registro ou substituí-lo por um outro valor. Cada caso deve ser analisado levando em consideração que os dados, em muitas situações, representam pessoas ou elementos do mundo real.
Um gráfico interessante para se visualizar situações de outliers é chamado de boxplot, esse gráfico leva em consideração a distância dos elementos em relação ao valor médio. Observe abaixo como é o formato desse gráfico: