---
title: "Exemplo: Experimento com dados mistos sem repetiÃ§Ãµes"
author: "Alcinei Mistico Azevedo (ICA-UFMG)"
date: "`r Sys.Date()`"
output: rmarkdown::html_vignette
fig_caption: no
vignette: >
  %\VignetteIndexEntry{Exemplo: Experimento com dados mistos sem repetiÃ§Ãµes}
  %\VignetteEngine{knitr::rmarkdown}
  %\VignetteEncoding{UTF-8}
---

```{r, include = FALSE}
knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>"
)
```

# Ativando o pacote
ApÃ³s a instalaÃ§Ã£o do pacote Ã© preciso ativa-lo. Para isso, deve-se utilizar a funÃ§Ã£o `library` ou `require`

```{r}
library(MultivariateAnalysis)
```
# Abrindo o conjunto de dados
Posteriormente, deve-se carregar no R o conjunto de dados a serem analizados. Isso pode ser feito de diferentes formas.

Uma possibilidade Ã© utilizando a funÃ§Ã£o `read.table`. Neste exemplo vamos trabalhar com o banco de dados do pacote, o qual pode ser carregado com a funÃ§Ã£o `data`.

Este exemplo trata-se de dados binarios vindo do uso de marcadores moleculares em cinco individuos.
```{r}
data("Dados.Misto")
Dados.Misto
```
# ObtenÃ§Ã£o de medidas de dissimilaridade para dados mistos
Muitas sÃ£o as opÃ§Ãµes para a obtenÃ§Ã£o de medidas de dissimilaridade para dados mistos. Vamos apresentar aqui algumas possibilidades para analise.

## MÃ©todo 1: Ãndice de Gower

Uma possibilidade quando se tem dados misto Ã© o uso do Ãndice de Gower.
```{r}
#colocando nome nos individuos
rownames(Dados.Misto)=paste0("T",1:nrow(Dados.Misto))
Gower1=Distancia(Dados.Misto,Metodo = 21)
Gower1
```

Um problema desta metodologia, Ã© que neste caso, quando as variÃ¡veis binÃ¡rias (0 ou 1) indicando a presenÃ§a ou ausÃªncia de bandas a informaÃ§Ã£o 0-0 (ausencia de bandas em ambos os indivÃduos) indica que os dois ÃndivÃduos sÃ£o iguais, o que nÃ£o Ã© verdade necessÃ¡riamente. Caso queira desconsiderar essas informaÃ§Ãµes (0-0) no cÃ´mputo da dissimilaridade, pode-se usar o "Ãndice de Gower 2".

## MÃ©todo 2: Ãndice de Gower 2 
Essa medidada deve ser utilizada quando se tem variÃ¡veis binÃ¡rias (0 ou 1) indicando a presenÃ§a ou ausÃªncia de bandas. Neste caso, a informaÃ§Ã£o 0-0 (ausencia de bandas em ambos os indivÃduos) sÃ£o desconsiderados no cÃ´mputo da dissimilaridade, raciocÃcnio similar ao indice de Jacard.
```{r}
Gower2=Distancia(Dados.Misto,Metodo = 22)
round(Gower2$Distancia,3)
```

## MÃ©todo 3: Calcular a medida de dissimilaridade mais apropriada para cada variÃ¡vel e fazer a mÃ©dia ponderada posteriormente.
Neste caso, vamos usar o Ãndice de jacard para os dados binÃ¡rios, Ãndice de discordÃ¢ncia para os dados multicategÃ³ricos e distÃ¢ncia euclidiana padronizada para os dados quantitativos.

```{r}
#Indice de jacard
DistBin=Distancia(Dados.Misto[,c(1:5)],Metodo = 12)
#Indice de discordancia
DistCat=Distancia(Dados.Misto[,c(8,9,11)],Metodo = 10)
#Distancia euclidiana padronizada
DadosQanti=Distancia(Dados.Misto[,c(6,7,10)],Metodo = 5)

#Criando list com as matrizes
dissimilaridades=list(DistBin,DistCat,DadosQanti)

#Calculando a media ponderada
Metodo3=MediaDistancia(dissimilaridades,n=c(5,3,3))
Metodo3

```

## Metodo 4: Transformar os dados quantitativos em qualitativos e considerar tudo como multicategÃ³rico
Os dados quantitativos podem ser transformados em qualitativos. Para isso, pode-se usar a funcao `Quant2Quali`. Assim basta indicar o numero maximo de classes desejadas e a funcao demonstrarÃ¡ para cada individuo a classe que ele pertence. Essa classe Ã© obtida considerando intervalos equidistantes entre o menor e maior valor de cada variavel, considerando-se o nÃºmero de classes. 

```{r}
DadosQuanti=Dados.Misto[,c(6,7,10)]
DadosQuanti
Mat=Quant2Quali(DadosQuanti,nclasses = 4)
Mat

#Substituido nos dados os valores quatitativos por qualitativos
Dados.Misto2=Dados.Misto
Dados.Misto2[,c(6,7,10)]=Mat
Dados.Misto2
```

Agora, podemos considerar todos os dados como qualitativos e considerar o Ãndice de discordancia com medida de dissimilaridade.


```{r}
Metodo4=Distancia(Dados.Misto2,Metodo = 10)
Metodo4
```


# ApÃ³s obter a matriz de dissimilaridade, podemos fazer o Dendrograma.

A fim de resumir as informaÃ§Ãµes da matriz de dissimilaridade a fim de melhorar a visualizaÃ§Ã£o da dissimilaridade, pode-se fazer um Dendrograma com o auxilio da funÃ§Ã£o `Dendrograma`. Varios algoritimos podem ser utilizados para a construÃ§Ã£o deste Dendrograma. Para isso, deve-se indicar no argumento `Metodo`:

1 = Ligacao simples (Metodo do vizinho mais proximo).

2 = Ligacao completa (Metodo do vizinho distante).

3 = Ligacao media entre grupo (UPGMA).

4 = Metodo de Ward.

5 = Metodo de ward (d2).

6= Metodo da mediana (WPGMC).

7= Metodo do centroide (UPGMC).

8 = Metodo mcquitty (WPGMA).


```{r}
Dendrograma(Gower1,Metodo=3,Titulo="Gower1")
```

```{r}
Dendrograma(Gower2,Metodo=3,Titulo="Gower2")
```

```{r}
Dendrograma(Metodo3,Metodo=3,Titulo="Metodo3")
```

```{r}
Dendrograma(Metodo4,Metodo=4,Titulo="Metodo4")
```


# Para comparar as metodologias pode-se estimar a correlaÃ§Ã£o dos metodos dois a dois

```{r}

mat=cbind(Gower1=Gower1$Distancia,Gower2=Gower2$Distancia,Metodo3=Metodo3,Metodo4=Metodo4$Distancia)

Cor=cor(mat)
Cor
```


# Uma opÃ§Ã£o de biplot legal para dados mistos Ã© o PCAmixed.
```{r}
ComponentesPrincipais.Misto(Dados.Misto,plot = "individuos")
```

```{r}
CPM=ComponentesPrincipais.Misto(Dados.Misto,plot = "nivel")
```

```{r}
CPM=ComponentesPrincipais.Misto(Dados.Misto,plot = "correlacao")
```

```{r}
CPM=ComponentesPrincipais.Misto(Dados.Misto,plot = "pesos")
```