---
title: "Exemplo: dados binÃ¡rios"
author: "Alcinei Mistico Azevedo (ICA-UFMG)"
date: "`r Sys.Date()`"
output: rmarkdown::html_vignette
fig_caption: yes
vignette: >
  %\VignetteIndexEntry{Exemplo: dados binÃ¡rios}
  %\VignetteEngine{knitr::rmarkdown}
  %\VignetteEncoding{UTF-8}
---

```{r, include = FALSE}
knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>"
)
```

# Ativando o pacote
ApÃ³s a instalaÃ§Ã£o do pacote Ã© preciso ativa-lo. Para isso, deve-se utilizar a funÃ§Ã£o `library` ou `require`

```{r}
library(MultivariateAnalysis)
```
# Abrindo o conjunto de dados
Posteriormente, deve-se carregar no R o conjunto de dados a serem analizados. Isso pode ser feito de diferentes formas.

Uma possibilidade Ã© utilizando a funÃ§Ã£o `read.table`. Neste exemplo vamos trabalhar com o banco de dados do pacote, o qual pode ser carregado com a funÃ§Ã£o `data`.

Este exemplo trata-se de dados binarios vindo do uso de marcadores moleculares em cinco individuos.
```{r}
data("Dados.BIN")
Dados.BIN
```
# ObtenÃ§Ã£o de medidas de dissimilaridade
Muitas sÃ£o as opÃ§Ãµes que este pacote oferece de medidas de dissimilaridade. Convidamos os usuÃ¡rios a ler o manual da funcao `Distancia` (`?Distancia`).

Para se ter diferentes medidas de dissimilaridade basta colocar o respectivo numero no argumento `Metodo` dentro da funÃ§Ã£o `Distancia`:

### Dados qualitativos (binÃ¡rios ou multicategÃ³ricos)

9 = Frequencia de coincidencia.

10 = Frequencia de discordancia.

11 = indice Inverso de 1+coincidencia = 1/(1+c)

### Dados qualitativos binarios

12 = Dissimilaridade de Jacard: 1-a/(a+b+c).

13 = Dissimilaridade de Sorensen Dice: 1-2a/(2a+b+c).

14 = Dissimilaridade de Sokal e Sneath: 1-2(a+d)/(2(a+d)+b+c)

15 = Dissimilaridade de Roger e Tanimoto: 1-(a+d)/(a+2(b+c)+d)

16 = Dissimilaridade de Russel e Rao: 1-a/(a+b+c+d).

17 = Dissimilaridade de Ochiai: 1-a/sqrt((a+b)(a+c)).

18 = Dissimilaridade de Ochiai II: 1-ab/sqrt((a+b)(a+c)(b+d)(c+d)).

19 = Dissimilaridade de Haman: 1-((a+d)-(b+c))/(a+b+c+d).

20 = Dissimilaridade de Yule: 1-(ad-bc)/(ad+bc).

```{r}
#colocando nome nos individuos
rownames(Dados.BIN)=paste0("Indiv_",1:nrow(Dados.BIN))
Dist=Distancia(Dados.BIN,Metodo = 12)
Dist
```
InformaÃ§Ãµes importantes podem ser obtidas dessa matriz com a funÃ§Ã£o `SummaryDistancia`:
```{r}
resumo=SummaryDistancia(Dist)
resumo
```

A fim de resumir as informaÃ§Ãµes da matriz de dissimilaridade a fim de melhorar a visualizaÃ§Ã£o da dissimilaridade, pode-se fazer um Dendrograma com o auxilio da funÃ§Ã£o `Dendrograma`. Varios algoritimos podem ser utilizados para a construÃ§Ã£o deste Dendrograma. Para isso, deve-se indicar no argumento `Metodo`:

1 = Ligacao simples (Metodo do vizinho mais proximo).

2 = Ligacao completa (Metodo do vizinho distante).

3 = Ligacao media entre grupo (UPGMA).

4 = Metodo de Ward.

5 = Metodo de ward (d2).

6= Metodo da mediana (WPGMC).

7= Metodo do centroide (UPGMC).

8 = Metodo mcquitty (WPGMA).


```{r}

Dendrograma(Dist,Metodo=3)
```
Adcionalmente, pode-se fazer o agrupamento Tocher com o auxilio da funÃ§Ã£o `Tocher`:
```{r}

Tocher(Dist)
```

Outra possibilidade Ã© o estudo da dispersÃ£o da matriz de dissimilaridade pelas tÃ©cnica de coordenadas principais:
```{r}
CoordenadasPrincipais(Dist)
```