A ferramenta R
- #Big Data
Visando atender as demandas atuais do mercado, para esta disciplina a ferramenta adotada será o R.
·
R é uma linguagem e também um ambiente de desenvolvimento integrado para cálculos estatísticos e gráficos.
· Foi criada originalmente por Ross Ihaka e por Robert Gentleman no departamento de Estatística da Universidade de Auckland, Nova Zelândia.
· É utilizado por profissionais em diversas áreas, como estatística, ciências sociais, saúde, psicologia, computação, dentre outras.
· É grátis.
A interface padrão do R é um prompt de comandos sem muitos recursos interativos com o usuário, e para ganhar produtividade e facilitar o uso muitas das vezes o RStudio é utilizado.
Figura 8 – Tela do R.
Figura 9 – Tela do RStudio.
Os objetos que mais utilizamos no R são:
Vetor - Uma coluna que representa alguma variável.
Preço
500,00
340,00
177,00
308,00
Matriz – Semelhante ao vetor, porém pode ter mais de uma variável, desde que sejam do mesmo tipo. Data Frame – Semelhante à matriz, porém aceita variáveis de todos os tipos.
Lista – Armazena outros objetos, que podem ser vetores, matrizes, data frames ou até mesmo outra lista.
Os principais tipos de dados são:
Numeric - Inteiro ou Decimal (int ou float).
Character – Texto (string).
Date Time – Data, hora.
Factor – Atribui codificação inteira ao dado.
Quando transformamos uma variável do tipo character para factor, internamente o R atribui uma codificação para ela. Isso é especialmente útil para algoritmos que não trabalham com valores categóricos e necessitam de dados de entrada numéricos.
Instalação do R e do RStudio podem ser realizadas seguindo os passos a seguir: Acesse a URL https://cran.r-project.org/bin/windows/base/ e clique em download.
Figura 10 – Instalando o R (parte 1 de 8).
Escolha o idioma e clique em OK.
Figura 11 – Instalando o R (parte 2 de 8).
Leia a licença de uso caso tenha interesse e clique em próximo.
Figura 12 – Instalando o R (parte 3 de 8).
Selecione um diretório para instalação. Pode utilizar o diretório default.
Figura 13 – Instalando o R (parte 4 de 8).
Selecione os componentes que serão instalados. Pode instalar todos.
Figura 14 – Instalando o R (parte 5 de 8).
É possível customizar essa parte da instalação, mas neste momento é recomendado marcar a opção Aceitar Padrão.
Figura 15 – Instalando o R (parte 6 de 8).
Pode customizar o nome que o atalho do R irá ter, mas é recomendado deixar as configurações default e seguir para próxima tela.
Figura 16 – Instalando o R (parte 7 de 8).
Em Ícones Adicionais, selecione se deseja criar atalhos e, em Entradas No Registro, marque as duas opções para que arquivos de extensão.RData sejam reconhecidos automaticamente pelo R.
Figura 17 – Instalando o R (parte 8 de 8).
Uma vez instalado o R, iremos instalar o RStudio. Acesse a URL https://www.rstudio.com/products/rstudio/download/ e clique em download. Clique em baixar o primeiro item, é a versão gratuita do RStudio. Na tela em seguida, escolha o instalador mediante o sistema operacional de sua máquina, seja Windows, Linux ou Mac. Ao iniciar o instalador, os seguintes passos podem ser seguidos.
Figura 18 – Instalando o RStudio (parte 1 de 3).
Selecione o diretório e clique em Próximo. É recomendado deixar o diretório
default.
Figura 19 – Instalando o RStudio (parte 2 de 3).
Nessa etapa poderá ser criado atalho no menu iniciar. É recomendado utilizar o default e clicar em Instalar.
Figura 20 – Instalando o RStudio (parte 3 de 3).
Para iniciar o RStudio, basta clicar em seu logo na barra de tarefas ou bucar pelo software. O R irá rodar automaticamente dentro do RStudio