top of page
  • alclicconbejacra

Baixe o conjunto de dados Cars93



Download do conjunto de dados Cars93: um guia abrangente




Se você estiver procurando por um conjunto de dados que contenha informações sobre 93 carros à venda nos EUA em 1993, talvez esteja interessado no conjunto de dados Cars93. Este conjunto de dados é amplamente utilizado para análise e visualização de dados, bem como para fins de ensino e aprendizagem. Neste artigo, mostraremos o que é o conjunto de dados Cars93, como baixá-lo de várias fontes e como usá-lo no R. Ao final deste artigo, você entenderá melhor o conjunto de dados Cars93 e suas aplicações.


O que é o conjunto de dados Cars93?




O conjunto de dados Cars93 é um quadro de dados com 93 linhas e 27 colunas. Cada linha representa um modelo de carro e cada coluna representa uma característica ou atributo do carro, como fabricante, preço, tipo, eficiência de combustível, tamanho do motor, potência, air bags, etc. O conjunto de dados destinava-se a ilustrar várias técnicas e métodos estatísticos, como regressão, classificação, agrupamento, etc.




cars93 dataset download



A origem e a finalidade do conjunto de dados




O conjunto de dados Cars93 foi originalmente publicado em Lock (1993), um livro-texto que introduz conceitos e métodos estatísticos usando exemplos do mundo real. O autor selecionou 93 modelos de carros aleatoriamente entre os modelos de carros de passeio de 1993 que foram listados tanto na edição do Consumer Reports quanto no PACE Buying Guide. Ele excluiu picapes e veículos esportivos/utilitários devido a informações incompletas na fonte do Consumer Reports. Ele também eliminou modelos duplicados (por exemplo, Dodge Shadow e Plymouth Sundance) que foram listados mais de uma vez.


O propósito de criar o conjunto de dados Cars93 foi fornecer um exemplo realista e relevante para o ensino e aprendizagem de estatística.O conjunto de dados abrange uma ampla gama de variáveis que podem ser usadas para explorar vários aspectos da análise de dados, como estatísticas descritivas, exibições gráficas, correlação, regressão, classificação, agrupamento etc. O conjunto de dados também permite que os alunos comparem diferentes modelos de carros com base em seus recursos e preferências.


A estrutura e os recursos do conjunto de dados




O conjunto de dados Cars93 é um quadro de dados com 93 linhas e 27 colunas. As colunas são as seguintes:


  • Fabricante: Nome do fabricante.



  • Modelo: Nome do modelo.



  • Tipo: Tipo de carro: um fator com níveis "Pequeno", "Esportivo", "Compacto", "Médio", "Grande" e "Van".



  • Min.Price: Preço mínimo (em $1.000): preço para uma versão básica.



  • Preço: Preço médio (em US$ 1.000): média de Min.Price e Max.Price.



  • Max.Price: Preço máximo (em $1.000): preço para uma versão premium.



  • MPG.city: City MPG (milhas por galão americano de acordo com a classificação da EPA).



  • MPG.highway: Rodovia MPG.



  • AirBags: Airbags padrão. Fator: nenhum, apenas motorista ou motorista e passageiro.



  • DriveTrain: Tipo de trem de força: roda traseira, roda dianteira ou 4WD; (fator).



  • Cilindros: Número de cilindros (falta para o Mazda RX-7, que possui um motor rotativo).



  • EngineSize: Tamanho do motor (litros).



  • Potência: Potência (máximo).



  • RPM: RPM (rotações por minuto na potência máxima).



  • Rev.per.mile: Rotações do motor por milha (na marcha mais alta).



  • Man.trans.avail: Existe uma versão de transmissão manual disponível? (sim ou não ). Fator.



  • Fuel.tank.capacity: Capacidade do tanque de combustível (galões americanos).



  • Passageiros: Capacidade de passageiros (pessoas).



  • Comprimento: Comprimento (polegadas).



  • Distância entre eixos: Distância entre eixos (polegadas).



  • Largura: Largura (polegadas).



  • Turn.circle: espaço de retorno (pés).



  • Rear.seat.room: espaço do banco traseiro (polegadas; ausente para carros de 2 lugares).



  • Luggage.room: Capacidade de bagagem (pés cúbicos; ausente em alguns modelos).



  • Peso: Peso (libras).



  • Origem: Origem do carro (fora dos EUA ou EUA). Fator.



  • Marca: Combinação de fabricante e modelo.



O conjunto de dados também possui alguns valores ausentes, indicados por ".".Por exemplo, o Mazda RX-7 tem um valor ausente para a coluna Cilindros, porque possui um motor rotativo em vez de um motor a pistão. O conjunto de dados também possui alguns valores discrepantes, como o Mercedes-Benz 300E, que tem preço e potência muito altos em comparação com outros carros do conjunto de dados.


Como baixar e usar o conjunto de dados Cars93?




O conjunto de dados Cars93 está disponível em várias fontes online, como Kaggle, RDocumentation, Picostat e GitHub. Você pode baixar o conjunto de dados em diferentes formatos, como CSV, RData ou TXT. Nesta seção, mostraremos como baixar o conjunto de dados de cada fonte e como carregá-lo e explorá-lo no R.


Baixando o conjunto de dados de várias fontes




Kaggle




Kaggle é uma plataforma popular para entusiastas de ciência de dados e aprendizado de máquina. Ele hospeda muitos conjuntos de dados, competições, notebooks e cursos para os usuários aprenderem e praticarem suas habilidades. Você pode encontrar o conjunto de dados Cars93 no Kaggle seguindo este link: [Cars93 Dataset on Kaggle]. Você pode baixar o conjunto de dados como um arquivo CSV clicando no botão "Download" no lado direito da página. Você precisará fazer login ou criar uma conta no Kaggle para baixar o conjunto de dados.


RDocumentação




RDocumentation é um site que fornece documentação e exemplos para pacotes e funções do R. Ele também hospeda alguns conjuntos de dados incluídos nos pacotes R, como o conjunto de dados Cars93. Você pode encontrar o conjunto de dados Cars93 em RDocumentation seguindo este link: [Cars93 Dataset on RDocumentation]. Você pode baixar o conjunto de dados como um arquivo RData clicando no botão "Baixar conjunto de dados" no lado direito da página. Você precisará ter o R instalado em seu computador para abrir o arquivo RData.


Picostat




Picostat é um site que fornece análise estatística e ferramentas de visualização para vários conjuntos de dados. Ele também hospeda alguns conjuntos de dados que estão disponíveis publicamente, como o conjunto de dados Cars93. Você pode encontrar o conjunto de dados Cars93 no Picostat seguindo este link: [Cars93 Dataset on Picostat].Você pode baixar o conjunto de dados como um arquivo TXT clicando no botão "Download Data" no canto superior direito da página. Você também pode visualizar e editar o conjunto de dados online usando as ferramentas do Picostat.


GitHub




O GitHub é um site que fornece serviços de hospedagem e colaboração para projetos de desenvolvimento de software. Ele também hospeda alguns conjuntos de dados carregados por usuários ou organizações, como o conjunto de dados Cars93. Você pode encontrar o conjunto de dados Cars93 no GitHub seguindo este link: [Conjunto de dados Cars93 no GitHub]. Você pode baixar o conjunto de dados como um arquivo CSV clicando no botão "Raw" no canto superior direito da página. Você também pode visualizar e editar o conjunto de dados online usando as ferramentas do GitHub.


Carregando e explorando o conjunto de dados em R




Usando o pacote MASS




A maneira mais fácil de carregar e usar o conjunto de dados Cars93 em R é usar o pacote MASS, que contém muitas funções e conjuntos de dados para análise estatística. O conjunto de dados Cars93 é um dos conjuntos de dados incluídos neste pacote. Para usar o pacote MASS, você precisa primeiro instalá-lo executando este comando no R:


install.packages("MASS")


Então, você precisa carregá-lo executando este comando:


biblioteca (MASS)


Depois de carregar o pacote, você pode acessar o conjunto de dados Cars93 simplesmente digitando seu nome:


Carros93


Isso exibirá as primeiras linhas e colunas do conjunto de dados em seu console. Você também pode atribuí-lo a uma variável para manipulação adicional:


carros


Usando a função read.csv




Outra maneira de carregar e usar o conjunto de dados Cars93 em R é usar a função read.csv, que pode ler dados de um arquivo CSV. Para usar esta função, você precisa ter o arquivo CSV do conjunto de dados Cars93 em seu computador ou online. Você pode baixar o arquivo CSV de qualquer uma das fontes mencionadas acima, como Kaggle ou GitHub. Em seguida, você precisa especificar o caminho ou a URL do arquivo CSV como um argumento para a função read.csv. Por exemplo, se você baixou o arquivo CSV do Kaggle e o salvou em seu diretório de trabalho, pode executar este comando em R:


carros


Isso criará um quadro de dados chamado cars que contém o conjunto de dados Cars93. Você também pode especificar outros argumentos para a função read.csv, como cabeçalho, sep, na.strings, etc., para personalizar como os dados são lidos. Para obter mais detalhes, você pode verificar a documentação da função read.csv executando este comando:


?ler.csv


Estatísticas resumidas e visualização




Depois de carregar o conjunto de dados Cars93 no R, você pode explorá-lo usando várias funções e pacotes. Por exemplo, você pode usar a função de resumo para obter algumas estatísticas básicas de cada coluna, como média, mediana, intervalo etc. Você pode executar este comando no R:


resumo(carros)


Isso exibirá uma tabela que mostra as estatísticas resumidas de cada coluna no quadro de dados dos carros. Você também pode usar a função str para obter a estrutura e o tipo de cada coluna. Você pode executar este comando no R:


str(carros)


Isso exibirá uma lista que mostra a classe, o comprimento e os valores de cada coluna no quadro de dados dos carros.


Você também pode usar vários pacotes e funções para visualizar o conjunto de dados Cars93 usando gráficos e tabelas. Por exemplo, você pode usar o pacote ggplot2, que é um pacote poderoso e flexível para criar gráficos em R. Para usar este pacote, você precisa primeiro instalá-lo executando este comando em R:


install.packages("ggplot2")


Então, você precisa carregá-lo executando este comando:


biblioteca(ggplot2)


Depois de carregar o pacote, você pode usar a função ggplot para criar plotagens usando diferentes estéticas e geometrias. Por exemplo, você pode criar um gráfico de dispersão que mostre a relação entre preço e potência dos carros executando este comando no R:


ggplot(carros, aes(x = Preço, y = Potência)) + geom_point()


Isso criará um gráfico que mostra uma dispersão de pontos onde cada ponto representa um modelo de carro. O eixo x mostra o preço do carro (em $ 1.000) e o eixo y mostra a potência do carro (máximo).Você também pode adicionar outros elementos ao gráfico, como rótulos, títulos, cores, etc., usando diferentes funções e argumentos. Para mais detalhes, você pode verificar a documentação do pacote ggplot2 executando este comando:


?ggplot2


Conclusão




O conjunto de dados Cars93 é um conjunto de dados útil e interessante que contém informações sobre 93 modelos de carros à venda nos EUA em 1993. Foi criado por Lock (1993) a partir de duas fontes: a edição do Consumer Reports e o PACE Buying Guide. O conjunto de dados possui 27 colunas que representam diferentes características e atributos dos carros, como fabricante, preço, tipo, eficiência de combustível, tamanho do motor, potência, air bags, etc. O conjunto de dados é amplamente utilizado para análise e visualização de dados, bem como para fins de ensino e aprendizagem.


Principais conclusões e benefícios do conjunto de dados Cars93




Algumas das principais conclusões e benefícios do uso do conjunto de dados Cars93 são:


  • O conjunto de dados abrange uma ampla gama de variáveis que podem ser usadas para explorar vários aspectos da análise de dados, como estatísticas descritivas, exibições gráficas, correlação, regressão, classificação, agrupamento, etc.



  • O conjunto de dados também permite que os alunos comparem diferentes modelos de carros com base em seus recursos e preferências e aprendam sobre as compensações e escolhas envolvidas na compra de um carro.



  • O conjunto de dados está disponível em várias fontes online, como Kaggle, RDocumentation, Picostat e GitHub. Você pode baixar o conjunto de dados em diferentes formatos, como CSV, RData ou TXT.



  • O conjunto de dados é fácil de carregar e usar em R, seja usando o pacote MASS ou usando a função read.csv. Você também pode usar vários pacotes e funções para resumir e visualizar o conjunto de dados em R, como as funções sumário, str e ggplot2.



perguntas frequentes




Aqui estão algumas perguntas frequentes sobre o conjunto de dados Cars93:


P: Quantos modelos de carros estão incluídos no conjunto de dados Cars93?


  • R: O conjunto de dados Cars93 inclui 93 modelos de carros que estavam à venda nos EUA em 1993.



P: Quais são as fontes do conjunto de dados Cars93?


  • R: O conjunto de dados Cars93 foi criado por Lock (1993) a partir de duas fontes: a edição do Consumer Reports e o PACE Buying Guide.



P: Quais são alguns dos recursos e atributos dos carros no conjunto de dados Cars93?


  • R: O conjunto de dados Cars93 tem 27 colunas que representam diferentes características e atributos dos carros, como fabricante, preço, tipo, eficiência de combustível, tamanho do motor, potência, air bags, etc.



P: Como posso baixar o conjunto de dados Cars93?


  • R: Você pode baixar o conjunto de dados Cars93 de várias fontes online, como Kaggle, RDocumentation, Picostat e GitHub. Você pode baixar o conjunto de dados em diferentes formatos, como CSV, RData ou TXT.



P: Como posso usar o conjunto de dados Cars93 no R?


  • R: Você pode usar o conjunto de dados Cars93 em R usando o pacote MASS ou usando a função read.csv. Você também pode usar vários pacotes e funções para resumir e visualizar o conjunto de dados em R, como as funções sumário, str e ggplot2.



0517a86e26


1 view0 comments

Recent Posts

See All
bottom of page