博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《R语言与数据挖掘最佳实践和经典案例》—— 1.3 数据集
阅读量:7080 次
发布时间:2019-06-28

本文共 726 字,大约阅读时间需要 2 分钟。

本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一 书中的第1章,第1.3节,作者:(澳)Yanchang Zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3 数据集

本节简单地介绍本书中将要使用到的数据集。

1.3.1 iris数据集

在许多的科研著作中都在iris数据集上做分类操作。该数据集由3种不同类型的鸢尾花的50个样本数据构成 [Frank and Asuncion,2010]。其中的一个种类与另外两个种类是线性可分离的,后两个种类是非线性可分离的。这个数据集包含了5个属性:

Sepal.Length(花萼长度),单位是cm。
Sepal.Width(花萼宽度),单位是cm。
Petal.Length(花瓣长度),单位是cm。
Petal.Width(花瓣宽度),单位是cm。
种类:Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)。

screenshot

1.3.2 Bodyfat数据集

Bodyfat数据集由mboost包[Hothorn et al.,2012]提供。该数据集包含71行,每一行代表一个客户的信息。数据集包含10列数值型数据。

age:年龄。
DEXfat:以DXA计算的体脂重,响应变量。
waistcirc:腰围。
hipcirc:臀围。
elbowbreadth:肘宽。
kneebreadth:膝宽。
anthro3a:三项人体测量的对数和。
anthro3b:三项人体测量的对数和。
anthro3c:三项人体测量的对数和。
anthro4:三项人体测量的对数和。
DEXfat的值可通过其他的变量预测得到。

screenshot

转载地址:http://upjml.baihongyu.com/

你可能感兴趣的文章
刷脸进门、病猫识别,程序员撸猫太高端!网友:看完服了!
查看>>
七牛云:基于Go开发的大数据平台
查看>>
ES 5 新增特性汇总
查看>>
Unity 游戏框架搭建 (八) 减少加班利器-QLog
查看>>
Array · 数组去重
查看>>
前端读取excel文件
查看>>
JavaScript 计时器
查看>>
Android依赖导入全攻略
查看>>
如何编写一个可升级的智能合约
查看>>
Canvas&Paint 知识梳理(5) Paint#setShader
查看>>
我的《机器学习实战》读书笔记(1)
查看>>
美景听听Ai语音导游,助力华为荣耀PLAY手机发布
查看>>
js原型 && 继承
查看>>
SpringBoot使用LomBok
查看>>
IM即时通讯:如何跳出传统思维来设计聊天室架构?
查看>>
阿里云MaxCompute携手华大基因打造精准医疗应用云平台,十万基因组计算成本降低至1000美金以内...
查看>>
阿里云 ESS 弹性伸缩服务新功能来袭,更全面、更自动化的使用体验
查看>>
java反射技术
查看>>
javascript设计模式 之 2 策略模式
查看>>
新手学UI设计应该怎样入门?
查看>>