《R语言与数据挖掘最佳实践和经典案例》—— 1.3　数据集-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

《R语言与数据挖掘最佳实践和经典案例》—— 1.3　数据集

阅读量：7080 次

发布时间：2019-06-28

本文共 726 字，大约阅读时间需要 2 分钟。

本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一书中的第1章，第1.3节，作者：（澳）Yanchang Zhao，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3　数据集

本节简单地介绍本书中将要使用到的数据集。

1.3.1　iris数据集

在许多的科研著作中都在iris数据集上做分类操作。该数据集由3种不同类型的鸢尾花的50个样本数据构成 [Frank and Asuncion，2010]。其中的一个种类与另外两个种类是线性可分离的，后两个种类是非线性可分离的。这个数据集包含了5个属性：

Sepal.Length（花萼长度），单位是cm。

Sepal.Width（花萼宽度），单位是cm。

Petal.Length（花瓣长度），单位是cm。

Petal.Width（花瓣宽度），单位是cm。

种类：Iris Setosa（山鸢尾）、Iris Versicolour（杂色鸢尾），以及Iris Virginica（维吉尼亚鸢尾）。

screenshot

1.3.2　Bodyfat数据集

Bodyfat数据集由mboost包[Hothorn et al.，2012]提供。该数据集包含71行，每一行代表一个客户的信息。数据集包含10列数值型数据。

age：年龄。

DEXfat：以DXA计算的体脂重，响应变量。

waistcirc：腰围。

hipcirc：臀围。

elbowbreadth：肘宽。

kneebreadth：膝宽。

anthro3a：三项人体测量的对数和。

anthro3b：三项人体测量的对数和。

anthro3c：三项人体测量的对数和。

anthro4：三项人体测量的对数和。

DEXfat的值可通过其他的变量预测得到。

screenshot

转载地址：http://upjml.baihongyu.com/

你可能感兴趣的文章

刷脸进门、病猫识别，程序员撸猫太高端！网友：看完服了！

七牛云：基于Go开发的大数据平台

ES 5 新增特性汇总

Unity 游戏框架搭建 (八) 减少加班利器-QLog

Array · 数组去重

前端读取excel文件

JavaScript 计时器

Android依赖导入全攻略

如何编写一个可升级的智能合约

Canvas&Paint 知识梳理(5) Paint#setShader

我的《机器学习实战》读书笔记（1）

美景听听Ai语音导游，助力华为荣耀PLAY手机发布

js原型 && 继承

SpringBoot使用LomBok

IM即时通讯：如何跳出传统思维来设计聊天室架构？

阿里云MaxCompute携手华大基因打造精准医疗应用云平台，十万基因组计算成本降低至1000美金以内...

阿里云 ESS 弹性伸缩服务新功能来袭，更全面、更自动化的使用体验

java反射技术

javascript设计模式之 2 策略模式

新手学UI设计应该怎样入门？

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-08 04:43:00 当前IP: 52.14.193.97 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我