SPSSModelerC5.0学习笔记

SPSSModelerC5.0学习笔记
学习资料
IBM SPSS Modeler 18.0 Applications 第8章
数据源描述
数据源名称:DRUG IN数据⽂件
应⽤模型微调
科技狂澜C5.0
深圳市龙华区基础教育
C5.0 节点可以构建决策树或规则集。该模型的⼯作原理是根据在每个级别提供最⼤信息收获的字段拆分
样本。⽬标字段必须为分类字段。允许进⾏多次多于两个⼦组的拆分。不⽀持交互式树创建
分析思路毛老虎
已收集了关于⾝患同⼀疾病的⼀组患者的数据。在过程中,每位患者均对五种药物中的⼀种有明显反应,您通过数据挖掘出适⽤于今后患有此疾病的患者的药物。
设计步骤
1、选取源节点“var.file”,读取外部数据源;
选中从⽂件读取字段名称Read file names from files
数据选项卡,可以覆盖和更改某个字段的存储(这⾥的存储不同于测量)
类型选项卡,可以帮助解数据中的更多字段类型。还可以选择 读取值 来查看各个字段的实际值
2、分析
(1)数据审核
(2)创建分布图,Drug设置为⽬标
选煤论坛
显⽰药物 Y 的对症患者最多,药物 B和C的对症患者最少
(3)创建散点图,Drug设置为⽬标,Na设置为x字段,K作为y字段
现在来看⼀下有哪些因素会对药物(⽬标变量)产⽣影响。
作为数值型变量的有Age,Na,k,散点图可以很好的挖掘多数值型输⼊和分类型输出之间的关系因此您可以使⽤药物类别作为颜⾊叠加来创建关于钠与钾的散点图。
导出新字段
由于钠与钾的⽐似乎可以⽤来预测何时可以使⽤药物 Y ,因此可以为每条记录导出⼀个包含此⽐值的字段。将“派⽣”节点(“字段选项”选项卡)附加到 DRUGln,然后双击此节点以进⾏编辑。
将新字段命名为 Na_to_K 。由于是通过将钠值除以钾值获取新字段, 所以请在公式中输⼈ Na/K 。
霍氏鲜清最后可以通过将“直⽅图”节点附加到“派⽣”节点来检查新字段的分布情况。在“直⽅图”节点对话框中, 将 Na_to_K指定为要绘制的字段,并将药物指定为交叠字段。
(4)创建⽹络图
作为分类型变量的有性别、BP、胆固醇,⽹络图可以反映不同类别之间的关系
3、选择C5.0模型节点
在派⽣节点后添加类型节点(如果省略了添加类型节点直接连接C5.0,会报错),读取Na_to_K字段的值,并指定Na和K字段⾓⾊为⽆;在类型节点后添加C5.0模型,运⾏
4、结果分析与评估

本文发布于:2024-09-22 17:33:10,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/55364.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:节点   类型   字段   药物
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议