深入解析SAS
深入解析SAS:数据处理、分析优化与商业应用
夏坤庄 (作者), 徐唯 (作者), 潘红莲 (作者), 林建伟 (作者)
基本信息
· 出版社: 机械工业出版社; 第1版 (2015年1月1日)
· 丛书名: 数据分析技术丛书
· 平装: 863页
· 语种: 简体中文
· 开本: 16
· ISBN: 7111483405, 9787111483403
· 条形码: 9787111483403
· 商品尺寸: 23.8 x 18.4 x 4.6 cm
· 商品重量: 1.42 Kg
· 品牌: 机械工业出版社
编辑推荐
《深入解析SAS:数据处理、分析优化与商业应用》编辑推荐:SAS软件研究开发(北京)有限公司资深技术人员经验结晶,SAP大中国区商业创新首席架构师鲁百年强烈推荐。实战性强,结合商业案例细致呈现SAS的优化建模方法,深入讲解SAS数据处理、统计分析及时间序列,涵盖引领大数据潮流的SAS高性能分析,以及智能分析平台、解决方案、平台的安全性与高可用性等重要领域。
名人推荐
SAS引领大数据时代的发展,产品线覆盖了数据分析的各个方面,包括高性能分析、可视化分析和云计算等诸多新领域。但是从何处开始学习SAS、如何在实际工作中使用和部署SAS,却让很多初学者感到困惑,这时如果有长期使用SAS的专业人员把他们的宝贵经验分享出来,将会给大家更多的指导和帮助。而本书的几位作者恰好具有优秀的专业背景和丰富的SAS实践经验,其中,夏坤庄先生有5年多的时间在客户一线从事SAS产品咨询和项目实施工作;且在最近的9年中,他作为SAS研发北京中心客户职能部的总监,在进行产品研发的同时还在对SAS全球客户提供技术支持。而其他几位作者作为夏坤庄先生的同事,同样有着丰富的实践经验。本书的实战指导性非常强,它的结构体现了SAS核心内容的学习路线图,内容包括了SAS的核心技术模块乃至整体架构体系,并运用了很多源自实际应用的案例,非常适合广大数据分析从业者的需要。
——刘政博士,SAS软件研究开发(北京)有限公司总经理
我与本书作者之一夏坤庄先生在我行的一个大型项目中有着成功的合作。合作过程中,夏坤庄展现出了卓越的专业能力、项目把握能力及一丝不苟的敬业精神,以至于我团队中那些昔日的成员即使现在已身为分行或支行的行长,仍然会尊敬地回忆当年的夏工是如何手把手教导他们设计和开发的。现在,夏坤庄及其团队通过本书将他们丰富的知识和成功经验进行了总结和提炼,在对简单和优美的追求中,完成了对SAS系统的完整和深入介绍,满足了复杂的数据分析和大数据应用时代的要求。本书是不可错过的优美之作。
——张晓波,中国工商银行软件开发中心上海研发支持部总经理、《计算机上的银行》作者
大数据时代的核心是数据的分析和利用,分析利用的关键是模型和挖掘。本书不但通俗易懂地向大家介绍了数据分析的方法和应用案例,而且通过对SAS高性能及SAS应用架构规划的解析,对如何将数据分析的方法和应用部署到大数据环境中,满足海量数据和大规模运算的要求做了清楚的介绍。是一本难得的好书!
——鲁百年博士,SAP大中国区商业创新首席架构师
本书将统计分析和SAS应用成功地结合在了一起,既能够让熟悉统计理论的学习者有信心和能力将统计方法应用到现实中去,也能够让熟悉SAS的人有底气和理论高度在商业环境中选择和运用统计的分析方法。尤为难得的是,本书涵盖了预测及优化的丰富内容,并且结合复杂生动的案例对理论和方法进行了阐述。无论是对数据分析和SAS的初学者来说,还是对有不错基础的从业人员来说,本书都是很好的学习材料!
——赵彦云博士,中国人民大学统计学院院长、中国人民大学竞争力与评价研究中心主任中国统计学会副会长
作者简介
夏坤庄,SAS软件研究开发(北京)有限公司客户职能部总监。在承担大量产品研发工作的同时,夏坤庄及其团队负责对SAS非英语市场提供技术支持,并且与在美国及其他地区的团队一起,对SAS的SaaS客户提供服务,以及提供和验证关于SAS产品和技术的最佳实践。在加入SAS软件研究开发(北京)有限公司之前,夏坤庄就职于SAS中国公司。在SAS中国公司期间,历任资深咨询顾问、项目经理、首席顾问、咨询经理,在SAS的技术与产品领域拥有丰富的咨询和项目实施经验。在超过15年的从业经历中,为SAS的金融行业客户成功实施了众多深受好评的项目,所承担的项目获得诸如人民银行颁发的“银行系统科技进步一等奖”和客户系统内部颁发的“项目开发特等奖”等。拥有数学专业的学士学位和自动控制理论及应用专业的硕士学位。
徐唯,SAS软件研究开发(北京)有限公司资深分析咨询师,主要负责为SAS亚太地区客户提供高端商业分析与优化的咨询服务,拥有为国际客户提供数据挖掘和优化建模服务的丰富经验,例如为某大型国际汽车制造公司在中国业务的库存优化项目提供服务,以及为国际知名银行的信用卡审批流程优化提供优化建模服务等。本科和研究生均毕业于南京大学数学系。
潘红莲,SAS中国公司资深咨询顾问,为中国区客户提供SAS解决方案和产品的方案咨询和技术支持。于2008年加入SAS后,曾任SAS软件研究开发(北京)有限公司解决方案架构师,提供SAS解决方案和产品在企业级应用的方案研究和设计,尤其在IT实施和产品集成策略等领域做出了突出的贡献。对SAS架构设计、系统管理、安全性,以及高可用性等方面有着深刻的理解和丰富的实践经验。毕业于北京航空航天大学,获计算机专业学士和硕士学位。
林建伟,现就职于SAS软件研究开发(北京)有限公司,任资深分析咨询师。研究领域为大数据处理、数据挖掘、预测优化、库存优化、图论及相关应用。参与国内外多个客户的SAS预测与优化项目的咨询工作,例如为某海外银行的信用卡审批流程优化提供优化建模服务。美国西密歇根大学博士,在国际知名刊物上发表多篇专业论文。
目录
前言
Preface
第一篇SAS编程和数据处理
第1章BaseSAS基础
1.1SAS系统简介
1.2启动SAS软件
1.2.1SAS窗口环境模式
1.2.2非交互模式
1.2.3批处理模式
1.2.4交互式行模式
1.2.5配置文件和AUTOEXEC文件
1.3SAS窗口环境
1.3.1SAS资源管理器
1.3.2程序编辑器
1.3.3日志
1.3.4结果
1.3.5输出
1.4SAS文件和逻辑库
1.5一个简单的SAS程序
1.6SASStudio
1.7本章小结
第2章读取外部数据到SAS数据集
2.1SAS编程基本概念
2.1.1SAS逻辑库
2.1.2SAS数据集
2.1.3SAS逻辑库和数据集管理
2.1.4SAS系统选项
2.1.5SAS程序结构
2.2通过DATA步读取数据
2.2.1DATA步处理
2.2.2读取外部文本文件中的数据(初级)
2.2.3读取外部文本文件中的数据(高级)
2.3通过IMPORT过程读取外部文件数据
2.4访问关系型数据库系统中的数据
2.5SAS程序错误及处理
2.5.1良好的SAS编程风格
2.5.2常见错误及处理
2.6本章小结
第3章对单个数据集的处理
3.1选取部分变量
3.2操作数据集的观测
3,2.1SAS表达式
3.2.2选取部分观测
3.2.3操作所选取的观测
3.2.4分组与排序
3.3创建新变量
3.3.1数据集选项RENAME=和RENAME语句
3.3.2赋值语句创建新变量
3.3.3对多个观测求和
3.4循环和数组
3.4.1循环
3.4.2SAS数组
3.5SAS常用函数
3.5.1函数语法
3.5.2数值函数
3.5.3字符操作函数
3.5.4数值与字符转换函数
3.5.5与日期时间相关的函数
3.6将数据集写出到外部文件
3.7本章小结
第4章对多个数据集的处理
4.1数据集的纵向串接
4.1.1使用SET语句实现纵向串接
4.1.2使用APPEND过程实现纵向串接
4.1.3SET语句与APPEND过程的比较
4.2数据集的横向合并
4.2.1不使用BY语句实现横向合并
4.2.2使用BY语句实现横向合并
4.2.3使用数据集选项IN=操作观测
4.3数据集的更新
4.4数据集的更改
4.4.1单个数据集的更改
4.4.2两个数据集的更改
4.5数据集处理的一点补充
4.5.1使用数据集选项END=
4.5.2使用自动变量FIRST.与LAST.
4.5.3使用SET语句中的选项POINT=和NOBS=
4.5.4使用多个SET语句
4.5.5使用HASH对象处理多个数据集
4.6本章小结
第5章数据汇总与展现
5.1通过PRINT过程制作报表
5.1.1制作简单报表
5.1.2制作增强型报表
5.1.3改进报表显示
5.2通过TABULATE过程制作汇总报表
5.2.1制作基本汇总报表
5.2.2制作高级汇总报表
5.2.3改进报表显示
5.3通过GPLOT过程制作图形
5.3.1制作散点图
5.3.2制作连线图
5.3.3制作多幅图形
5.3.4制作气泡图
5.4通过GCHART过程制作图形
5.4.1制作柱状图
5.4.2制作分组柱状图
5.4.3制作饼图
5.5ODS输出传送系统
5.5.1选择或剔除输出对象
5.5.2创建多种格式输出文件
5.6本章小结
第6章SASSQL语言
6.1SQL语言概述
6.2使用SQL检索数据
6.2.1SQL的基本结构
6.2.2使用SQL对列进行操作
6.2.3使用SQL对行进行操作
6.2.4使用SQL对报表加工与生成数据集
6.2.5子查询
6.3使用SQL对表进行横向合并
6.3.1使用SQL对表进行内连接
6.3.2使用SQL对表进行外连接
6.4使用SQL对表进行纵向合并
6.4.1使用关键字EXCEPT对表进行纵向合并
6.4.2使用关键字INTERSECT对表进行纵向合并
6.4.3使用关键字UNION对表进行纵向合并
6.4.4使用关键字OUTERUNION对表进行纵向合并
6.5使用SQL管理表
6.5.1使用SQL复制、创建与删除表
6.5.2使用SQL插入行
6.5.3使用SQL删除部分行
6.5.4使用SQL修改表的列
6.5.5使用SQL更新列的值
6.6本章小结
第7章SAS宏语言
7.1SAS宏语言概述
7.2宏变量
7.2.1宏变量的定义
7.2.2宏变量的调用
7.2.3宏变量的查看
7.2.4宏变量的分类
7.2.5宏变量的删除
7.3宏函数
7.3.1在宏语言中调用SAS函数
7.3.2用宏函数处理算术与逻辑表达式
7.3.3常见的处理文本的宏函数
7.4宏
7.4.1宏的定义与调用
7.4.2宏的存储
7.4.3宏的参数
7.4.4宏与宏变量
7.5宏语言与其他SAS语言
7.5.1宏语言的编译过程
7.5.2宏语言与DATA步
7.5.3宏语言与SQL语言
7.6宏编程
7.6.1条件语句
7.6.2循环语句
7.7本章小结
第8章开发多语言支持的SAS程序
8.1多语言支持的基本概念
8.1.1语言/区域
8.1.2字符集和编码
8.2NLS相关的SAS选项
8.2.1语言/区域选项LOCALE=
8.2.2编码选项ENCODING=
8.2.3时区选项TIMEZONE=
8.2.4语言切换选项
8.3NL格式和NL输入格式
8.4字符串和字符处理函数
8.5文本字符串外部化
8.6本章小结
第二篇SAS统计分析和时间序列预测
第9章描述性统计分析
9.1基本概念
9.1.1总体、个体和样本
9.1.2简单随机抽样
9.1.3连续变量和分类变量
9.1.4参数、统计量和自由度
9.1.5随机变量及概率分布
9.2描述性统计量
9.2.1描述数据集中趋势
9.2.2描述数据离散程度
9.2.3描述数据分布形态
9.3MEANS过程的补充
9.3.1统计量列表
9.3.2选项WEIGHT=和WEIGHT语句
9.3.3输出SAS数据集
9.3.4WAYS语句和TYPES语句
9.4本章小结
第10章参数估计与假设检验
10.1参数估计
10.1.1点估计
10.1.2区间估计
10.2假设检验
10.2.1基本原理
10.2.2T分布与T检验
10.2.3TTEST过程
10.2.4单样本均值T检验
10.2.5独立双样本均值T检验
10.2.6配对样本均值T检验
10.3非参数假设检验
10.4分布拟合假设检验
10.5本章小结
第11章方差分析
11.1方差分析的基本原理
11.1.1方差分析的模型
11.1.2方差分析的基本思想
11.1.3方差分析的假设
11.2单因素试验的方差分析
11.2.1TTEST过程、ANOVA过程与GLM过程的区别
11.2.2使用ANOVA过程进行方差分析
11.2.3使用GLM过程进行方差分析
11.3显著因素下的水平间差异检验
11.3.1LSMEANS语句与MEANS语句的区别
11.3.2利用LSMEANS语句进行水平差异分析
11.4双因素试验的方差分析
11.4.1双因素试验概述
11.4.2利用GLM过程对不均衡数据进行方差分析
11.4.3有交互作用因素的方差分析
11.5本章小结
第12章主成分分析与因子分析
12.1主成分分析概述
12.1.1主成分分析的基本思想
12.1.2主成分的定义、计算与确定
12.1.3主成分分析难点探讨
12.2使用SAS实现主成分分析
12.2.1FACTOR过程与PRINCOMP过程的比较
12.2.2使用PRINCOMP过程进行主成分分析
12.2.3使用FACTOR过程进行主成分分析
12.3因子分析概述
12.3.1公共因子与特殊因子
12.3.2因子分析的计算过程
12.3.3因子分析与主成分分析比较
12.4使用SAS实现因子分析
12.5本章小结
第13章聚类分析
13.1聚类分析的概述
13.1.1聚类分析方法介绍与比较
13.1.2相似性的度量
13.2划分法与层次法
13.2.1使用过程FASTCLUS实现K均值聚类法
13.2.2使用过程CLUSTER实现层次法
13.3本章小结
……
第14章判别分析
第15章回归分析
第16章LOGISTIC回归分析
第17章时间序列分析
第18章SAS数据挖掘的—般流程
第三篇SAS优化建模
第19章运筹学概述
第20章线性规划
第21章运用PROCOPTMODEL建立线性规划模型
第22章PROCOPTMODEL程序设计
第23章整数线性规划和混合整数线性规划
第24章优化建模实例
第四篇SAS智能平台架构体系
第25章SAS智能平台及行业解决方案
第26章SAS应用的架构规划
第27章SAS智能平台安全管理
第28章SAS智能平台的高可用性