这一部分介绍的是无监督机器学习方法。该主题与前两部分有所不同。在无监督学习中,类似分类和回归中的目标变量事先并不存在。与前面“对于输入数据X能预测变量Y”不同的是,这里要回答的问题是:“从数据X中能发现什么?” 这里需要回答的X方面的问题可能是:“构成X的最佳6个数据簇都是哪些?”或者“X中哪三个特征最频繁共现?”
第10章介绍了无监督学习中的聚类(将相似项聚团)方法,包括k均值聚类算法。第11章介绍了基于Apriori算法的关联分析或者称购物篮分析。关联分析可以用于回答“哪些物品经常被同时购买?”之类的问题。无监督学习部分的最后一章,即第12章将介绍一个更高效的关联分析算法:FP-growth算法。