wangc
Feb 17, 2018
符号学习是指从功能上模拟人类学习能力的机器学习方法,它是一种基于符号主义学派的机器学习观点。按照这种观点,知识可以用符号来表示,机器学习过程实际上是一种符号运算过程。对符号学习,可根据学习策略,即学习中所使用推理的方法,将其分为记忆学习、归纳学习和演绎学习等。
基本模型
- 环境: 环境亦即学习环境,即指学习系统在进行学习时能够感知到的各种外界信息的总合。它是学习系统的外界信息来源,其中信息的水平和质量是影响学习系统设计的第一个重要因素。信息的水平是指信息的一般化程度,或者说指信息适用范围的广泛性。通常,信息的水平越髙,其一般化程度越髙,能适应的问题范围也越广。信息的水平越低,其一般化程度也越低,能适应的问题范围也越窄。信息的质量是指信息内容的正确性和信息组织的合理性等。通常,学习环境中信息的质量越高,学习系统的学习难度就越小,反之,其学习难度就越大。例如,如果环境的示例中有干扰,或示例的次序不合理,则学习环节就很难对其进行归纳。
- 学习环节: 学习环节是将外界信息加工为知识的过程。它先从学习环境获取外部信息,然后通过对这些信息的分析、综合、类比、归纳等加工,形成知识,最后再把所形成的知识放人知识库中。无论环境中信息的水平是高还是低,这些信息与执行环节所需的信息水平往往是会有差距的,学习环节的任务就是要缩小这一差距。如果环境提供的是髙水平信息,学习环节就是要补充遗漏的细节,以便执行环节能将其用于更具体的情况。如果环境提供的是低水平信息,学习环节就要由这些具体实例归纳出适用于一般情况的规则,以便执行环节能将其用于更广的任务。
- 知识库: 知识库是以某种形式表示的知识集合,用来存放学习环节所得到的知识。知识库的形式和内容是影响学习系统设计的第二个因素。知识库的形式是指知识库的结构方式及知识的存放形式,它与知识表示方法密切相关。知识库中的内容,除包括执行环节所形成的知识外,还应该包括学习所需要的初始知识。对学习系统,其初始知识是非常重要的,原因是学习系统不可能在没有任何知识的情况下凭空获取知识,它总是先利用初始知识去理解环境提供的信息,并依此逐步进行学习。学习系统的学习过程实质上就是对原有知识库的扩充和完善过程。
- 执行环节: 执行环节是利用知识库中的知识去完成某种任务,并把完成任务过程中所获得的一些信息反馈给学习环节的过程。执行环节和学习环节相互联系,构成了整个学习系统的核心。学习环节的目的就是要改善执行环节的行为,而执行环节的反馈信息又可以反过来促进学习环节改善自己的学习性能。
归纳学习
归纳学习是指以归纳推理为基础的学习,它是机器学习中研究得较多的一种学习类型,其任务是要从关于某个概念的一系列已知的具体例子出发,归纳出一般的结论,像示例学习、决策树学习和统计学习等都是典型的归纳学习方法。
- 统计学习:统计学习是一种基于小样本统计学习理论的机器学习方法,其最典型的学习方法是支持向量机(Support Vector Machine.SVM)。
- 示例学习(learning from examples) 也称实例学习, 它是一种有导师指导的归纳学习方法。其主要任务是从概念的一组正例和反例中归纳出一个一般性的概念描述,并使这个描述适合于所有的正例,排除所有的反例。
- 决策树学习
记忆学习
记忆学习(rote learning)也称机械式学习,它是通过记忆和评价外环境所提供的信息来达到学习目的的。在这种学习方法中,学习环节对外部提供的信息不进行任何变换,只进行简单的记忆。记忆学习又是一种最基本的学习过程,原因是任何学习系统都必须记住它们所获取的知识,以便将来使用。
演绎学习
演绎学习是指以演绎推理为基础的学习,解释学习是一种典型的演绎学习方法,它是在领域知识的指导下,通过对单个问题求解例子的分析,构造出求解过程的因果解释结构,并对该解释结构进行概括化处理,得到可用来求解类似问题的一般性知识。