人工智能基础名词理解

近期在研究相关的自然语言处理,难免会涉及到相关的机器学习等知识,对于非计算机专业的人来说杠开始一脸迷茫,再经过多次的理解和请教后,有了一个大概的认知,这里做一个记录。

人工智能

人工智能是一个比较广泛的概念,这个概念实际上指的是让机器像人一样思考,其最早由计算机科学之父阿兰图灵在1950年的一篇《计算机器与智能》论文中写出“如果电脑能在5分钟能回答由人类测试者提出的一系列的问题,且超过30%回答让测试者误认为人类所答,则电脑通过测试”,这段话也直接启蒙式的开启了人工智能领域的研究。

而“人工智能”一词,第一次出现在1956年,达特茅斯大学召开的学术会议室,由人工智能之父约翰·麦卡锡首次提出。

通常人工智能被分为弱人工智能和强人工智能,前者可以让机器有一定程度的学习、理解和推理能力,后者则是由自适应能力,比如解决一些之前没有遇见过的问题,我们常在电影里看见的机器人就是一种强人工智能。

机器学习

机器学习为人工智能的一个研究分支,也可以理解为弱人工智能的一种实现,而机器学习做的事情是让机器取模拟和实现人类的学习行为,以获得新的技能和知识。

人工智能领域的先驱Arthur Samuel在1959年给出的机器学习定义为“不直接编程,却能赋予计算机提供能力的方法”,而美国工程院院士Tom Mitchell则给出了一个更明确的含义,指出“机器学习是通过某项人物的经验数据提高了在该人物上的能力”。

机器学习最基本的是利用给出的算法来解析数据,从中学习到一定规则(模式)得到经验,并利用学习到的经验对类似的问题作出预测和判断。

而如今机器学习已在多个领域得到了很好的应用,大致上可以将机器学习的分为几个研究方向:

  1. 模式识别
  2. 自然语言处理
  3. 数据挖掘
  4. 计算机视觉
  5. 语言识别
  6. 统计学习

算法

前面提到机器学习需要给出算法来解析(学习)数据,以获得经验,而这个算法则包括我们常说的“神经网络”也是机器学习算法的一种,常见的算法有如下:

  1. 回归算法
  2. 神经网络算法
  3. SVM向量机
  4. 聚类算法
  5. 降维算法
  6. 推荐算法
  7. 决策树
  8. 朴素贝叶斯
  9. 其他算法

而根据这些算法可以分为监督学习无监督学习半监督学习强化学习,其中监督学习在日语中被称为“有老师的学习”,本质上是让机器学习带有“标准答案”的数据,然后再让机器学习做题,根据做题的结果对比标准答案,根据误差进行调整,经过多次反复,让机器的误差越来越小。

像上面这样在带有标签(答案)的数据上学习的过程被称为“训练”,而训练用到的数据被称为“训练集”,但也被叫做“数据集”,因为该数据集是被拿来训练的,所以被称为训练集,同样训练集在自然语言处理中被称为“语料库”。在训练集里面每一个数据被称为“样本”,在训练过程中反复针对误差作出的调整则被称为“调参”。

而训练出来的结果则为称为“模型”,模型其实也是算法,但为了区分,所以将机器学习的结果称为模型。模型可以用来针对训练集相似类型的问题去得到一个结论(值),这个过程则被称为”预测

无监督学习在日语中被称为“没有老师的学习”,这就意味着数据不含标准答案,机器可以发现数据与数据之间的关联,但无法发现数据与答案之间的关联,常见的无监督学习算法有聚类、降维等算法。

半监督学习是利用多个模型对同一个实例进行预测,如果这些结果多数一致,则可以将这个实例和结果放在一起作为新的训练集,由于半监督学习可以利用标注数据来丰富未标注数据,所以目前正是热门的研究。

之所以半监督学习这样热门是因为带有“标准答案”的数据集几乎都是由人工整理和标注,需要大量的人力、成本、时间,也被叫为“黄金数据(Gold Data)”,所以半监督学习则可以用少量的标注数据集来得到更多的标注数据集来减少其人工、成本、时间。

强化学习针对的是需要一系列彼此关联决策的问题,比如自动驾驶、电子竞技等,这类问题往往需要一边预测,一边跟着环境的反馈规划下一次决策。

特征工程

特征工程一般情况下分为“特征提取”和“特征模板”,特征提取指的是将我们要处理的实例转换为计算机能处理的数值类型的特征值,比如判断名字“沈雁冰”性别为例,特征提取则大概表示如下:

特征序号 特征条件 特征值
1 是否含“雁” 1
2 是否含“冰” 1

而对于大量的数据进行手动的特征提取是不太现实的,而需要定义一套特征模板来进行提取,比如一大堆的姓名数据,表示为name,那么可以定义name[1]+name[2]这样的特征模板,然后通过这个模板在相同类的样本中遍历组合则这一类的数据基本上各种情况的特征基本上覆盖完了。

深度学习

深度学习本质就是为神经网络算法,在2006年人工智能专家Geoffrey Hinton等人研究出一个名为“深度信念网络”,率先使用了“深度”一词,他们在这里面引入了一个叫“Greedy layer wise pre-training”策略,而其他研究者发现这个策略对于训练深层的神经网络很有效果,所以深层神经网络也叫深度学习。

参考文章

  1. 什么是机器学习?
  2. 人工智能、机器学习、深度学习、神经网络概念说明
  3. 神经网络啥时候改名叫“深度学习”了?
  4. 深度学习和人工智能之间是什么样的关系?
  5. 《自然语言处理入门》

Leave a Reply

Your email address will not be published. Required fields are marked *