下面谈感知行为的模拟,感知属于“知其然不知其所以然”的行为。比如人脸识别,我们认识张三,可是我们很难描述张三长什么样子。也就是说,我们无法使用传统的编程方法把张三的脸描述出来。有了机器学习的方法,通过学习训练就能帮助我们解决这类难题。这从一个侧面解释了机器学习和深度学习为什么现在这样受欢迎,因为它使感知行为的计算机模拟成为可能。
下国际象棋属于“知其然又知其所以然”的问题,我们大体上能够说清楚“马为什么怎么走”,“兵为什么向前移一步”等等。但下围棋不然,大多数情况下,围棋大师们说不清楚他为什么这么“落子”。过去围棋程序我们一直按照与象棋类似办法做,结果最高只能达到业余水平。当我们在蒙特卡洛树搜索传统模型基础上加上深度学习,一下子使AphaGo不仅提高到专业水平,而且打败世界围棋冠军李世石。下面介绍机器学习在模式识别中的应用。首先是图像处理,这里包括物体检测、物体分类、物体识别和运动物体检测与跟踪等。目前达到的水平是,在给定的数据库下,物体分类可以达到或者超过人类的水平。我们实验室在这方面的工作成果,在下午的论坛会上王生进教授会专门介绍。关于生物特征识别,包括人脸、指纹、掌纹、视网膜(虹膜)、DNA、签名、姿势、键盘敲击的行为等。这也是企业关注的技术,我们系也有很多这方面的工作。其中声纹识别即用声音识别说话人,我们系郑方教授在声纹研究和推广应用上做了很多工作,取得很好成果。其实,在声音信号处理上,企业感兴趣的还有,语种识别、口音识别、语音识别、性别识别、情感识别等等。
利用模式识别技术从事产业开发的公司很多,但大多数产业规模不大。这里需要企业家的努力,设法把这类企业做大做强。
最后关于行为的模拟,这里所指的“行动”,既包括人类的手脚的动作,还包括动物和人造机器(如车辆、船只)的运动。由于时间关系,我只能简单提一提。第一是工业机器人,这个大家很熟悉,对我们来讲主要是突破和掌握关键技术。第二是服务机器人,包括家庭服务、医疗、助老助残、教育与娱乐等。尽管国内外都重视这方面的企业发展,但目前推向市场的产品还很少,发展服务机器人的关键是要解决可靠性和智能化的问题。
最后谈一下无人车问题,目前国内外正在研制的“无人车”,不同程度上都有人的参与,因此严格地讲应该属于自动辅助驾驶。根据目前的人工智能技术,这类车辆有可能在短期内走向实用。而真正无人参与的无人车,特别是在开放环境(如繁忙的街道)下行驶,目前的人工智能技术还难以解决其面临的困难问题,因此短期内还难以走向实用。由于大众对“无人车”的认知是,“完全无人参与”的全自动汽车,为了避免产生误导,在宣传时应该把这个概念说清楚。
就讲这些,谢谢大家!
本文来源:不详 作者:佚名