央广网天津6月30日消息(记者褚夫晴)中国科学院院士、清华大学教授张钹在世界智能大会上《基于大数据的人工智能》的演讲中表示,大数据是一种深度学习,而深度学习是一种大众化的工具,无需先验知识,有了数据便可进行一定程度的研究。但是深度学习也是有缺点的,基于大数据的人工智能需要大量样本做支撑,人工智能无法像人一样举一反三,推广能力差、鲁棒性差等使得人工智能要超过人类只是特定意义上的可能。
基于大数据的人工智能创造出了诸多奇迹,比如AlphaGo打败李世石,战胜柯洁。但是奇迹源于何处?张钹表示,日常生活中,人们常常感慨大数据的力量,计算资源的力量,但是没有看到背后算法的力量。AlphaGo获胜正是源于强化学习算法的能力。现代人工智能实现需要满足完全信息博弈、充分的数据、完全信息、信息具有确定性、单领域四个条件。若不满足这4个条件,现代人工智能技术实现就有困难。但是大多数情况下是不完全满足这4个条件的,如遇到复杂路况时的无人驾驶车,在多领域环境下对自然语言的理解,人工智能还尚不能完善处理。张钹表示,这些都是人工智能的局限。
“北美国家在大数据计算,方法、算法领域处于引领地位,我们如果不赶上,超过世界先进水平,就会越来越制约我们的原始创新能力。” 在清华大学上课可以连讲四小时不休息,年逾八旬的张钹说。张钹表示下一步我们要进行小样本的学习,如果样本少,可以借助大数据自动产生样本来强化学习。大数据为人工智能带来了机遇也带来了挑战,只有数据与知识的结合才能走向可解释的人工智能。
“把文本嵌入语义和载体搭建数据与知识的桥梁是我们现在在做的。”张钹说。