什么是人工智能？人工智能的定义？欢迎大家娇流！

胡梦柯3 · 发表于 2017-11-14 11:09:00

人与生物则不同，从数据中抽象出的东西会放在神经网络中，出于建立网络代价与开销的原因（毕竟是实际要生理建立消耗巨大），以后做复杂任务时就有了利用它的可能与需要（电脑不同，已存于硬盘的要再利用它，设计者心想：我还不如用已有模型或者新建一个模型），他或它就会主动去将已有模型尽量利用起来，那就造成分析不会从模型一无所有开始，而是组合利用已有模型，没有的部分才会生成新模型，而模型之间的组合、调度，也会生成一类专门用于控制调度的模型了。

无火灰烬 · 发表于 2017-11-14 11:29:00

会学习，会思考的机器

　　　------等我水到十八级，我就回老家结婚。　　　

　　　--来自Windows Phone客户端

J101213 · 发表于 2017-11-14 13:56:00

几何重建的一个很重要的背景是，我们往往不需要追求十分精确的深度位置。比如，人对三维的感知其实都是非常不准的，它的精确度取决于你当前要执行的任务。在执行的过程中，你不断地根据需要来提高精度。比如，你要去拿几米以外的一个杯子，一开始你对杯子的方位只是一个大致的估计，在你走近、伸手的过程中逐步调整精度。

这就回到上面谈的问题，不同任务对几何与识别的精度要求不一样。这是人脑计算非常高效的一个重要原因。

胡梦柯3 · 发表于 2017-11-14 15:29:00

你是朱松纯教授的什么人啊？朱教授真的要算是人工智能的大牛了，以后我们能不能享AI高科技的福，很大程度上就靠他们这样强力、有能耐的人的推动了。

J101213 · 发表于 2017-11-17 14:12:00

几何重建的一个很重要的背景是，我们往往不需要追求十分精确的深度位置。比如，人对三维的感知其实都是非常不准的，它的精确度取决于你当前要执行的任务。在执行的过程中，你不断地根据需要来提高精度。比如，你要去拿几米以外的一个杯子，一开始你对杯子的方位只是一个大致的估计，在你走近、伸手的过程中逐步调整精度。

J101213 · 发表于 2017-11-17 14:14:00

这就回到上面谈的问题，不同任务对几何与识别的精度要求不一样。这是人脑计算非常高效的一个重要原因。
二、场景识别的本质是功能推理。现在很多学者做场景的分类和分割都是用一些图像特征，用大量的图片例子和手工标注的结果去训练神经网络模型 --- 这是典型的“鹦鹉”模式。而一个场景的定义本质上就是功能。当你看到一个三维空间之后，人脑很快就可以想象我可以干什么：这个地方倒水，这里可以拿杯子，这里可以坐着看电视等。现代的设计往往是复合的空间，就是一个房间可以多种功能，所以简单去分类已经不合适了。比如，美式厨房可以做饭、洗菜、用餐、聊天、吃饭。卧室可以睡觉、梳妆、放衣服、看书。场景的定义是按照你在里面能够干什么，这个场景就是个什么，按照功能划分，这些动作都是你想象出来的，实际图像中并没有。人脑感知的识别区与运动规划区是直接互通的，相互影响。

J101213 · 发表于 2017-11-17 14:34:00

为了想象这些功能，人脑有十分丰富的动作模型，这些动作根据尺度分为两类（见下图）。第一类（左图）是与整个身体相关的动作，如坐、站、睡觉、工作等等；第二类（右图）是与手的动作相关的，如砸、剁、锯、撬等等。这些四维基本模型（三维空间加一维时间）可以通过日常活动记录下来，表达了人的动作和家具之间，以及手和工具之间的关系。正因为这一点，心理学研究发现我们将物体分成两大类，分别存放在脑皮层不同区域：一类是跟手的大小有关，跟手的动作相关的，如你桌上的东西；另一类是跟身体有关，例如家具之类。

达芬奇会踢足球 · 发表于 2017-11-17 14:36:00

百度索菲亚

J101213 · 发表于 2017-11-17 14:37:00

有了这个理解，我们就知道：下面两张图，虽然图像特征完全不同，但是他们是同一类场景,功能上是等价的。人的活动和行为，不管你是哪个国家、哪个历史时期，基本是不变的。这是智能泛化的基础，也就是把你放到一个新的地区，你不需要大数据训练，马上就能理解、适应。这是我们能够举一反三的一个基础。

回到前面的那个STC-PG解译图，每个场景底下其实就分解成为一些动作和功能（见STC-PG图中的绿色方片节点）。由计算机想象、推理的各种功能决定对场景的分类。想象功能就是把人的各种姿态放到三维场景中去拟合（见厨房解译图中人体线画）。这是完全不同于当前的深度学习方法用的分类方法。

J101213 · 发表于 2017-11-17 15:31:00

三、物理稳定性与关系的推理。我们的生活空间除了满足人类的各种需求（功能、任务）之外，另一个基本约束就是物理。我们对图像的解释和理解被表达成为一个解译图，这个解译图必须满足物理规律，否则就是错误的。比如稳定性是人可以快速感知的，如果你发现周围东西不稳，要倒了，你反应非常快，赶紧闪开。最近我们项目组的耶鲁大学教授Brian Scholl的认知实验发现，人对物理稳定性的反应是毫秒级，第一反应时间大约 100ms。

我们对图像的理解包含了物体之间的物理关系，每个物体的支撑点在那里。比如，下面这个图，吊灯和墙上挂的东西，如果没有支撑点，就会掉下来（右图）。这个研究方向，MIT认知科学系的Josh Tenenbuam教授与朱松纯都做了多年。
更多大数据和人工智能资讯欢迎关注钱塘号http://www.qthmedia.com

		自动登录	找回密码
密码			立即注册

什么是人工智能？人工智能的定义？欢迎大家娇流！

本帖子中包含更多资源

本帖子中包含更多资源