请选择 进入手机版 | 继续访问电脑版

人工智能论坛

 找回密码
 立即注册
楼主: J101213

什么是人工智能?人工智能的定义?欢迎大家娇流!

[复制链接]
发表于 2017-11-14 11:09:00 | 显示全部楼层
人与生物则不同,从数据中抽象出的东西会放在神经网络中,出于建立网络代价与开销的原因(毕竟是实际要生理建立消耗巨大),以后做复杂任务时就有了利用它的可能与需要(电脑不同,已存于硬盘的要再利用它,设计者心想:我还不如用已有模型或者新建一个模型),他或它就会主动去将已有模型尽量利用起来,那就造成分析不会从模型一无所有开始,而是组合利用已有模型,没有的部分才会生成新模型,而模型之间的组合、调度,也会生成一类专门用于控制调度的模型了。
回复 支持 反对

使用道具 举报

发表于 2017-11-14 11:29:00 | 显示全部楼层
会学习,会思考的机器

   ------等我水到十八级,我就回老家结婚。    

   --来自Windows Phone客户端
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-11-14 13:56:00 | 显示全部楼层
几何重建的一个很重要的背景是,我们往往不需要追求十分精确的深度位置。比如,人对三维的感知其实都是非常不准的,它的精确度取决于你当前要执行的任务。在执行的过程中,你不断地根据需要来提高精度。比如,你要去拿几米以外的一个杯子,一开始你对杯子的方位只是一个大致的估计,在你走近、伸手的过程中逐步调整精度。

这就回到上面谈的问题,不同任务对几何与识别的精度要求不一样。这是人脑计算非常高效的一个重要原因。
回复 支持 反对

使用道具 举报

发表于 2017-11-14 15:29:00 | 显示全部楼层
你是朱松纯教授的什么人啊?朱教授真的要算是人工智能的大牛了,以后我们能不能享AI高科技的福,很大程度上就靠他们这样强力、有能耐的人的推动了。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-11-17 14:12:00 | 显示全部楼层
几何重建的一个很重要的背景是,我们往往不需要追求十分精确的深度位置。比如,人对三维的感知其实都是非常不准的,它的精确度取决于你当前要执行的任务。在执行的过程中,你不断地根据需要来提高精度。比如,你要去拿几米以外的一个杯子,一开始你对杯子的方位只是一个大致的估计,在你走近、伸手的过程中逐步调整精度。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-11-17 14:14:00 | 显示全部楼层
这就回到上面谈的问题,不同任务对几何与识别的精度要求不一样。这是人脑计算非常高效的一个重要原因。
二、场景识别的本质是功能推理。现在很多学者做场景的分类和分割都是用一些图像特征,用大量的图片例子和手工标注的结果去训练神经网络模型 --- 这是典型的“鹦鹉”模式。而一个场景的定义本质上就是功能。当你看到一个三维空间之后,人脑很快就可以想象我可以干什么:这个地方倒水,这里可以拿杯子,这里可以坐着看电视等。现代的设计往往是复合的空间,就是一个房间可以多种功能,所以简单去分类已经不合适了。比如,美式厨房可以做饭、洗菜、用餐、聊天、吃饭。卧室可以睡觉、梳妆、放衣服、看书。场景的定义是按照你在里面能够干什么,这个场景就是个什么,按照功能划分,这些动作都是你想象出来的,实际图像中并没有。人脑感知的识别区与运动规划区是直接互通的,相互影响。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-11-17 14:34:00 | 显示全部楼层
为了想象这些功能,人脑有十分丰富的动作模型,这些动作根据尺度分为两类(见下图)。第一类(左图)是与整个身体相关的动作,如坐、站、睡觉、工作等等;第二类(右图)是与手的动作相关的,如砸、剁、锯、撬等等。这些四维基本模型(三维空间加一维时间)可以通过日常活动记录下来,表达了人的动作和家具之间,以及手和工具之间的关系。正因为这一点,心理学研究发现我们将物体分成两大类,分别存放在脑皮层不同区域:一类是跟手的大小有关,跟手的动作相关的,如你桌上的东西;另一类是跟身体有关,例如家具之类。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

发表于 2017-11-17 14:36:00 | 显示全部楼层
百度  索菲亚
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-11-17 14:37:00 | 显示全部楼层
有了这个理解,我们就知道:下面两张图,虽然图像特征完全不同,但是他们是同一类场景,功能上是等价的。人的活动和行为,不管你是哪个国家、哪个历史时期,基本是不变的。这是智能泛化的基础,也就是把你放到一个新的地区,你不需要大数据训练,马上就能理解、适应。这是我们能够举一反三的一个基础。

回到前面的那个STC-PG解译图,每个场景底下其实就分解成为一些动作和功能 (见STC-PG图中的绿色方片节点)。由计算机想象、推理的各种功能决定对场景的分类。 想象功能就是把人的各种姿态放到三维场景中去拟合(见厨房解译图中人体线画)。这是完全不同于当前的深度学习方法用的分类方法。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-11-17 15:31:00 | 显示全部楼层
三、物理稳定性与关系的推理。我们的生活空间除了满足人类的各种需求(功能、任务)之外, 另一个基本约束就是物理。我们对图像的解释和理解被表达成为一个解译图,这个解译图必须满足物理规律,否则就是错误的。比如稳定性是人可以快速感知的,如果你发现周围东西不稳,要倒了,你反应非常快,赶紧闪开。最近我们项目组的耶鲁大学教授Brian Scholl的认知实验发现,人对物理稳定性的反应是毫秒级,第一反应时间大约 100ms。

我们对图像的理解包含了物体之间的物理关系,每个物体的支撑点在那里。比如,下面这个图,吊灯和墙上挂的东西,如果没有支撑点,就会掉下来(右图)。这个研究方向,MIT认知科学系的Josh Tenenbuam教授与朱松纯都做了多年。
更多大数据和人工智能资讯欢迎关注钱塘号http://www.qthmedia.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|积分充值|小黑屋|手机浏览|人工智能实验室

GMT+8, 2018-11-19 04:15 , Processed in 0.727257 second(s), 15 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表