En

物联网,大数据,人工智能,构建智能世界的技术金字塔

2021-02-26 人工智能

作为世界上最大的博物馆之一,巴黎卢浮宫坐拥数万馆藏,除了闻名世界的《蒙娜丽莎》,其中还有另外一个作品雕塑“菲迪皮德斯”。这座雕塑的名字也许并不耳熟能详,但它背后的故事和由此诞生的“马拉松比赛”几乎风靡全球。

古希腊时期,菲迪皮德斯为了把马拉松战役取得胜利的消息传递回去,在长途跋涉42.195公里后去世了。他所传递的信息在现在看来也就一个比特大小,却为此付出了生命的代价。

这么多年来,人类一直在关注怎么去进行信息的采集、传输、计算,以至于生成知识和获得智能,当然也包括近几年的人工智能(AI)浪潮。

人工智能已经经历了很多的浪潮,现在主要是由AlphaGo引起的第三波浪潮。深度学习技术已经在围棋领域第一次实现了机器对人类的全面胜利。除了下棋以外,在其他一些领域,人工智能也已经做得非常好了。当然还有很多事情,可能对人来说非常简单,但对机器却非常难,比如根据一副图去写一些话或一个故事。

人工智能离不开领域内经常讲的“ABCDE”。A是算法(Algorithm),B是大数据(Big data),C是计算(Computing),D是领域知识(Domain knowledge),还有E是指生态(Echo system)。

总的来说,现在的深度学习仍是一种基于一定数据的统计规律学习,对我们所处的物理世界深度了解,而数据基本上来自物联网设备(比如各种摄像头等等)采集得到的各种数据。

所以,提起人工智能,有两个话题是绕不过去的:智能物联网和大数据。

智能物联网

文明是人、社会与物理世界的有机融合。在这一复杂的融合过程中,包括环保、灾害、安全等多方面的问题需要妥善解决。当然有很多途径可供采用,但最主要的方式可能依旧是通过一些设备和方法来对事件进行感知、预判,精确地了解世界。

总的来说,我们需要对世界更透彻地感知,更全面地互联互通。物联网(Artificial Intelligence & Internet of Things,AIoT)作为信息系统向物理世界的延伸,它极大地拓展了人类认识世界、改变世界的能力。可以说,物联网是信息技术的第三次革命浪潮。

到底什么是物联网?具体的说是智能物联网,基本上可以从三个层面来拆解这个概念:普通对象设备化、自治终端互联化和普适服务智能化。普通对象设备化就是对任何东西都赋予它一些智能,使其变成一种感知设备。第二是自治终端互联化,即任何设备都是互联的,建构一个万物互联的世界。而普适服务智能化则指的是所有的服务都是智能化的。

物联网整体上就是一个基于互联网、传统电信网等信息承载体,让所有能够被独立寻址的普通物理对象实现互联互通的网络,并提供智能服务的载体。智能物联网发展到现在,大概经历了几十年,现在已经非常普及。也许在生活中大家并没有注意到,但实际上智能物联网已经遍布我们身边。

智能物联网也是一种“今天和明天”的技术,此前的七八年间大家更多地在谈论人工智能,但下一步真正能够落地的或许是人工智能物联网,是一种基于设备、基于行业的智能技术。智能物联网以物联网、互联网、大数据、人工智能融合创新,来引领我们未来的产业发展。

物联网:智能感知技术

物联网方面主要面对的挑战有三,也是物联网的三个核心:感、传、算。

首先须得有个东西去了解世界,也就是感知技术。人感知世界的方法主要有视觉、听觉、触觉、嗅觉和味觉。机器感知则是利用各种信号,比如无线信号等等,并借助一些智能的推理方法,来获取物理世界的一些信息,比如人员是否存在、如何运动,他的行为、思想状态、物体的状态等等各种不同的信息。感知的方法有很多,比如常见的振动传感器、加速度陀螺仪、光传感器、视觉方法、声音、无线信号等等,都可以用来感知、理解世界。

所谓“传”,就是把感知到的内容传回来。最后,要对传过来的信息进行处理,即要做计算功能。当然所有过程都必须要有能量来支撑。所以说物联网是感、传、算以及能量四个方面来组成。不同设备的形式不太一样,但基本离不开这四部分。

通过有限的设备感知无限世界

物联网现在遇的一大困局是:很多时候大家发觉容易感知的信息难以传输,而易传输的信息难以感知。比如高精度视频,这很容易感知,但是高清视频耗传输带宽太大,很多设备可能没有能力将其传回。另外还有些东西可能容易传输,比如说目标人物今天高兴不高兴,是什么样的语气、心情,什么感情,这很容易传输,信息量不大,但不容易感知。

传输、感知之间往往有这种不对称、不协调的情况。当然所谓的难和易也依赖许多限制条件,所以说难易也是一个相对的概念,比如你到底要什么设备,是不是有能量等等。但总的来说,感知和传输有这样的一个困局。比如现在所有人都有手机,为什么现在智能手机这么好用,当然除了系统做得好以外,离不开硬件能力的提升。比如说,一部智能手机里面有很多传感器——光照、加速度陀螺仪、距离感知等等,就可以了解很多信息。

随着产品的推陈出新,智能手机里面的传感器肯定会越来越多,可以测量的东西也越来越多。但依旧有一个困境无法通过增加传感器来解决:如何以有限的感知来感知一个无限可能的世界?一个智能手机再怎么能装东西,它的体积也是有限的,但我们要了解的东西是非常多的,所以接下来研究人员们就需要面对这样一个挑战:如何以有限感知的设备和能力来了解无限可能的世界。

要破局,有很多方法,比如说“无感而感”,也就是在设备水平无法进行传感的情况下,达到这样的能力。第二种叫做“跨域感知”,即通过不同的设备,拿到不同方面的部分信息,就像盲人摸象一样,再通过跨域感知来了解全局信息。第三种深度感知,是指利用现有技术把以往已获得但分析不透彻的信息进行深度挖掘,可以获得更多的信息。

目前在这一行业与学术界已经达成了一定的成果,例如此前我们团队曾跟一些企业合作,开发了一款可以进行手语识别的智能手表/手环。目前全中国有一两千万聋哑人,对于这些人群,我们可以通过这样一个穿戴式智能手表,在他们打手语的时候,对手语进行识别从而实现交互,为他们提供一种更方便跟外界做交互的新选择。

除此之外,智能手机还可以测量心跳,一部手机只要拿在手上或放在口袋里,就能测出你的心跳。这是通过跨域感知实现的。

神奇的“RFID”技术

这一领域内甚至还存在没有电池的感知。二战时期,苏联送给美国大使馆一个木头雕制的美国国鸟雕塑。美国人做了很多检查,发现没什么问题,就放到了他们大使馆。大概在七年后,一个英国大使馆的小伙子调收音机,却听到了美国大使馆的人在说话。大家去查声音的来源,第一次什么都没查出来。最后把这个雕塑卸开以后,发现里面有一根大概20多厘米的铁针。而这个神奇的窃听设备能够窃听既不需要电池,也不需要外来电流,却能捕捉300米以内大耗电量振荡器所发出的微波脉冲。这就是著名的“金唇”行动,即Great Seal Bug (The Thing)事件,是人类历史上第一个没有电池也可以感知周围声音的设备。

它的基本的原理是,人们说话的时候会有声波振动,振动会引起周围无线信号的一些变化。铁针通过外面传播给它的能量,从而产生一些微小的振动,通过反射回去的能量可以恢复人的声音。基于这一技术,在1971年,Mario Cardull发明了Radio Frequency Identification技术,简称“RFID技术”。他做了一个没有电池的小天线,通过另外一个读写器,发射能量打在天线上返回,就可以获取很多信息。

RFID现在使用的很多,有很多不同的技术,可分为无源、有源等。比如大家的食堂饭卡,有的更方便的食堂,在碗上就带有RIFD,不需要人工计价,只要盘子放到对应区域就可以知道具体价格。当然不同的技术可以实现的读写器和标签距离也不同,最远可能达到几十米到上百米,但通常情况下大概二十米左右的距离。RFID一般应用于仓储管理,比如像沃尔玛很多设备上都有标签。在二维码时代每件设备都需要手动扫描,但通过RFID标签,可以实现远距离、大批量的设备识别,大大提高了效率。但同时RFID目前也存在一些挑战,如漏读等。

如果未来RFID的定位距离精度能够提高到10-15厘米左右或者10厘米以内,就能可以实现很多有趣的应用。一位MIT老师就依托此技术做出了一个应用:将每个商品贴上RFID标签,顾客将商品放入购物车中,同时顾客钱包中装有RFID的银行卡,通过距离的关系,可以识别出购物车中的商品是哪位顾客,然后自动付款,这样顾客在超市就不再需要排队等待结账。

如果再前进一小步,把RFID定位精度提高到1厘米甚至1毫米,又会怎么样?目前我们在实验室能够做到毫米级的轨迹跟踪,可称之为“RIFD标签的高精度定位和跟踪”。如果这一技术能够应用于机场中的行李分拣环节,那将大大降低人工成本与人工分拣的错误率。

它也可以应用于检测高速运转物体的转速,从而得出机器是否工作正常。这种检测主要有两种方法,第一种是把标签贴在物体上跟踪物体,本质上是跟踪标签。但无法给物体贴标签时,如何对物体做高精度的定位和跟踪呢?

我们可以在一个空间中放置一些天线,利用这些天线接收无线信号,当物体在空间运动的时候,通过不断的读写RFID标签反馈的信息,根据标签反馈过来的信号强度,或者信号的相位和时间的信息,再利用信号打到物体上产生的反射信号的相位跟反射距离和波长的公式,很容易得出物体的位置信息。

目前这部分的研究主要有两大挑战。首先是设备的测量相位精度较低,设备相位精度影响定位精度,目前在理论上可以做到10^(-2)毫米级别的定位精度,但实际操作中还做不到。另外,由于相位跟波长成反比,所以波长越长,相位精度越高。如果可以利用高频小波长电磁波,就可以实现更精确的定位和知。

我们还可以通过深度学习达到识别目的。比如标签,通过形成一种能量的时空谱,将时空谱放到深度学习模型里面去做判断识别;比如运动,也可以建立时空的能量谱,用深度学习模型来判别这个人到底在做什么动作。像是在物理模型上的噪音等问题,都可以用深度学习去解决,也可以做很多智能的跨域感知。

这方面目前已经有了一些实验:比如美国学者根据拍摄的无声视频中实验对象的脸就能推断出其心跳等身体状况。类似工作我们自己也有做,比如学生在图书馆,不需要拍摄到他们的电脑,只通过拍摄他的桌面,就能知道电脑上在打什么字,单个字大概能到50%的准确率,对于一个句子,则有99%的准确率。它的原理很简单,因为敲键盘的时候,键盘在振动,桌面也在振动,所以根据桌面的振动规律,就可以反推电脑上在打什么字。

物联网:低耗互联技术

有了感知,接下来就需要用这些感知数据去做互联。我们在很多场景下都会遇到能量的瓶颈,最常见的就是手机或电脑的电量耗尽。但在很多场景下,是没有条件频繁更换电池的。还有一些场景是不能加入电池的。一些医学检测需要让病人把一个东西吞下去,比如以色列此前研发的具备感知能力的“药丸”,但它不能由电池提供能量,因为电池中有很多对人体有毒有害的危险物质。

在这类情况下,怎么解决电池供电的瓶颈?我们需要研发一些新的能量获取与网络模式,应用于传统方式解决不了的场景。比如在低功耗、无源通讯网络上,通过前文的RFID标签,在信息两端一方是没电池,一方有电的设定下,通过打过去反射回来,以此感知信息。这是目前美国和我们都在做的一项工作。

那么是不是有可能让两个都没有电源的设备来进行通信呢?也许听起来难以实现,实际上这样的技术已经发展出来了,就是所谓的“反射通信方法”。比如设备Alice要发射一个信号给设备Bob。Alice发射信号给Bob的时候,如果真的完全没有能量,是违背物理规律的。但Alice可以反射周围如电视塔或者wireless AP的能量,这么反射一下,就相当于告诉Bob“我在给你发一个东西“。对Bob来讲,若要知道Alice在不在发信号,就必须知道她是不是反射东西给了自己。而判断是不是反射,则须根据统计规律:当对方不发射信号时,通常收到能量只能来源于电视塔,这可能是一个统计的规律。一旦有反射信号,统计规律会相应变化,就知道对方给自己发信号了。通过这样一个简单的反射和统计规律的发现,就可以传递信息。这就是双方在没有电池、没有电源时,通过捕获在世界里无处不在的能量来进行通信和计算的方法。

反射通信方法——利用周围无处不在的无线信号能量

大数据

数据采集完毕以后该如何处理利用呢?现在有很热的一个方向叫“大数据”。什么是大数据?第一,数据要多;第二,数据要快速的处理;第三,数据的种类很多;第四,数据实际上很多时候且大部分是没有用的,我们要在沙里淘金,甚至淘都不太够,要琢,要真的用放大镜才能发现有用的东西。

理解大数据的概念,可以先看看人类科研的四大范式:

(1)第一种是实验范式,比如伽利略爬上比萨斜塔做了个实验,去发现一些规律。

(2)第二种是理论范式,比如牛顿和爱因斯坦不做实验,给出一些理论。

(3)第三种是仿真范式,是近100年出现的第三种范式。可能理论上有些东西,但跟实际可能有一些误差,自从人类有了计算机以后,可做计算机的模拟。我在美国读博的时候,是做火箭的,但不能说做火箭的时候去试一下,因为每次发火箭的成本太高,因此只能做模拟,这叫仿真范式。

(4)第四种是数据范式,出现在近二三十年。1998年图灵奖获得者吉姆·格雷在Microsoft提出数据范式。通过统计各种数据,从数据当中发现规律。

大数据确实有大用,未来学家托夫勒就说过,能够改变世界有四样东西:第一是暴力,战争是改变人类走向的力量;第二是知识,我们经常讲知识改变命运;第三是金钱,它可以改变世界。第四,最重要的,他认为大数据是第四种改变世界的力量。可以说正是科研的进步才可以让我们应用第四种“数据范式“。

大数据已经在很多方面有多方面的应用,例如:(1)在健康领域,尤其是个性化的健康医疗服务上;(2)个性化的教育上,由于疫情的影响,将来线上线下结合的教育可能会非常普及。大数据、物联网、人工智能在教育领域有很大的市场。(3)在社会科学上,像一些国家的竞选活动,都用了很多大数据来辅助他们的竞选。(4)现在也可以利用大数据做文学创作,大数据学习自动写稿子、写评论。(5)影视娱乐,比如《纸牌屋》电影,它就用了很好的大数据分析,分析选演员、写剧情、什么时间去放,效果最好。(6)城市交通,比如阿里在杭州做的指挥交通等,都是用大数据来做一些智能推断。(7)大数据用于个性化的广告上,比如蚂蚁金服就是个人的大数据精准画像,做个性化服务。再比如腾讯游戏,很多广告都是基于一个很大的领域,叫计算经济学,它的基础是大数据。

但是大数据还有很多挑战与困局。随着日益普及的物联网设备,数据量呈指数增长,几年后可能要将近180 ZB,但其中非结构化数据,即音频、视频等等将超过80%。这些数据给隐私保护带来巨大挑战。如果数据安全隐私没做好,所有的“好处“都是空中楼阁,很容易出问题。但为什么安全隐私比较严重,是因为数据孤岛现象很厉害,很多个人和企业都拥有各自的数据,但数据不能流通。

“数据隔离”之瓶颈

那么怎么能让数据不可见,但数据价值可用呢?数据隔离已经成为智能技术发展的一大瓶颈。这需要一些交叉学科的研究,比如计算科学、经济学、数据科学、法律法规等,这样才能让数据真正能成为21世纪的“石油“,让数据价值真正地流通起来。

漫画家彼得·施泰纳(Peter Steiner)于1993年7月5日在《纽约客》刊登的一则漫画:“在互联网上,没人知道你是一条狗”(英语:On the Internet, nobody knows you‘re a dog)。后来这句话渐渐流行起来,这一漫画也成了《纽约客》中被重印最多的一则漫画。的确,网络刚刚兴起的时候只是在提供互联的服务,只是在连接机器,它并不关心机器后面的人是男人、女人、小孩子、老人还是一只狗。

《纽约客》彼得·施泰纳(Peter Steiner)来源:知乎

但是现在随着搜索技术、大数据技术的发展,我们可以做人物的精准画像,“狗”无处可藏。人家知道是一只狗,在后面敲键盘。但技术在发展,个体意识、隐私保护需求也在增长。人们希望数据可用,但不可见,需要更高的价值和服务。即,“虽然我是一只狗,但你不应该知道我是一只狗”。整个人类的技术发展也可以分为这三个不同的阶段:从刚开始的不知道,到后来可以精准地知道,再后来去明确哪些东西是不应当知道的。

总地来说,大数据在未来必须和人工智能深度结合,即A(Algorithm)、B(Big data)、C(Computation)和人工智能深度结合起来。

人工智能,沙里琢金

从感知再到收集数据,数据本身是没有价值的,只有通过各种技术去挖掘数据背后的规律,沙里琢金才真的有用,这便是人工智能的用武之地。提起人工智能,必须要说图灵。他处在一个技术快速发展的好年代,但也是一个不够开放的差年代。在很多领域多作出了巨大贡献的图灵,还是在1954年自杀了。

Alan Mathison Turing,1912~1954

图灵在1950年提出了图灵测试:如果一台机器能够与人类展开对话,在不见面的情况下,人类不能辨别出来其机器身份,那么这台机器就算有了智能。

1956年,十位著名科学家在美国达特茅斯开会,第一次提出了Artificial Intelligence,研究人工智能的概念。后来大家都拿了图灵奖,其中有一位先生还拿到了诺贝尔奖。

1956年在美国达特茅斯学院的讨论会

人工智能经历了好几次浪潮。其中第二次发生在是1990年左右,当时日本提出来做第五代计算机,当时人工智能领域提了很多先进理念,就是因为技术等方面的不足,就夭折掉了。随着计算、数据等等技术的发展,第三次人工智能的发展浪潮来临的时候,很多在二、三十年前就已经存在的技术理论才真正开花结果。

有人在讨论目前算不算是人工智能爆发的前夜。虽然有很多人工智能公司已经成立起来,但很多公司在近些年内会面临发展困局。人工智能“深蓝”在1997年第一次交手便战胜了人类最好的棋手卡斯巴罗夫。现在AlphaGo也已经战胜了世界围棋冠军。虽然围棋比国际象棋难多了,但最复杂的还当属麻将。什么时候机器把人类麻将给赢了,那人工智能就又上了一个台阶。因为不论是国际象棋还是中国围棋,它都是一个能看到全局信息再做决策的游戏,但是麻将只看到自己的牌,很多信息是不知道的,这就将难度大大提高。

1997年5月“深蓝”电脑挑战卡斯巴罗夫

中国科大智能机器人“佳佳”

人工智能还能进行艺术“创作”。机器可以根据风格,可以把一张真实的照片变成一张艺术照,产生艺术风格的迁移等等。当然也可以有其他具体应用场景,比如在网上购物时虚拟试衣等等。这种类似于虚拟现实的实践,都需要人工智能技术的参与。

人工智能在日常生活当中还有很多其他应用。比如AI助理,游戏语音技术,智能音箱,自动驾驶,还有医疗、智能家居、安防等等。目前人工智能应用得最好的就在安防领域。现在很多安防企业都在抢滩布局人工智能,其中涉及人工智能的环节很多,从底层的芯片到中间的计算,到数据,再到深层的服务框架。

国家之间的竞争也愈发白热化,而对中国来讲,要想做好第三代人工智能,包括做自主系统,做生态,我们既要拥抱开放的世界,还要保证研发的自主程度。

人工智能任重道远

人工智能有三个阶段,从运算智能(即能存会算),到感知智能(即能听会说、能看会认),到最高级阶段的认知智能(即能理解、会思考)。

现在的人工智能研究基本上都还处在运算智能和感知智能的阶段,离认知智能还有比较远的距离。运算智能取得了很多的突破,感知智能也在慢慢的逼近和超越人类。在认知智能方面则有很大的挑战,包括数据的瓶颈、泛化的瓶颈、能耗、语义鸿沟和可解释性、可靠性、安全性等。

万物互联时代的人工智能,最好的技术是大家天天在用,但却感觉不到它的存在。未来我们的世界可能是无屏的,或是基于智能的交互、理解、服务,不再天天敲键盘输入东西。

人类一直在采集信息做计算,要解决三个方面的挑战:一是感知,二是计算,三是决策。目前很多机器、手机计算能力都已经很强了,但未来最可能真正改变人类命运的却是另一个计算模式:量子计算。量子计算可能会让以前人们认为人工智能无法做到的事情变得可行。可以说,以前的很多“游戏规则”,在量子计算以后可能都会改变。量子技术也不断有新突破,不久前中国科学家已经发布“九章”量子计算机,而未来如何,我们拭目以待。

来源:新浪科技