来源:当家网 日期:2022/9/19 16:05:23 浏览次数: 我要收藏
一、云计算
云计算可以被理解成一个系统硬件,一个具有巨大的计算能力、网络通信能力和存储能力的数据处理中心。数据处理中心本质上是大量服务器的集合,数据处理中心的功能、规模是以服务器的数量来衡量的。
比如,2015年北京市有2 000多万部手机、2 000多万部座机、七八百万台各种各样上网的笔记本电脑和台式电脑,以及七八百万台家庭的电视机机顶盒。中国移动、中国电信等电信公司处理所有北京市的上述信息的后台服务系统和数据处理中心拥有的服务器共计25万台。上海差不多也是20多万台。
谷歌处理全世界的互联网大数据且需要进行智能化处理,它需要多少服务器呢?据悉,谷歌有150万台服务器分布在全世界七八个地方,现在正在建设的服务器还有100万台。
云计算有三个特点。
第一,在数据信息的存储能力方面,服务器中能存储大量数据。
第二,在计算能力方面,每个服务器实质上是一台计算机。
与20世纪60年代、70年代世界最大的计算机相比,当代计算机的运算能力更强、占用空间更小。
第三,在通信能力方面,服务器连接着千家万户的手机、笔记本电脑等移动终端,是互联网、物联网的通信枢纽,是网络通信能力的具体体现。
由此可见,数据处理中心、云计算的硬件功能,具有超大规模化的通信能力、计算能力、存储能力,赋予其虚拟化、灵活性、伸缩性的特点。
服务商以IDC为硬件,以私有云、公共云作为客户服务的接口,向客户提供数据服务。就像居民通过水龙头管道向自来水厂买水一样,各类客户以按需购买的方式,利用IDC资源购买所需的计算量、存储量、通信量,并按量结算费用。资源闲置时也可供其他客户使用,这样就能够有效、全面、有弹性地利用云计算架构中的资源,既能同时为千家万户服务,又能使大量服务器不发生闲置。
二、大数据
大数据之大,有静态之大、动态之大和运算之后叠加之大。
数据量之大有三个要点。
第一是数据量大,例如大英博物馆的藏书能全部以数字化的形式存储。
第二是实时动态变量大。每一秒钟、每一分钟、每一小时、每一天,数据都在产生变化。全球70亿人约有六七十亿部手机,这些手机每天都在打电话,每天都在计算,每天都在付款,每天都在搜索。所有的动态数据每天不断叠加、不断丰富、不断增长。
“量变会引起质变”,就像累积60张静态照片可以形成一秒钟的实时电影,大量静态数据的存放也会不断更新、累积,形成新的信息。
第三是数据叠加处理后的变量之大。
人们根据自身的主观需求,对动态的、静态的数据进行处理分析、综合挖掘,在挖掘计算的过程中,又会产生复核计算以后的新数据。这种计算数据也是数据库不断累计的数据。
总之,所谓大数据之大,一是静态数据,二是动态数据,三是经过人类大脑和计算机处理、计算后产生的数据,这三者共同构成大数据的数据来源。
大数据若要转化为有用的信息、知识,则需要消除各种随机性和不确定性。数据在计算机中只是一串英语字母、字符或者阿拉伯数字,可能是混乱的、无序的。
数据应用一般有三个步骤:数据——信息,信息——知识,知识——智慧。
第一步,数据变信息。
任何结构化、半结构化或非结构化的数据本身是无用的、杂乱无章的,但数据经过分析去除随机性干扰以后,就变成了有指向的信息。数据变信息的处理过程用的工具有滤波器、关键词,滤波以后提炼出相关的信息。
第二步,信息中包含的规律,需要归纳总结成知识。
知识改变命运,但知识不简单地等于信息。如果不能从信息中提取知识,每天在手机、电脑上看再多的信息也没用。
第三步,有知识后要运用,善于应用知识解决问题才是智慧。
综合信息得出规律是将信息转化为知识的过程。有的人掌握了知识,对已发生的事讲得头头是道,但是一到实干就傻眼,这是没智慧的表现。
所谓智能,实际上就是在信息中抓取决策的意图、决策的背景等相关信息,最后在“临门一脚”时能够做出决策。信息和知识是辅助决策系统,它们帮助人做出决策,人根据机器做出的决策实施,这就是智能化的过程。
所谓大数据蕴含着人工智能,就在于把杂乱无章的数据提取为信息,把信息归纳出知识,通过知识的综合做出判断,这就是大数据智能化所包含的三个环节。
三、人工智能
第一,人工智能如何让数据产生智慧?
大数据之所以能够智能化,能够决策,能够辅助决策,是因为在人工智能或计算机操作过程中有四个步骤:一是采集、抓取、推送,二是传输,三是存储,四是分析、处理、检索和挖掘。
第一步,在大数据中不断地过滤出有一定目的意义的信息,也就是采集、抓取、推送。
第二步、第三步是传输和存储,内涵不言自明。大数据之大,不是在抽屉里静态的闲置大数据,而是在云里存储、动态传输的大数据。
第四步是分析、处理、检索和挖掘,关键技术在于算法。算法是辅助人类在非常繁杂、非常巨大的海量数据空间中,快速找到目标、路径和方法的工具。
第二,人工智能依靠大数据在分析、处理、检索和挖掘中产生智能的关键在于大数据、算法以及高速度的计算处理能力。
没有数据和大数据的长期积累、重复验证,有智能管理也没有用;有了算法和大数据,没有高速度的计算能力也没有用。算法是人工智能的灵魂,它变得“有灵气”需要用大数据不断地“喂养”,不断地重复和训练。在这个意义上,大数据如果没有算法,就没有灵魂,就没有大数据处理的真正意义。但是如果算法没有大数据来“喂养”,即使数学家想出好的算法,智能也未必有效。
以柯洁与阿尔法围棋的人机大战为例,阿尔法围棋中的算法是来源于人类各种各样的棋谱、高明棋手的下棋步骤。人工智能工程师将这些数据全部放入谷歌的算法中运行,运行了几万次、几十万次。因为有网络深度学习的模块,每运行一次就聪明一点。这个过程是一个不断反复、不断学习的过程。
总而言之,人工智能、大数据和这些要素有关,转化为真正人工智能的时候,一靠大数据,二靠算法,三还要靠高速度。
人类对工具使用的发展,本质上是一个计算能力不断提高的过程。在农业社会,中国人曾用自己的聪明智慧发明了算盘。算盘一秒钟两三个珠子拨动,每秒计算两三下。到了工业社会初期,电被广泛运用。20世纪20年代,以继电器作为基本器件的计算机问世。继电器计算机震动频率非常高,每秒抖动几十次,比算盘快10~20倍。到了20世纪40年代,第二次世界大战期间,电子管问世。电子管计算机每秒可计算几万次,是继电器计算机的1 000倍,运算速度非常快。到了20世纪60年代,半导体问世,以三极管、二极管为元器件的电脑,一秒钟能运算几十万次到几百万次。到了20世纪80年代,半导体芯片问世,集成电路计算机的运算速度到达每秒几千万次甚至几亿次。
中国的超算在10年前达到了亿次,2015年前后到了10亿亿次,最新推出一个超算系统已经超过100亿亿次。
但是,超级计算机不是一个芯片、一个电脑的运算速度,而是几千个电脑、几千个服务器组合而成一个矩阵和一个算法。超级计算机能够做到一秒钟10亿亿次、100亿亿次,但单个芯片难以达到每秒运算10亿亿次。
我们为什么非常重视一个芯片每秒能计算10亿亿次呢?在2012年出版的《奇点临近》一书中提到,大概二三十年后,人造机器的计算速度将超过人脑。作者提出,人脑的运算速度是每秒计算10亿亿次。当计算机到了每秒计算10亿亿次以上时,其运算速度将超过人脑,拐点就会到来。
从科学的角度讲,人工智能的计算能力不断增强,是人对工具使用的智慧不断发展的结果。强大的计算能力、大数据、算法连在一起,超越了几千小时、几万小时、几十万小时,人无法等待的时间,使得大智慧逐步发展。
第三,云计算、大数据、人工智能的软件植入在云计算厂商提供的数据处理中心硬件中,对客户形成三种在线服务。
云计算的云是一个硬件,是一个具有通信能力、计算能力、存储能力的基础设施。云中除了存放大数据之外,同时提供各种各样的算法作为一种服务软件处理。大数据公司往往在搜集、组织管理了大量数据的基础上,使用人工智能算法后为客户提供有效的数据服务,形成一个大数据的服务平台。
所谓的人工智能公司,往往是依靠大数据平台支撑提供算法服务,算法软件也是一种服务。它们共同形成了“数字化”的三大功能:第一个是IaaS,是基础设施作为使用的服务;第二个是PaaS,是大数据的平台作为使用的服务;第三个是SaaS,算法软件也是一种服务。这三个词组代表了“数字化”三兄弟,三种功能不同的软件。
当然,“数字化”也离不开互联网、移动互联网和物联网。一句话解释就是,互联网的时代是PC(个人电脑)时代,移动互联网的时代是手机加笔记本电脑的时代,物联网时代就是万物万联的时代。
|