12月8日,宁波市*府与百度公司签订战略合作备忘录,百度将在宁波建设国内首个百度云智大数据产业示范基地。合作涉及智能制造、人工智能、云计算以及关系到老百姓教育、出行、医疗等方方面面的智慧城市。百度还可能将其世界领先的人工智能技术嫁接到宁波的无人驾驶汽车、仪器仪表、专用装备制造领域,为“中国制造”首个试点示范城市——宁波提供更强大的智力支持。
一个基地,三个“大脑”据了解,百度将会把落户于宁波保税区的国内首个百度云智大数据产业示范基地作为数据采集、分析、产业创新的根据地,从而延伸出教育、医疗、出行三个“大脑”,并在智能制造等领域与宁波企业合作,构建宁波大数据产业生态。
“大脑”一旦开动,便能够改变宁波市民的生活方式。比如,在医院,儿科部会记录早产儿和患病婴儿的每一次心跳,然后将这些数据与历史数据相结合来识别模式。基于这些分析,“大脑”可以在婴儿表现出任何明显的症状之前就检测到感染,这使得医生可以早期干预和治疗。再比如,在大学,流媒体视频课程和数据分析可以帮助教师跟踪学生的学习情况,根据他们的能力水平定制教学内容,以及预测学生的执行情况。而当你开车行驶在路上,每个红绿灯会根据车流量自动调整时间,最大程度地减少拥堵。或许过不了几年,无人驾驶也会在宁波成为现实。
挖金智能经济,百度与宁波不谋而合百度副总裁尹世明向记者介绍,百度目前践行是ABC大战略,A是ArtificialIntelligence(人工智能),B是BigData(大数据),C是Cloud(云技术)。
“目前,这三项技术正从实验室走向市场,百度也正在探索发展的路径,并结合地方的市场需求,开发新产品。”尹世明说,“宁波在智慧城市建设方面一直走在全国前列,拥有海量的数据储备与很好的数据优化远景。更加重要的是,宁波制造业基础雄厚、门类齐全,是全国首个‘中国制造’试点示范城市,在智能经济领域有着独到的眼光,制造业有着转型升级、发展生产服务业的迫切需求。而产品服务化、服务平台化也是我们的一个方向。”
此外,他表示,宁波是全球重要的汽车整车、核心零配件和汽车电子研发生产基地,拥有相关企业家,年行业产值突破亿元。百度公司当前正在全国进行无人车试验园区建设,在条件成熟的情况下,百度公司有意向与宁波相关企业在百度无人车内测、试验环境和应用推广平台,及产业化进程等方面开展合作。
“我知道宁波在各个细分领域有个单项冠*,拥有绝对的市场份额。比如全国三分之一的电表、水表、气表由宁波制造。我想我们完全可以把百度的人工智能、远程云控制与大数据采集分析技术应用在电表上,打造一款‘云电表’,做成细分市场的一个爆点,成为电表行业的创新标杆,卖遍全球。这也许是一条有别于其他公司的新路子。”尹世明说。
据悉,百度公司还承诺,将会把公司最具国际影响力的年会——“百度云智大会”从北京迁到宁波,助推宁波大数据及人工智能产业快速发展。
!看看百度和其他巨头的大数据有啥不一样大数据引擎三件套
百度大数据引擎一共分三个部分。
开放云:百度的大规模分布式计算和超大规模存储云。过去的百度云主要面向开发者,大数据引擎的开放云则是面向有大数据存储和处理需求的“大开发者”。
百度的开放云拥有超过1.2万台的单集群,超过阿里飞天计划的5k集群。百度开放云还拥有CPU利用率高、弹性高、成本低等特点。百度是全球首家大规模商用ARM服务器的公司,而ARM架构的特征是能耗小和存储密度大,同时百度还是首家将GPU(图形处理器)应用在机器学习领域的公司,实现了能耗节省的目的。
数据工厂:开放云是基础设施和硬件能力,你可以把数据工厂理解为百度将海量数据组织起来的软件能力。就像数据库软件的位置一样。只不过数据工厂是被用作处理TB级甚至更大的数据。
百度数据工厂支持单词百TB异构数据查询,支持SQL-like以及更复杂的查询语句,支持各种查询业务场景。同时百度数据工厂还将承载对于TB级别大表的并发查询和扫描,大查询、低并发时每秒可达百GB,在业界已经是很领先的能力了。
百度大脑:有了大数据处理和存储的基础之后,还得有一套能够应用这些数据的算法。图灵奖获得者N.Wirth(沃斯)提出过“程序=数据结构+算法”的理论。如果说百度大数据引擎是一个程序,那么它的数据结构就是数据工厂+开放云,而算法则对应到百度大脑。
百度大脑将百度此前在人工智能方面的能力开放出来,主要是大规模机器学习能力和深度学习能力。此前它们被应用在语音、图像、文本识别,以及自然语言和语义理解方面,被应用在不少App,还通过百度Inside等平台开放给了智能硬件。现在这些能力将被用来对大数据进行智能化的分析、学习、处理、利用。百度深度神经网络拥有亿个参数,是全球规模最大的,它拥有独立的深度学习研究院(IDL)和较早的布局,在人工智能上百度已经快了一步,现在贡献给业界表明了它要开放的决心。
与一些类似项目的对比在百度之前,业界已经有一些类似的思路,即有一些大数据能力的企业视图将自己在基础能力或者软件方面的优势释放出来。
Google:大数据时代的奠基者。对应到百度开放云,它有举世闻名的数据中心以及基于Colossus的云;对应到百度数据工厂,Google近年来为迎接大数据时代不断改造核心技术,包括比MapReduce批处理索引系统搜索更快的Caffeine,专为BigTable设计的分布式存储Colossus比GFS还要先进,Dremel和PowerDrill管理和分析大数据,以及Instant和Pregel。对应到百度大脑,Google提供的大数据分析智能应用包括客户情绪分析、交易风险(欺诈分析)、产品推荐、消息路由、诊断、客户流失预测、法律文案分类、电子邮件内容过滤、*治倾向预测、物种鉴定等多个方面。技术有BigQuery、趋势图等。
可以说Google与百度的思路最为接近,不过Google目前还未将它的大数据能力打包起来以一个新“引擎”的方式共享。毫无疑问,这在不久之后就会发生。
亚马逊:云计算的奠基者。亚马逊是IaaS(基础设施即服务),与阿里云非常相似。亚马逊在用户交易、个人偏好、经济领域的大数据能力可能比Google还要优秀,也被一些人视作这是亚马逊与Google竞争的唯一机会。亚马逊目前更多还是在云领域做贡献,虽然也有Redshift的方案,但在数据工厂和人工智能的开放上进展慢一些。
阿里巴巴:亚马逊对应回中国自然是阿里巴巴。阿里云是国内最早的独立运作的云部门。数据则是阿里三大核心战略之一,大数据也被摆到了阿里十分重要的位置,不懂技术的马云经常谈及大数据都有人调侃他应该改名DataMa。阿里在大数据基础设施领域确实取得了突飞猛进的进展,飞天、Apsara、跨机房5K集群都是知名的大数据项目,应对双十一、余额宝规模取现预测、广告业务高速增长等业务场景也证明了阿里的大数据能力。
阿里大数据的思路便是做大数据的集市,让阿里系之外的大数据能够跑在阿里苦心搭建的大数据机器上运转起来。不久之前阿里与东软合作,后者的业务未来都将部署在阿里云。这意味着东软客户的数据很可能会进入阿里的大数据体系。可以确定阿里将会推出类似大数据引擎的平台,将大数据能力完全开放出来。
相比百度,阿里在“数据工厂”这块应该是各有所长,在数据基础领域以及业务理解方面有着电商领域的专注,但人工智能这块跟百度比肯定会有不小差距。语音、图像和自然语言理解,阿里并没有多少积累,它更擅长处理结构化的数据。
其他电商玩家如京东和苏宁也有类似的云,与阿里和百度完全不在一个级别就不比较了。
Salesforce等软件公司:Salesforce近两年收购了超过5家与社交大数据相关的营销公司,目的是获取更多的数据。其他的软件厂商和方案厂商也有大数据引擎方面的布局,EMC、Oracle有对应的大数据处理软件,IBM有大数据行业方案,英特尔入股大了数据初创企业Cloudera,Cloudera推出的Impala比GoogleDremel还要快。Intel还推出了基于Hidoop的“大数据引擎”,加州伯克利大学AMPLab开发了名为Shark的大数据分析系统。
回到国内,华为在去年发布了大数据平台产品FusionInsight,还有百分点科技这样的基于大数据的推荐服务公司。而“天河2号”等独立超级计算机也对外宣称它们的超级计算能力将会逐步开放出来。
预览时标签不可点收录于话题#个上一篇下一篇