机器学习的时代已来临-亚马逊CTO

教程大全 2025-07-21 06:56:06 浏览

亚马逊CTO:机器学习的时代已来临

2015-08-07 10:09:54以前的机器学习似乎是阳春白雪,只有大公司和尖端高校实验室才能玩得转。有这么一群人,他们的梦想是使机器学习技术变得下里巴人,让人人都能用机器学习。

亚马逊 CTO Werner Vogels 在香港会展中心举办的 Rise Conference 现场发表了关于机器学习的演讲,在这位AWS主架构师的眼里,Maching Learning 的时代无疑已经来临。

他表示,亚马逊内部已使用机器学习多年,包括尝试过滤商品下方的垃圾评论、通过注册姓名来辨别用户的男女性别,以及训练分拣机器人对不同形状物品的判断能力,以便能在陌生物品出现时进行抓握动作等。而亚马逊AWS的许多大客户(如社会活动网站Change.org),都要求亚马逊提供更多的机器学习功能。

因此,今年4月亚马逊 AWS 云服务家族宣布新添加这名新成员 ——Amazon Machine Learning。它是一项全面的托管服务,开发者无需具备任何机器学习经验,就能轻松使用历史数据开发并部署预测模型。有了它,AWS开发人员能更容易地从他们托管系统收集到的大量事务性和操作数据中挖掘价值。这些模型用途广泛,包括检测欺诈、精准营销、个性化推荐、文档管理等。

Werner Vogels 介绍说,通过使用亚马逊的机器学习技术,在没有任何机器学习经验的前提下,单个开发者可以在20分钟内解决之前需要两名开发者花费45天才能解决的问题,并且所建立的模型同样能够实现92%的精确度。

除了亚马逊外,微软旗下专注云服务的Azure也在今年二月推出了自己的机器学习工具,IBM在三月收购AlchemyAPI后,决定把AlchemyAPI的深度学习技术整合到Watson核心平台,增强Watson挖掘非结构化数据并识别出它们之间联系的能力。

以前的机器学习似乎是阳春白雪,只有大公司和***高校实验室才能玩得转。有这么一群人,他们的梦想是使机器学习技术变得下里巴人,让人人都能用机器学习。他们分布在两类从事机器学习技术研发的公司:

机器学习的时代已来临 专业造轮子

工程师们的一句口头禅就是“不要重复造轮子”,意思是告诫工程师们应该把主要精力放在满足需求上。但这句话不是绝对的,对于专业造轮子的工程师来说,造牛逼的轮子就是他们的需求。***类公司的工程师就是专业造机器学习轮子的人们。据我所知,目前世界成熟的***类只有Databricks和我们之前报道过的Dato两家,Petuum刚刚进入商业版本开发阶段。

这类公司有两个优势。一是研制机器学习技术平台需要极高的技术水准。虽然Google、Facebook以及国内的百度都有自研的机器学习系统,但都没有对外公开。二是机器学习技术平台有很广泛的应用,不管是面对企业提供API或者数据分析服务的公司,还是面对消费者提供智能服务的公司,都需要一个高效的机器学习技术平台。因此这种提供基础设施的领域有可能产生新的巨头,就像网络时代产生了思科网络设施巨头一样。

但这类公司也有隐忧。机器学习领域和诞生思科的硬件领域有一点不一样,机器学习领域存在牛逼的技术开源项目。目前Spark和Storm两个开源系统各方面都比较完善,对***类公司成长为巨头构成威胁。除了通用型的开源机器学习系统,还有特定用处的开源项目,比如用于深度学习的 Caffe、用于自然语言处理的 Stanford CoreNLP 以及数据预处理可视化的 Pandas。

这类公司并不是直接面对普通开发者,而是方便公司里的工程师们搭建大规模机器学习平台,让那些无力研制机器学习系统的公司也能方便地使用高效的机器学习。第二类提供 API 的公司是直接面对普通开发者的。

第二类公司提供机器学习的API。如果API有心愿,那么这个心愿一定是“调用我(Call Me)啊”。机器学习的API也分两类,一类是用公司自己收集的训练数据训练好的模型。比如AlchemyAPI提供的情感分析API,只需要用户提供文本或者文本的链接地址,就会返回该段文本蕴含正面情绪还是负面情绪。另一类是需要用户提供自己的数据训练API。比如Face++ 的人脸识别API就需要用户自己上传不同人物的照片。当然很多公司同时提供这两种API。更妙的是,有些深度学习模型,比如适合处理图像的卷积神经网络,允许先用公司收集的大规模训练数据进行训练,再根据用户提供的数据进行微调。

有了这些API,开发人员需要做的事情包括:1)处理好自己的数据,2)将处理好的数据扔给API得到结果,3)对于需要预先训练的API,还需要整理一份有正确答案的训练数据给API训练。开发人员利用这些API可以很方便地将机器学习运用在自己的产品中。

除了创业公司,巨头们也开始涉足这个领域,比如Google Predict API, Amazon Machine Learning和微软的Azure Machine Learning等等。

人人都能用机器学习

这两类的公司都致力于让机器学习的使用变得简单。MetaMind公司创始人Socher这样描述他创立MetaMind的初衷,“Google、微软和 Facebook的研究会影响到许多人。但是我感觉,如果你把这些模型提供给其他公司或者个人,让他们去研究,那么还有许多的潜力可挖”。为了提高易用性,MetaMind甚至允许用户使用拖拽方式训练模型和获取模型的预测。

除了上面两类技术导向型公司,大量公司是利用机器学习技术整合应用,来解决更多实际的痛点。机器学习的门槛降低,利用机器学习技术整合应用的难度会大大降低。比如有程序员在网上贴出了如何利用Clarifai图像物体识别API和Algolia搜索API给自己的Instagram照片建立检索系统。未来我们能见到更多集成了机器学习的酷炫应用。

机器学习产业的前进靠两个轮子,一个是技术,一个是数据。机器学习的使用门槛下降之时,对于大部分公司来说,谁能够收集管理更多的数据,谁拥有更好的开发数据价值的意识,谁就能为人们提供更好的智能服务,更好地解决人们的痛点。


寒假又来临了,我总算可以放下非常沉重的书包了,伤痕累累的背脊总算能有几日休息的时间了。 期末考试考得一般,至少在父母面前还过的过去。 一到寒假我就像一只上足了发条的机器一样从早上到晚都扒在电脑桌上。 作业也丢在一边不再问津了,打算在寒假结束前的几天狂做作业。 可是看似平常的和以往没有什么两样的寒假,却也发生了不少新鲜的事。 初六上午,爸爸带着我老早就起了床,因为滑雪场在莘庄那儿,单是路程来回就要花上四、五个小时。 十点我们就出发了,经过车子的几次转乘,最后乘地铁,终于到了莘庄。 一看表已是十二点多,就在附近的麦当劳吃午饭,草草了事。 下午,总算到了滑雪场,虽然已不是第一次来了,但还是给我带来了许多的新鲜感。 我们换上滑雪服,穿上了滑雪靴,戴上帽子与手套。 经过整装待发之后就扛着滑雪板拿着手杖踉踉跄跄的走进了人造滑雪场。 刚一进去,迎面就吹来了一股冷风,别提有多么的爽了。 滑雪场里的人还真多呀,初略一看就有二百多人。 我和爸爸先在平地上热热身,他滑的可比我要好得多了,他轻巧的弯下身子,用力得撑住手杖,滑雪板就自己向前移动了。 而我费尽了九牛二虎之力也只能移动一点点。 爸爸鼓励似的朝着我笑。 我不服气,就誓言要在下坡上赢过爸爸。 我和爸爸就扛着滑雪板上了坡道,这是我才感到真是累,扛着十多斤的滑雪板还要上坡道!上了第一个坡道以后,我们重新穿好滑雪板之后。 1!2!3!冲啊!我用力一撑整个身体就象是摆脱了缰绳似的野马一样,发了疯的以极快速度冲了下去。 风的呼呼声在我的耳边回响,我在冲的时候心里在暗暗的想:千万不要摔倒,千万不要摔倒,摔倒了就要被爸爸笑话的。 我左闪右避之后终于平安的滑到了地面,我也冲刚滑下来的父亲露出了自信的一笑。 我成功了!就这样又上了两次坡道以后,自己就已经大汗淋漓了,虽然这样,我还是享受到了滑雪带来的乐趣。 这样我在滑雪场疯狂了两个多小时才班师回朝。 在寒假的新鲜事还真不少。 我的寒假生活还真有趣啊!

本文版权声明本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系本站客服,一经查实,本站将立刻删除。

发表评论

热门推荐