本文摘要:机器学习对许多人来说是一种新事物,因为它最近才沦为大众市场的不切实际工具,但其根源却有几十年的历史。
机器学习对许多人来说是一种新事物,因为它最近才沦为大众市场的不切实际工具,但其根源却有几十年的历史。机器从数据中自学的概念在20世纪50年代构建。
1988年,IBM公司将基于概率的数据算法的原理引进到以前基于规则的机器学习领域,从而彻底改变了这个行业。如今,很多人都在使用虚拟世界人工代理(例如Siri、Alexa、Google Now),利用机器学习搜集和分析从人们的交互中搜集的信息,以预测市场需求,并根据人们的偏爱自定义服务。
社交媒体网站用于该技术引荐和结识更好的朋友,同时在照片应用于中展开面部辨识,以节省人们的时间、精力和资源。但除此之外,机器学习现在还通过检测卡缴纳模式和提高在线购物交付给方式来维护人们免遭欺诈。当今的企业期望他们的数据需要分担一些艰巨的工作,并且期望降低成本,提升一致性,修改操作者。机器学习有助大规模构建这一目标,调研机构德勤公司的调查找到,在2018年,57%的企业减少了涉及技术的开支。
虽然该技术以前被视作一种过度开支,但如今它被解读为对企业未来的投资和具备竞争力的收益驱动力。数据专家和作者Bernard Marr回应,现在开发人员早已对算法和技术展开了试验,机器学习将沦为英国各地积极开展商业计划和支出的核心。
最近的研究反对这一众说纷纭,说明了了48%的欧洲的组织现在指出机器学习对其近期业务的发展至关重要。随着像亚马逊、Facebook和谷歌这样的公司之后推展机器学习技术的发展,那么如何充分利用近期和最差的算法?最顺利的企业将是那些投资于新技术,并明智地利用他们可以用于的技能和数据系统的人。因此,人们记得那些宣传和抹黑,要注目其最基本的方面。按顺序获取数据机器学习技术仅次于的特点之一是它的灵活性;它可以利用从供应链和库存掌控到工厂自动化和反复数据输出任务的一切。
每个应用程序都必须一个分开的存储库,在该存储库中可以搜集和操作者数据,以容许算法评估值。为了让机器学习算法获取明智的辨别和建议,底层数据库必需平稳地获取洗手、精确、详尽的数据。在最近由Vanson Bourne公司展开的调查中,近一半的的组织否认对数据质量服务展开了投资,以保证其数据可用作所有机器学习应用于。如果没数据质量和统合,人工智能技术就会之后提升癌症患者的存活率,也会使人工智能技术在国际象棋和围棋比赛中取得胜利,也无法转变生物化学的面貌。
投资的改变侧重于保证捕捉的数据具备尽量低的质量,而不是非常简单地尽量地不断扩大数据网的规模,这是一个显著的行业变化。将近十年前,专用的数据质量服务和工具是一种利基服务,并且在数据艰巨的业务中基本并未被充分利用。现在,它们是企业高管未来计划的重中之重。随着机器学习之后以更加低的速度发展,企业必需召募更好的数据科学家,并投资于处置此类算法的适当技术。
可信的高质量数据数据库使的组织更加相似将机器学习统合到他们的业务中,但如果企业的数据科学家没准确的资源,那么这种势头将不会弱化。数据科学家的建议在采取措施之前,企业必需考虑到他们期望加到到其软件生态系统中的各种编程语言,同时考虑到业务的最终目标,能用的编程技能以及每种语言的质量。研究指出,64%的的组织回应,倚赖机器学习来挖出大型数据集,并预测未来事件结果的预测分析是投资机器学习的关键动力。这种预测分析功能依赖数据科学家对必要编程语言的掌控。
那么如何掌控和取得?通过自学、实验,以及向他人求教。根据2018年Tiobe Index的调查,Python沦为全球最风行的编程语言之一,并早已打破其竞争对手,主要是因为其具备非常简单性、可读性、多功能性和灵活性。随着全球数百万人自学和用于该语言,更加多的个人和团体在线分享程序、技巧和整个算法。Python的用户网络为期望用于和尝试Python的企业获取了大量的学习材料。
基于Python的技术也在不断涌现。3月4日,深度自学库TensorFlow的第二版Alpha发售。
TensorFlow 2.0允诺之后其前任作为世界上最热门的机器学习项目之一,享有更加普遍的Python库。用于Python脚本,可以更加精彩地利用数据科学社区的非常丰富科学知识和较慢变革。
最后,企业应当致力于获取一个基础数据基础设施,所有团队中的每个人都应当获取这些基础设施。对于商业智能团队来说,这一般来说是SQL(即使他们的工具分解它),但为了顺利构建这一目标,必需容许数据库科学家用于他们的选用语言(特别是在是Python)运营数据脚本。数据的标准化和民主化意味著企业需要以极具创造性和实验性的方式在所有和部分业务中应用于机器学习。使用云计算虽然内部部署的IT基础设施需要托管地许多开源框架来建构机器学习解决方案,但如今许多企业缺少有效地反对这些解决方案的能力和可扩展性。
例如,大多数企业目前没最重要的GPU计算能力,因为他们计划运营x86工作阻抗的容量,而平行工作的GPU服务器集群可能会大大加快深度自学算法的培训过程。如果企业正在评估项目的机器学习,则超大规模云平台可以获取基于消费的GPU计算出来采访。
它还获取额外的x86计算出来,用作建构高性能数据库分析的基础设施,然后算法可以借此展开数据分析。当市场需求从批量分析移往到动态(或最少是业务时间)时,涉及数据的流量必需与几近动态工作的机器学习算法的市场需求维持实时。
可以利用云计算弹性来保证在整个项目的生命周期中反对工作阻抗,并使企业可以权利地尝试机器学习功能,而会受到资本开支决策的妨碍。的组织将业务扩展到云端未曾如此精彩,因为AWS、谷歌、亚马逊三大公共云提供商都在为机器学习业务而大大希望。尽管如此,去年的BI to DA Analytics研究找到,只有30%的的组织利用云计算的弹性和可扩展性,并通过机器学习从的组织的数据中提供价值。数据分析和机器学习基础设施对于以数据为中心的的组织而言至关重要。
期望投资新技术战略的企业应当保证他们的分析数据库基础设施需要同时在内部部署和云计算应用程序上运营,让他们可以权利地在第三方数据中心和内部部署之间迁入工作阻抗,以优化成本和计划大大发展其运营地区的数据管理拒绝。虽然机器学习的复杂性和应用于有可能看上去令人生畏,但获取启动机器学习项目的基础设施比许多人想象的更加不切实际。事实上,企业早已在其标准IT流程中用于他们所需的技术:数据库、编程语言、基础设施即服务。
为了优化机器学习的下一步,这些技术必需非常简单地用作有所不同的容量。随着更加多的的组织优先考虑到数据质量,并理解解读和应用于机器学习的益处,他们将享用更佳的决策和降低成本的益处。随着市场竞争的激化,企业取得收益更加无以,使用机器学习将沦为其业务南北顺利的途径。
本文来源:开云真人(中国)官方网站,开云(中国)Kaiyun·官方网站-www.ymzhi.com