当前位置:首页 > 小说大全 > 正文内容

「数据新星」Databricks 崛起启示录

2022-05-04小说大全228

在数据库领域,如果问当下谁最火,那一定排得上号。

去年8月,距离10亿美元的G轮融资刚过去7个月,再次获得16亿美元H轮融资,身价摇身一变成380亿美元,成为外界一致认为的超级独角兽。一直以来,数据领域备受关注,如果从2007年开始计算,全球的数据量至今已经膨胀了近200倍,数字化被写入战略规划成了各类行业的共识。

在数据量井喷的背景下,上云趋势也越来越明确,以、为代表的大数据公司应运而生,前者基于打造了云端的数据仓库,后者除了推出(湖仓一体),现在又押宝机器学习,试图包管数据在抵达机器学习之前的所有流程。

不同的是,已经从原来的infra向更广泛场景延伸,和昔日的伙伴同台竞技。与此同时,以AWS为代表的云巨头,也都曾战略性投资过,但现在也都在自研数据分析套件,竞合关系渐趋白热化,让数据基础设施的战火扑朔迷离。

01从0到1

企业的性格往往被它的创始人和技术背景所决定。

十几年前在UC 的AI实验室里,和伙伴发起Spark项目:做一个能够更轻松处理大量数据和机器算法的引擎崛起之科技巨头,并且开源了代码。相比较多数开源项目,面向的都是底层技术性强要求的infra工程师,spark面向更广泛的客户群,同时在上层加了很多的新的API,降低了技术门槛。

因为没有优秀的开发者社区运营和推广团队,Spark变现比较难,之后团队成员决定成立,以商业化方式推动Spark社区发展。即便Spark是过去硅谷的顶流产品,但这并没有让AWS等巨头买账,他们选择绕过,直接将Spark集成到自己的产品里。在卖产品还不如办Spark峰会收入高的时候, EMR已经针对Spark实现了几亿营收。

科技巨头txt全集下载_科技巨头小说_崛起之科技巨头

创始团队走了一条不被大众熟知的激进的路:云。

虽然不管对公司还是客户来说,云可以更快部署,也更容易维护,但正如联合创始人 Xin所说,大部分的人知道云是未来,但绝不是现在。当时只有小部分风投注资这家初创企业,New 的投资者Pete 说:“我们在的软件收入为零时投资,认为他们会在大流行中加速发展崛起之科技巨头,也许是一两个月,每个人都无法及时知道会发生什么”。和一样,他们也在赌未来。

图:年度融资及估值变动

2013到2015这三年,虽然有硅谷风投支持,也借力这些资金吸引人才,推出了基于云端的简化大数据处理平台 Cloud,但不管是招主管、找融资还是见客户,都会被质疑:真的不支持on-prem吗?

因为背靠Spark,很多客户甚至愿意年付几千万美金让提供咨询定制化项目,但做的是一个给数据工程师的平台,这是当时大部分公司闻所未闻的玩法,也是前几年商途不顺的原因之一。值得一提的是,彼时的云界开源前辈曾改名“Cloud Era”,可在当时的市场情况下,最终还是转向了on-prem做定制和售后支持才得以存活。

在这种逻辑下,云厂商把开源软件拿来经过简单的封装,再作为服务卖出去。由于这个过程只需要简单的部署和调试,工程成本极低,定价也不高,巨头从中赚走了大部分,这对来说相当于吸血,怎样和有钱有人的云巨头对抗,是亟需在技术上打造的壁垒。

科技巨头txt全集下载_崛起之科技巨头_科技巨头小说

他们赌的另一条路,是不做数仓。

彼时数据仓库竞争过于激烈,以亚马逊为首的巨头占据了大部分市场份额,继续小众打法:避开红海,尝试切入一个新兴却可能会有爆炸性增长的小市场,针对数据科学家、数据工程师和AI的方向做产品。

开源小公司的优势在于更懂项目,迭代更快,能够聚焦、死磕产品性能,而公有云大厂很难在单一方向投入最好的工程师。随着数据量的爆发,云的生态优势逐渐被认可,加上当时市面上也没有大量竞品,这给的产品带来了机会。

另一方面,在2019年微软投资之前,正巧CEO纳德拉推动云为先的战略,两家合作的Azure 进入了微软的企业许可协议。微软从一个大数据竞争劣势的云产品摇身成为业界领先,形成了云巨头三足鼎立的局面;因为几乎所有大企业都和微软有ELA,共生效应之下,客户原本买云买的预算自然流向了。

有人将创始团队比作一群幸运的加州嬉皮士RD,他们信仰技术,信仰来源,信仰共享和长期主义,这些也都成为了的底色。

02超级加倍

让所有人感到意外的是,2019年后,以绝无仅有的加速度在增长。

截至2021年2月,公司已经筹集了近20亿美元资金,包括由富兰克林邓普顿领投的10亿美元G轮融资,此时估值已经达到280亿美元;在经过最新轮融资后,亿的身价与三年前的62亿相比暴增了近13倍。

基本面决定价值,价值决定价格,如果将的成功仅归结于对技术犀利的洞察,借助了巨人的肩膀和好运气,这还远远不够。基于开源的创新是成长的关键,从大数据领域杀入云计算和AI,它的产品矩阵里包括、、以及开源分析引擎Spark等杀伤利器。

其中,超过80%的用户使用Delta Lake;为数据科学家提供了标准化的开源框架,下载量以每月80万的速度增长,拥有比Spark更多的用户;而可以让数据科学家在笔记本电脑上使用编程,调用几个API就可以将工作部署到大型的分布式Spark集群上,把社区的数据科学创新带给了Spark用户。

帮助其他企业构建自己的AI能力,透露出了的野心:从BI到AI,构建一个企业AI平台,因为认为,在企业计算领域,行业还没有出现头部的企业AI平台。

除了软件产品本身,的业务模式也有所不同。

传统的开源商业模式是软件免费,厂商收取支持和服务费用,这在on-prem里或许可行,但在云的世界就不一定了。在开发、软件运行、运营和托管方面向客户收费,采用SaaS开源的盈利模式,客户可以在本地开源平台下载免费的基础软件,同时也可以下载开源公司打造的其他付费版本。

不高估开源,也不低估市场,说:“在云端托管开源项目并把它们租给用户,客户流失率更低,利润增长更快”。SaaS租赁模式下,的核心知识产权没有存放在它所赞助的开源软件项目中,而是在它用来监管云端软件的工具中,这样避免了泄露的风险。

根据报告,最新ARR (年度经常性收入)达到6亿美元,相当于同财年12亿营业收入的一半,截至目前,后者市值近670亿美元,如果按照两倍之比来简单预估,亿的估值也比较合理。以新估值计算,的价值是当前ARR的63倍,相较于2020年的4.25亿美元,ARR近30%的增长率让投资者对它未来的收入十分看好。

图:与定价对比(来源:官网)

另一方面,通过对比官网收费方式发现,虽然是平台租出服务器的计算资源,但这些服务器整个系统都建立在主要的云厂商的基础服务上。以(左)为例,同样是以每秒粒度使用的计算资源付费,是平台和云厂商打包收费方式,客户对底层服务界面(如EC2)和上游的的成本花费要一次性付清,但比例是怎样无从得知,而打包之后需要支付给云厂商另外成本,这在无形中增加了费用风险。

(右)的玩法是分开收费,用户的账单主要分为两部分:常规的底层云厂商服务器租用成本,以及在这些服务器上的功能费用。客户使用底层器时,费用单独付给云厂商,并不算在的营收里。

所以如果对比营收,比如2020年的营收近6亿,但刨去付给云厂商的费用,和亿多的营收相比,也差不了多少。而这既是毛利率比高的原因,也是前者赚钱能力强的体现。有观点猜测迟迟不上市的原因,如果根据的说法,是为了避免二级市场所带来的波动,或许收费方式被迫改变等不可预测因素也在里面。

03天时地利人和

崛起之科技巨头_科技巨头小说_科技巨头txt全集下载

根据官网显示,除了为数据科学家、数据领导者与数据工程师提供角色解决方案,还利用大数据和AI为广告和营销、通讯服务商、教育、能源、联邦政府、金融、医疗等13类行业提供服务。

从类别数量上,要多于,此时全球已经有7000 多家组织(包括荷兰银行、康泰纳仕、H&M 集团、再生元和壳牌)依靠 实现大规模数据工程、协作数据科学、全生命周期机器学习和业务分析。

通常情况下,企业客户在进行数据架构时,第三方平台提供数据湖方案,在数据湖中做一些常见的数据工程;同时会有一个数据仓库,存放相当于数据湖5%-10%的结构化数据,来做BI等简单的数据分析。

但由于数据分裂在两个系统上,针对同一个客户问题分析,不同团队有不同权限,因而会看到不同版本的同一份数据,当得出不同结论后,做商业决策的团队不相信数据,进而导致底层数据平台失信,这是个很致命的问题。

将结构化和非结构化数据结合到一个地方,让客户在不移动底层数据的情况下执行数据科学和商业智能工作,是大数据发展的一个关键变化。于是,决定力推,能够直接在数据湖的低成本存储上,实现类似于数据仓中的数据结构和数据管理的功能,可支持BI到AI所有的工作流。

从的网页介绍上看,无论是数据工程、数据科学,还是机器学习都要依靠运行,加上过去使用低成本对象存储的数据湖的访问速度很慢,如今DB SQL提高了分析质量和性能,使数据湖在大数据集上的处理与数据仓库相媲美。

“是一个新赛道,这是一场地盘争夺战”,H轮融资之后,表示,这笔资金将主要用于加速的产品创新和市场开拓。与此同时,透露保留所有主要公共云的选择和灵活性,并将发展成传统数据仓库的替代品。

越来越多的企业乐于看到的实力和发展潜力,这和它本身的商业逻辑有关,业内传统企业如在营收额上虽高过好几个身位,但市值仍徘徊在40多亿美元。大剂量的资金注入后,选择并购来填补产品路线图中的空白或不足,重点是机器学习和数据初创公司,以及扩大与云公司的合作伙伴关系。

“云、开源、机器学习,这三个方面已成为每家企业战略的核心。我们真的很幸运能够处在这三大趋势的中心位置上。”在接受采访时说到。如果说2019年前看好的小部分风投是赌趋势,如今匆匆进场的其他机构也并没有迟到,因为在他们眼里,这家独角兽仍具备难以估量的增长能力。

分享给朋友:

相关文章

“不乱于心,不困于情,不畏将来,不念过往”何解?

不乱于心,不困于情,不畏将来,不念过往,何解?这个提问看似简单,可真正能做到的不敢说没有几个、而真正做不到的还是占的比例比较大,甚至有的人一辈子也做不到,是人都有七情六欲,要是一生清心寡欲那不是成神仙了么,只不过人与人做的程度和深浅不一样罢...

弃妃二嫁:王爷,休书请过目

弃妃二嫁:王爷,休书请过目

一年前,以救出养母为条件,她答应他的祖母嫁给他。成亲当天,他与妾室高调拜堂。而她,作为正妻被扔在喜房。 没有新郎,她自己扯下盖头,对婢女说道:“你觉得他今晚还会来么?若是不来,难道我要一直这样坐着等他?洗洗睡吧。”反正嫁过来就知道什么样,她...

《诗经》中的“昔我往矣,杨柳依依,今我来思,雨雪霏霏”有什么深意?

《诗经》中的“昔我往矣,杨柳依依,今我来思,雨雪霏霏”有什么深意?

读诗是要沉下心的,中国的古典诗词更要反复吟诵,然后闭目仔细体会其中的韵味,比如《诗经》里的这首《小雅·采薇》: 采薇采薇,薇亦作止。曰归曰归,岁亦莫止。靡室靡家,玁狁之故。不遑启居,玁狁之故。 采薇采薇,薇亦柔止。曰归曰归,心亦忧止。忧心烈...

因高速上发生口角,女子把老公骗下车并拉黑,你怎么看?

因高速上发生口角,女子把老公骗下车并拉黑,你怎么看?

交警高速搞路查,发现男子出奇葩。沿着道边护栏走,自言自语撅嘴巴。 交警停下忙问话,男子忸怩作应答,早前妻子把车驾,琐事争吵脾气发。你言我语不相让,争锋相对互责骂。 妻子路边车停下,说是自己好累哒,你快下车过来开,我去睡觉坐你那。 崽就知道...

老婆出轨被老公发现,老公愤怒失手把对方打残疾,要负法律责任吗

老婆出轨被老公发现,老公愤怒失手把对方打残疾,要负法律责任吗

老婆跟他人发生关系,老公发现后把对方打残了。这种情况下,老公不但要负法律责任,而且很可能还会犯故意伤害罪、入刑坐牢。 如果真的出现这样的结局,那这老公就确实是丢了夫人又折兵了。 因为,毕竟是他老婆自己跟他人发生关系的,并不是他人强迫的,而是...

恺兴文化《女总裁的贴身高手》即将开播,好看吗?

  近日,改编自恺兴文化旗下创别书城同名小说的超级IP网络剧《女总裁的贴身高手》发布了全新预告片,并将于5月20日在乐视网重磅首播。该剧讲述了叱咤商海的高冷女总裁云诗彤与退伍特种兵段飞,共同经历命运大起大落之后相恋的故事。   据悉,超级I...

2 第2820章 下一代天帝

2 第2820章 下一代天帝

叶伏天沐浴菩提树的佛光,和九十九重天上的所有修行之人一样,于菩提树下悟道修行。 在叶伏天的世界之中,他开始行走于无穷世界,想要近距离看看如今世界的衍化,小天道之下所孕育出的世界,如今走到了哪一步。 他看到了诸多规则秩序的完善,看到了无数个和...

狂妻来袭 九爷早安(秦北墨墨心儿)完整章节完结全文阅读

狂妻来袭 九爷早安(秦北墨墨心儿)完整章节完结全文阅读

言情爆文《狂妻来袭 九爷早安》完整版全文已完结,秦北墨、墨心儿是小说中的男女主角,作者:水千沫,讲述了:他是帝国一第一大家族的掌权人,手眼通天,冷酷狠厉... 小说简介 “九爷,心儿小姐说想去海边玩。”九爷便大手一挥,买下整座海岛,尽情玩!...

《全面战争战锤3》天灯有什么用?天舟与天灯作用特性介绍

《全面战争战锤3》天灯有什么用?天舟与天灯作用特性介绍

全面战争战锤3天灯有什么用?本作中不同帝国将会有各种武器装备可以使用,这里将为大家分享的是全面战争战锤3天舟与天灯作用特性介绍,这两种是震旦天朝飞行战争机器,一起来看下吧。 全面战争战锤3天舟与天灯作用特性介绍 天灯 天灯在战场上主要有...

老婆太强势,啥都按照她的来,遇到这种情况怎么办,大家帮帮我?

老婆太强势,啥都按照她的来,遇到这种情况怎么办,大家帮帮我?

正所谓“金无足赤,人无完人”。每个人都会有优点和不如人意的地方!夫妻要做到和谐相处,重要的不是想办法改变对方,而是要发自内心的相互包容和相互理解。只要不涉及家庭的所谓重大决策,夫妻间还是要多讲情,少讲理的! 根据你的描述,不难看出你老婆是一...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。