异构大数据分析引擎创业公司「炎凰数据」于近日宣布完成近亿元天使轮以及Pre-A轮融资。其中,天使轮由红杉中国种子基金、晨山资本、上海云基地联合投资,Pre-A轮则由蓝驰创投、信雅达联合投资。云岫资本担任独家财务顾问。
「炎凰数据」董事长何宁表示,这两轮融资所募资金将主要用于产品纵深研发和垂直领域应用的构建,进一步筑牢炎凰数据在自主构建新一代异构大数据即时分析平台的领先优势。
当前随着各行各业数字化进程的推进,数据源头和数据产生的方式也随之发生变化。并且在万物智联的场景下,连接设备取代人类行为已成为新的核心数据生产源,爆发式增长的非结构化/半结构化数据带来了新的海量数据存储和处理需求,也对即时交互式数据分析提出了全新要求。「炎凰数据」CEO叶晓路介绍,当前在新场景下产生的数据中,非结构化数据占据了80%,过去场景下占据主流的结构化数据只有20%。
然而之前,这些数据要么极少被访问,白白浪费存储成本;要么是需要经过写时建模(schema on write)的清洗、转换和预载(ETL)处理后才能使用。这个过程对企业来说耗费时间、人力和物力,提升了大量非结构化和半结构化数据为企业业务产生价值的门槛。这也是「炎凰数据」平台作为新一代异构大数据即时分析平台想要解决的问题。
在整体思路上,「炎凰数据」处理平台涵盖了数据处理生命周期的全过程。通俗来讲,其首先能够让数据在存储时无需经过复杂的清洗过程,降低这一步所需要的时间、人力和存储成本。另外,在对各种类型数据进行分析处理时,「炎凰数据」的平台可以实时把不同类型、完全未经清洗的数据源,根据场景中客户对数据源的实际需求整合在一起进行分析。叶晓路对比解释,在传统的数据处理方式中,企业开展这一工程可能需要以月为维度计算。并且,客户如产生叠加新数据源的需求,会让整个工程变得非常复杂,甚至需要重头来过。在具体的实操效果上,其以用户行为分析场景举例,当前「炎凰数据」平台根据接入数据量的不同,基本能以亚秒级的响应时间完成分析的反馈过程。
整体来看,「炎凰数据」的平台以降低成本、提升效率的理念,最终帮助客户提升数据驱动业务的价值。而之所以能达到这样的效果,和其采用的技术有关。从这一维度,叶晓路形象形容炎凰的平台为企业在内存中建立了一张适合存储非结构化数据的、无限宽度的表,并帮助企业在节约CPU、内存资源的情况下,达成业务目标。
从技术角度总结,这一平台以读时建模和ELT为核心,融合了写时建模的能力,提供了全面处理、分析和展示异构大数据的能力,又避免了繁琐的ETL。其中,从ETL转换为ELT,基本了达成数据免清洗的效果。读时建模和写时建模相比,由于前者不采取先写入数据,再读取、分析的固定路径,所以可以更灵活、高效地完成建模过程。并且,在面对使用频率较高的模型时,读时建模也可以转化为写时建模进行固定。
面对企业不断变化的业务和不同的数据处理要求,炎凰的数据平台无须重新导入或迁移数据,再加上大量开箱即用的图表,让数据变的更加全面、灵活和易用,可以快速跟上业务的迭代与变化,并且以低的成本帮助企业解决数字化转型的关键痛点。
并且,「炎凰数据」CTO王国栋还提到,从产品和技术上炎凰会持续在三方面发力:
1. 易用性。炎凰自研的兼容标准SQL语法的查询引擎,提供了读时建模灵活处理异构数据的能力。选择标准SQL作为分析语言,可以降低学习成本,让用户更快速的上手数据分析。炎凰提供的从数据采集到展示的全栈式服务,在安装平台后,可以立即导入数据,进行分析,验证结果,加快了数据产生价值的闭环。
2. 高效性。作为大数据分析工具,数据处理性能是重要的竞争力。炎凰选C++实现存储和计算引擎,能够从底层去控制并行计算的粒度,控制内存的使用,实现内存零拷贝。通过大量的工程优化,保证炎凰能高效地导入数据和处理数据。
3. 云原生。云原生是明确的技术趋势,炎凰通过云原生的架构,更好地适配各种云环境,提高资源利用率,根据业务量灵活弹性伸缩。让企业用户使用数据的时候更加简单,无需考虑背后的IT资源扩容和数据存储等底层的技术。
商业模式方面,「炎凰数据」董事长何宁提到,为适应各个规模企业,制定几大套餐功能组合,配以灵活的产品技术支持包,分别为社群版、专业版、以及SaaS版。收费层面,「炎凰数据」按使用计量付费,计量方式灵活,可根据数据量或者vCPU等方式。
「炎凰数据」目前的主要客户,都有明确数字化转型需求或正处在数字化转型过程中,具体包括金融、互联网等行业。叶晓路还提到,传统的Hadoop或ES方案无法很好地支持非结构化数据。这主要是因为,这些方案在ELT的过程中消耗大量资源,且无法很好地支持异构数据源的整合分析,因而无法满足客户新的增长需求。目前很多客户都在寻找新一代的针对异构数据进行即时分析的数据平台和引擎。所以他认为,像炎凰这种新厂商能够直接使用最新技术和理念来设计产品,具备明显技术优势。
另在垂直领域切入选择方面,「炎凰数据」首先选择了拥有IT运维,安全分析和用户行为分析等主流场景的客户,并在新领域拓展方面针对性投入资源,其中包含DevOps以及ProcessMining(流程挖掘)。在市场开拓方面,CMO吴红缨介绍到「炎凰数据」已经与多家金融和互联网信息服务提供商合作,利用自身优势为企业提供并实施成本灵活和部署便捷数字底座,打造了某头部保险公司以及某大型互联网知识分享平台等标杆客户。
「炎凰数据」的核心创始团队均来源于全球大数据分析引擎领军企业Splunk。董事长何宁是原Splunk上海研发中心总经理;CEO叶晓路则是原Splunk上海研发中心的副总经理;CMO吴红缨曾任职于某A股上市大数据相关企业,并任全国销售负责人;CTO王国栋和首席架构师倪跃均是原Splunk中国研发中心产品架构师。整个团队建制完整,核心技术团队磨合时间超过6年,且具有丰富和深入的非结构化数据库以及即时数据分析引擎内核开发经验。