因此,有越来越多的初创公司不断开发出创新的大数据产品,以满足数据管理者、数据科学家、数据分析师和其他人的需求,为数据管理、数据可访问性、数据连接和数据质量提供领先的技术,也就不足为奇了。
下面就来看看2018年这10家引起我们关注的大数据初创公司吧。
1. Data Artisans
高管:Kostas Tzoumas,首席执行官及联合创始人
企业越来越多地发现他们需要处理和分析实时的流媒体数据。
Data Artisans位于德国柏林,是由Apache Flink(一种开源软件框架和分布式处理引擎,用于使用流数据进行状态计算)创始人在2014年成立的。Data Artisans基于Apache Flink的平台可以实现以安全、可扩展、无摩擦和经济高效的方式构建和运行流媒体应用。
今年,Data Artisans利用Data Artisans Streaming Ledger软件扩展了产品阵容,从而可以使用流数据处理可序列化的ACID交易。ACID(Atomicity、Consistency、Isolation and Durability)是一项确保数据在分布式事务中的完整性的标准,到目前为止,将这项标准用于流数据处理都是一件很困难的事情。
2. dotData
高管:Ryohei Fujimaki,首席执行官
随着数据量的猛增,数据科学(从数据中提取洞察力的一系列跨学科过程集)也变得越来越复杂,这可能意味着企业需要更长的时间从数据资产中获取价值。
从NEC公司分拆出来的dotData公司,正在通过端到端的、支持人工智能的数据科学自动化平台来解决这一问题。该平台旨在减少完成复杂数据科学项目所需的时间。这家位于加利福尼亚州库比蒂诺的初创公司在10月Oracle OpenWorld大会上发布了dotData平台的1.2版,其中增加了新的属性功能、增强的模型操作、新的功能和模型见解。
3. Dremio
高管:Tomer Shiran,首席执行官、联合创始人
让日常信息工作者可以访问数据,这仍然是大数据最大的挑战之一。Dremio开发了一种数据即服务平台,据称可以在数据工程师和数据消费者之间架起一座桥梁。该系统允许用户划分不同来源的数据,在Tableau、QlikView和Looker等流行的BI工具之间、以及在不断增加的关系数据库、NoSQL数据库和数据湖之间提供SQL接口。
Dremio成立于2015年,位于加利福尼亚州山景城。今年早些时候,Dremio在B轮融资中获得了2500万美元,使得总融资金额达到4000万美元。10月,Dremio推出了Dremio 3.0,其中包括了一个协作数据目录、端到端数据加密、以及用于多租户部署的新控件。
4. Gluent
高管:Tanel Poder,首席执行官、创始人
Gluent认为,企业组织的宝贵数据资产不应该被限制在关系型数据库孤岛中。Gluent的Gluent Data Platform将数据从传统关系型数据库管理系统卸载——Gluent称之为“解放”,迁移到Hadoop中,从而可以更轻松地在企业上下对其进行访问。此外Gluent提供的Gluent Cloud Sync可以用于将Hadoop表迁移到云中。
Gluent成立于2014年,在今年10月首次推出了Gluent Data Platform的新版本,增加了对虚拟化关系型数据库表的洞察,以及新的数据发现和沿袭功能。
5. Immuta
高管:Matthew Carroll,首席执行官、联合创始人
Immuta创建了一个专门用于数据科学任务的数据管理平台,让数据科学家能够更轻松地查找和管理他们所需的数据,来开发用于支持机器学习和人工智能任务的数据模型。
Immuta成立于2014年,位于马里兰州的College Park,于3月份启动了首个渠道计划,旨在寻求经销商、专业服务、IT基础设施和技术合作伙伴,围绕针对数据科学任务的Immuta平台展开合作。
6. Magnitude Software
高管: Chris Ney,首席执行官
Magnitude Software成立于2014年,总部位于奥斯汀,开发了一系列企业信息管理、数据连接和商业智能软件。
9月,Magnitude Software推出了Magnitude Gateway通用数据连接平台,让用户可以随时随地访问运营和分析数据,包括关系型数据库、NoSQL数据库和软件即服务应用。
7. Naveego
高管:Katie Horvath,首席执行官
Naveego的使命是解决数据准确性问题,帮助企业和解决方案提供商将原始数据转换为可操作的信息资产。Naveego成立于2014年,总部位于密歇根州特拉弗斯市,提供的主数据管理和数据质量管理软件工具可用于同步和清理分散在不同系统中的大量数据。
10月,Naveego公布了Complete Data Accuracy Platform的2018.2.0版本,增加了用于大数据接收和存储、数据流记录、自动配置、自助服务以及主数据管理可扩展性的新功能。
8. Octopai
高管:Amnon Drori,首席执行官、联合创始人
元数据通常分散在多个不同的系统中,这迫使商业智能团队不得不使用多种工具(通常需要特殊开发和定制)来查找他们要寻找的数据。
Octopai推出了一个自动化、集中化、跨平台的元数据管理和数据沿袭搜索引擎,让商业智能组织可以使用该引擎快速地发现和管理共享元数据。
Octopai成立于2015年,总部位于以色列Rosh Ha'ayin,被评为参与微软ScaleUp 2018计划(一项为期4个月,为初创公司提供工具、资源、连接、知识和专业知识以更快发展业务的计划)的10家云计算初创公司之一。
9. Timescale
高管:Ajay Kulkarni,首席执行官,联合创始人
管理时间序列数据(例如由金融服务系统或物联网网络生成的数据)可能是一项挑战。Timescale开发的TimescaleDB是一个时间序列数据库,针对快速数据摄取和复杂查询进行了优化。
Timescale在9月推出了TimescaleDB 1.0版本。基于开源PostgreSQL数据库的TimescaleDB可以在单个服务器上扩展到超过100亿行数据,具有时间序列功能、优化的查询引擎和自动分区功能。
Timescale位于纽约,成立于2015年。
10. Unravel Data
高管:Kunal Agarwal,首席执行官
大数据系统通常有许多组成部分。Unravel Data提供的应用性能管理工具主要用于收集和分析来自大数据应用和基础设施的性能数据,利用这些结果可以进行故障排除和大数据系统优化。
Unravel Data成立于2013年,位于加利福尼亚州门洛帕克,在1月的B轮融资中获得1500万美元。
与Unravel Data合作的平台厂商包括Cloudera和微软Azure等,咨询合作伙伴包括Capgemini和HCL等,以及技术合作伙伴Arcadia Data和Qubole等。