随着数字化转型在各行业加速进行,越来越多的公司意识到其实时数据流中未开发的价值。企业流媒体分析公司Streambased旨在帮助组织从这些持续的操作事件数据流中提取有影响力的业务洞察。
在最近的AI&Big Data Expo上的一次采访中,Streambased创始人兼首席执行官Tom Scott概述了该公司在流数据上实现高级分析的方法。Streambased提供的基础是Apache Kafka,这是一个开源的事件流平台,被财富500强公司广泛采用。
“Kafka在大规模分析方面存在问题,”Scott解释道。虽然Kafka可靠地在应用程序和微服务之间传输高容量数据流,但直接在流数据上进行复杂的分析工作一直是具有挑战性的。
Streambased在Kafka之上添加了一个专有的加速技术层,使该平台适用于数据科学家和其他分析师希望执行的要求严格的分析用例。
由于这些持续流动的事件流驱动着关键的运营系统和核心业务功能,数据质量在准确性、及时性和结构方面必须达到高标准。通过利用现有的Kafka数据管道,Streambased确保其分析能力可以访问最新的、干净的和良好组织的数据。
Streambased方法的示例用例包括金融服务中的欺诈检测。如果发生异常交易,分析师可以快速查询类似或相关的交易进行调查,这在纯流式架构下将是困难和低效的。Streambased对分析互动的优化使用户能够快速获取上下文洞察,而不会干扰他们的工作流程。
运营和分析数据平台的融合代表了Streambased所称的“流数据湖”运动的重要趋势。
“我认为我们正处于流数据湖运动的时期。通过流数据湖,我指的是我们用于分析目的和运营目的的数据系统之间的完全融合,”Scott解释道。
像Kafka中的无限数据保留和本地流分析服务等最新增强功能为这种新范式奠定了基础。目前,Streambased仍专注于通过无摩擦的自助访问细粒度实时数据来赋能业务分析师,而无需更改现有的工具和流程。
您可以在下面观看我们与Tom Scott的完整采访:
(照片由Robert Zunikoff提供,来源:Unsplash)
另请参阅:AI&Big Data Expo:释放边缘设备上人工智能的潜力
想要从行业领导者那里了解更多关于人工智能和大数据的知识吗?请查看在阿姆斯特丹、加利福尼亚和伦敦举办的AI&Big Data Expo。这个综合性的活动与网络安全与云计算博览会和数字化转型周同期举办。
探索由TechForge提供支持的其他即将举行的企业技术活动和网络研讨会这里。