Kaskada数据科学自动化平台旨在加快机器学习模型的生产速度

在宣布计划实现人工智能项目的特征工程阶段自动化的一年多之后,总部位于西雅图的初创公司Kaskada Inc.将其首款产品推向市场。

Kaskada表示,其目标是使要素工程民主化,这是一个通常很费力的过程,需要数据科学家在将其投入生产之前,先选择,清理和验证要输入到机器学习训练模型中的数据。

例如,旨在预测房价的模型将使用预测数据进行特征工程设计,例如房地产的平方英尺,卧室数量和位置。 训练数据集越大越完整,结果越好。

收集数据并将机器学习模型投入生产所需的资源是如此巨大,以至于除了最大的公司以外,所有其他公司都无法实现这些功能。 Kaskada说,其平台具有用于团队工程设计的协作界面和用于跨基于事件的数据进行计算并提供生产功能的专有数据基础结构。

Kaskada的首席执行官兼Google LLC和Microsoft Corp.的前软件工程师Davor Bonaci说:“我们致力于建立培训与生产之间的桥梁。我们正在推出一个自助服务平台,以帮助数据科学家将工作投入生产通过自动化基础架构。 您可以入职,并没有太大的采用曲线,或者需要让您的组织中的每个人都同意尝试。”

该公司的自助服务平台是一个独立的数据科学工作室,具有预先构建的机器学习模型以及通过应用程序接口提供支持它们所需的特征向量。 “您可以获得用于实时欺诈检测等功能的最新特征向量,” Bonaci说。 “您不必编写数据管道或处理流数据。 我们运行模型所需的数据处理。”

事件驱动的焦点

自宣布以来,Kaskada的平台发生了一些变化,其中最重要的一点是更加关注事件驱动的数据收集。 这是一种处理类型,可根据鼠标单击和事务等实时事件做出决策。

事件驱动的处理在诸如预测客户购买产品或信用卡交易将成为欺诈行为的可能性之类的场景中特别有用。 实时数据处理需要高效的数据基础架构,以便在任意时间点计算功能并将其交付给培训和生产环境。 “我们已经建立了很多功能,可以根据时间进行思考,” Bonaci说。

该公司还把更多的精力放在自动化数据科学流程上,而不是数据工程上。 这两个功能应该协同工作,但经常无法有效地通信,因为数据科学家专注于数据,而工程师则致力于将模型投入生产。

Bonaci说:“由于科学和工程团队的价值观不同,投入生产可能会有摩擦。” “我们减少了将工作投入生产所需的摩擦。”

Kaskada是一项云原生服务,客户可以将其部署在自己的云实例中,作为托管服务运行或安装在本地基础架构上。 该公司提供了一种独特的定价模型,其中包括数据容量有限的免费套餐,精选的公共数据集,示例项目以及个人提交和版本历史记录。 付费计划支持团队开发,批量数据上传,直接数据连接和实时功能。 没有提供详细信息。

图片:Starline / Freepik

资讯来源:由0x资讯编译自SILICONANGLE。版权归作者Paul Gillin所有,未经许可,不得转载
提示:投资有风险,入市需谨慎,本资讯不作为投资理财建议。请理性投资,切实提高风险防范意识;如有发现的违法犯罪线索,可积极向有关部门举报反映。
你可能还喜欢