集成部署方法填补了数据科学与生产之间的空白
尽管数据对企业至关重要,但在创建数据科学与实际在生产中使用信息之间似乎越来越有差距。
开源分析公司KNIME旨在通过集成部署的推出来消除这种差距。
到目前为止,将数据模型投入生产并应用于新客户的过程需要手动复制确切的数据创建和模型设置,以确保模型可以在生产中使用。但是,通过KNIME Integrated Deployment,将自动捕获并打包所创建的模型以及所有必需的步骤和设置,从而使整个生产过程首次可立即用于生产。
KNIME首席执行官兼联合创始人Michael Berthold说:“我们的开放方法和与社区的紧密合作意味着KNIME始终处于数据科学领域的最前沿。集成部署代表了又一大进步。” “通过彻底消除数据科学创作艺术与将结果投入生产之间的差距,这也许解决了当今数据科学中最大的问题之一。”
它使用开源KNIME Analytics Platform进行工作,在该平台上创建了工作流以生成最佳模型。然后,集成部署允许数据科学家标记在生产环境中运行所需的工作流部分,包括数据创建和准备以及模型本身,并将它们自动保存为包含所有适当设置和转换的工作流。 。此识别过程没有限制,它可以根据项目的要求而简单或复杂。
您可以在KNIME网站上找到更多信息。
图片来源:wan wei / Shutterstock