当人们问我一个人可以做什么样的数据科学HeidelbergCement在美国,人们对一家拥有100多年历史的建筑公司的整个IT设置存在很多偏见。我非常乐意分享一则声明来证明事实并非如此。HeidelbergCement的第一个开源包,可以对时间序列数据进行可扩展的、可生产的预测,例如预测工厂和产品的日常水泥需求。
它是如何工作的?
HCrystalBall库有两个主要的支柱,这使得它非常容易使用,但收到高质量的结果。
包装部分
较低级的部分包装了最流行的python时间序列库,以允许与它们进行统一通信(有fbprophet,华宇电脑/autoarima,从statsmodels,(t)蝙蝠举几个例子)。你可以把包装纸想象成适配器,让英国或美国的充电器在欧盟电网中工作。
如果没有HCrystalBall,您将需要实现许多数据转换,从历史训练数据到所需形式的未来预测。
虽然HCrystalBall包装器把所有这些都带到一个接口,你需要遵守和准备你的数据从/到。
除了所需的数据转换更少之外,这使得模型选择部分或将模型组合成更复杂的层次结构成为可能。也可以是使用独立的.
选型部分
在我们的大多数用例中,我们的数据看起来类似于下图-我们有列,切片数据(这里是州和商店),关于区域ISO代码的信息(从中我们可以考虑到公共假日的影响)和我们想要预测未来的时间序列(这里的“销售”列-每个商店几天内的销售额)。
即使没有编程背景,也很容易尝试在这里(给它一些时间或几次页面刷新,一旦完成,点击运行图标就足以看到你正在创建的结果)。
使用
HCrystalBall已经在许多地方证明了它的价值,它是我们在业务线和部门(物流、水泥或预拌混凝土等)中大多数用例的主要构建块,我们坚信更广泛的社区可以从使用它中受益。
试一试!
尝试HCrystalBall最简单的方法是通过示例预先构建的环境(无需安装任何东西)。如果你不需要交互性,预执行的笔记本是我们的一部分文档在例子部分。检查安装有关如何设置本地环境的说明。我们还发表了更技术化的博客文章代码示例。对代码或贡献感兴趣?参观GitHub库.
由海德堡水泥的数据科学团队精心为您呈现