线上技术研讨会(Level 300)
现代化数据仓库
在一个平台上真正实现数据、分析和AI
Register Now
深入了解湖仓一体(Lakehouse),探索它如何增强你的数据科学、ML、数据工程、数据仓库和分析。通过参加我们的线上技术研讨会,在更短的时间内通过使用Databricks实现业务增长。当参与者在Databricks平台上运行查询时,现场技术讲师将提供专业的指导。
本次Databricks研讨会由两部分组成,您可以在您家中在线参与。
第一部分:Delta和湖仓一体的生产环境 (2小时)
**本研讨会现在开始支持点播回放**
湖仓一体(Lakehouse) 架构是数据驱动型组织的理想数据架构。它结合了数据仓库和数据湖的最佳品质,为所有主要的数据工作负载提供统一的解决方案,并支持从流分析到BI、数据科学和AI的使用案例。
在本次研讨会中,我们将介绍数据管理的演变历程,以及向湖仓一体架构的转变。我们将讨论湖仓一体如何使数据团队在整个数据和人工智能工作流程中进行协作。我们还将探讨Delta Lake怎样为您的数据湖提供一个开放、可靠、高性能和安全的数据存储和管理层。Delta Lake提供了ACID交易,可扩展的元数据处理,并统一了流式和批处理数据。我们将介绍检查点、错误警报和作业重试,以及Delta的性能增强,如数据跳过、缓存和z-ordering。
在实践部分,您将学习如何创建、管理和查询Delta Lake。您将摄取实时流数据,完善它,并为下游机器学习和商业智能用例服务。我们还会结合上述的最佳实践,以确保生产级的性能、可视性和容错性。数据管道将作为一个可重复使用的模板,您可以在未来根据您自己的特定用例进行调整。
适用人群: 适用于几乎没有使用过Databricks的数据工程、数据科学和商业分析(BI)领域的数据专业人员。
分享内容包括:
第二部分:端到端机器学习 (1.5个小时)
**本研讨会现在开始支持点播回放**
未来已然抵达,只是分布地不均匀。虽然83%的CEO说机器学习将会是一个战略重点,但87%的数据科学计划却从未投入生产环节。
Databricks 机器学习平台简化了端到端的机器学习生命周期,从数据准备到功能开发、模型训练、部署和监控。此平台能够帮助您利用数据、分析和人工智能为您的客户创造新的价值。
此研讨会将会带领参与者了解Databricks的端到端机器学习解决方案。我们将介绍如何使用协作式机器学习开发环境,大规模地准备数据,并利用AutoML功能来快速建立机器学习模型的原型。然后,我们将使用Glassbox方法生成的训练代码来完善您的模型,跟踪实验运行并使用MLflow Model Serving进行部署。最后,我们将利用您部署的模型,展示如何使用Databricks SQL监测随时间推移的漂移。本次研讨会将为您提供一个可重复使用的模板,以简化您使用Databricks将模型投入生产的操作。
分享内容包括:
© Databricks 2025. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.