線上技術研討會 (Level 300)
現代化數據倉庫
在一個平台上真正實現數據、分析和AI
Register Now
深入了解湖倉一體(Lakehouse),探索它如何增強你的數據科學、ML、數據工程、數據倉庫和分析。通過參加我們的線上技術研討會,在更短的時間內通過使用Databricks實現業務增長。當參與者在Databricks平臺上運行查詢時,現場技術講師將提供專業的指導。
本次Databricks研討會由兩部分組成,您可以在您家中在線參與。
第一部分:Delta和湖倉一體的生產環境 (2小時)
**本研討會現在開始支持點播回放**
湖倉一體(Lakehouse) 架構是數據驅動型組織的理想數據架構。它結合了數據倉庫和數據湖的最佳品質,為所有主要的數據工作負載提供統一的解決方案,並支持從流分析到BI、數據科學和AI的使用案例。
在本次研討會中,我們將介紹數據管理的演變歷程,以及向湖倉一體架構的轉變。我們將討論湖倉一體如何使數據團隊在整個數據和人工智能工作流程中進行協作。我們還將探討Delta Lake怎樣為您的數據湖提供一個開放、可靠、高性能和安全的數據存儲和管理層。Delta Lake提供了ACID交易,可擴展的元數據處理,並統一了流式和批處理數據。我們將介紹檢查點、錯誤警報和作業重試,以及Delta的性能增強,如數據跳過、緩存和z-ordering。
在實踐部分,您將學習如何創建、管理和查詢Delta Lake。您將攝取實時流數據,完善它,並為下遊機器學習和商業智能用例服務。我們還會結合上述的最佳實踐,以確保生產級的性能、可視性和容錯性。數據管道將作為一個可重復使用的模板,您可以在未來根據您自己的特定用例進行調整。
適用人群: 適用於幾乎沒有使用過Databricks的數據工程、數據科學和商業分析(BI)領域的數據專業人員。
分享內容包括:
第二部分:端到端機器學習 (1.5個小時)
**本研討會現在開始支持點播回放**
未來已然抵達,只是分布地不均勻。雖然83%的CEO說機器學習將會是一個戰略重點,但87%的數據科學計劃卻從未投入生產環節。
Databricks 機器學習平臺簡化了端到端的機器學習生命周期,從數據準備到功能開發、模型訓練、部署和監控。此平臺能夠幫助您利用數據、分析和人工智能為您的客戶創造新的價值。
此研討會將會帶領參與者了解Databricks的端到端機器學習解決方案。我們將介紹如何使用協作式機器學習開發環境,大規模地準備數據,並利用AutoML功能來快速建立機器學習模型的原型。然後,我們將使用Glassbox方法生成的訓練代碼來完善您的模型,跟蹤實驗運行並使用MLflow Model Serving進行部署。最後,我們將利用您部署的模型,展示如何使用Databricks SQL監測隨時間推移的漂移。本次研討會將為您提供一個可重復使用的模板,以簡化您使用Databricks將模型投入生產的操作。
分享內容包括:
© Databricks 2025. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.