亚马逊云科技Amazon SageMaker Unified Studio现已可用,加速数据分析和人工智能创新

亚马逊云科技日前宣布Amazon SageMaker Unified Studio已正式可用,这是一套独立的数据与人工智能(AI)开发环境,也是新一代Amazon SageMaker的核心。这项新产品将多种工具整合至一站式的界面中,为客户提供一致的开发体验,不仅能够节省开发时间,还能简化访问控制管理,使数据从业者能够专注于核心任务——构建高质量的数据分析场景和AI应用。

新一代Amazon SageMaker是亚马逊云科技在2024 re:Invent全球大会上发布的一个一站式平台,涵盖数据、分析和AI等功能。它整合了亚马逊云科技广泛应用的机器学习和分析功能,通过统一的工具访问和数据治理,解决了企业在数据分析和AI应用中面临的挑战。它使团队能够安全地发现、准备和协作处理数据资产,并在一站式的环境中构建分析和AI应用,加快从数据到价值的转化过程。

Amazon SageMaker Unified Studio是新一代Amazon SageMaker的核心,这是一个一站式的数据和AI开发环境,用户可以在其中发现和访问企业的数据,并使用最适合的工具处理几乎所有的应用场景。Amazon SageMaker Unified Studio现已正式可用。

Amazon SageMaker Unified Studio的优势

Amazon SageMaker Unified Studio集成了亚马逊云科技现有的分析、人工智能与机器学习服务,包括Amazon EMR、Amazon Glue、Amazon Athena、Amazon Redshift、Amazon Bedrock及Amazon SageMaker AI。用户可以在这个一站式的开发环境中查找、访问并查询数据和AI资产,并在项目中高效协作,共享数据、模型和生成式AI应用。通过Amazon SageMaker Catalog,Amazon SageMaker Unified Studio内置的细粒度权限控制等治理功能,帮助用户满足企业数据资产的安全要求。

Amazon SageMaker Unified Studio具有统一的数据访问能力,该功能由Amazon SageMaker Lakehouse提供,这是一个基于Apache Iceberg开放标准构建的统一、开放和安全的数据湖仓库。无论数据存储在Amazon Simple Storage Service (Amazon S3)数据湖、Amazon Redshift数据仓库,还是第三方和整合的数据源中,用户都可以从单一入口访问并使用兼容Apache Iceberg的引擎和工具进行处理。此外,Amazon SageMaker Lakehouse现已与Amazon S3 Tables集成,Amazon S3 Tables是首个原生支持Apache Iceberg的云对象存储服务,用户能够使用Amazon SageMaker Lakehouse高效地创建、查询和处理S3 Tables,既可以使用Amazon SageMaker Unified Studio中的各种分析引擎,也可以使用如Apache Spark和PyIceberg等Apache Iceberg兼容的引擎。

Amazon Bedrock的功能现已在Amazon SageMaker Unified Studio中正式可用,能够帮助客户在受管理的环境中快速构建原型、定制和共享生成式AI应用。客户可以在Amazon SageMaker Unified Studio的界面中使用Amazon Bedrock功能,包括如Claude 3.7、DeepSeek及Amazon Nova等高性能基础大模型,并能够通过简单操作创建 AI助手(Agents)、工作流、知识库和对大模型生成内容的防护机制(Guardrails)等。

Amazon SageMaker Unified Studio现已集成Amazon Q Developer。Amazon Q Developer是强大的软件开发生成式AI助手,可在Amazon SageMaker Unified Studio中使用,用于简化数据和AI开发生命周期中的各项任务,包括代码编写、SQL生成、数据发现和问题排查。

全新的工作集成方式

Amazon SageMaker Unified Studio是亚马逊云科技为客户提供简化数据工作方式的又一重要里程碑,无论是用于数据分析还是AI应用。许多客户正在构建数据驱动型应用来指导业务决策、提高敏捷性和推动创新,但由于这些应用需要跨团队协作以及整合数据和工具,构建过程十分复杂。客户不仅需要花费时间学习多种开发环境,而且由于数据、代码和其他开发资产被分散存储,要理解各要素资产之间的交互关系并实现协同运作对客户而言就是一大挑战。配置和管理权限也是一个繁琐的手动过程。为了克服这些挑战,许多企业正在尝试将各类服务、工具和企业的权限管理系统进行定制化集成。然而,客户真正需要的是:既能够灵活采用最适合其使用场景的服务,又能为数据团队提供一站式的开发体验。

“在为客户构建数据驱动型应用时,我们需要一个一站式的平台,使各种技术能够以集成的方式协同工作。Amazon SageMaker Unified Studio通过全面的分析功能、一站式的开发环境以及整合数据仓库和数据湖管理的湖仓架构,简化了我们的解决方案交付流程。Amazon SageMaker Unified Studio将客户数据项目的价值实现时间缩短了多达40%,帮助我们加速客户的数字化转型进程。”

——NTT DATA解决方案部门负责人铃江明弘、NTT DATA应用与数据技术部高级经理庄野裕司、NTT DATA数字成功解决方案部经理齐藤优希

数百万企业信任亚马逊云科技,并利用我们全面的专门构建的分析、人工智能与机器学习、生成式AI功能来支持数据驱动型应用,同时无需在性能、可扩展性和成本效益之间进行妥协。亚马逊云科技希望通过新一代Amazon SageMaker(包括Amazon SageMaker Unified Studio)在一站式的开发环境中为企业提供对所有数据和工具的访问,提升数据和AI从业者的工作效率。

从一站式数据和AI开发环境开始构建

如何通过优化潜在客户挖掘来提升收入是一个常见的业务挑战。请想象这样一个场景:一个企业在其网站上部署智能数字助手来与客户进行互动,这个过程传统上需要多个工具和数据源。现在,通过使用Amazon SageMaker Unified Studio,用户可以在一站式的数据和AI开发环境中完成整个过程。

首先,数据团队使用Amazon SageMaker Unified Studio中的生成式AI环境快速评估并选择最适合客户互动的模型。然后,团队会创建一个项目来整合用例所需的工具和资源,并在项目中使用Amazon Bedrock构建和部署一个智能虚拟助手,该助手可以快速通过网站筛选潜在客户。

为了识别最具潜力的机会,团队制定了客户分层策略。数据工程师借助Amazon Q Developer识别含有潜在客户信息的数据集,并通过zero-ETL的方式将数据导入Amazon SageMaker Lakehouse。随后,数据分析师发现这些数据并创建关于他们业务的全景视图。他们使用SQL查询编辑器构建营销细分表,然后将查询结果写回Amazon SageMaker Lakehouse,供其他团队成员使用。

最后,数据科学家访问同一数据集,使用Amazon SageMaker AI提供的工具训练和部署自动化的潜在客户评分模型。在模型开发阶段,他们利用Amazon Q Developer的内联代码编写和问题排查功能,在其JupyterLab notebook中高效编写无错误代码。最终的模型为销售团队提供最具价值的机会,他们可以通过商业智能仪表板直观查看并立即采取行动。

在一站式的环境中加速实现数据价值

这个示例的非凡之处在于,整个过程都在一个统一的环境中完成。如果没有Amazon SageMaker Unified Studio,团队就必须在多个数据源、工具和服务之间切换,花费大量时间学习不同的开发环境、创建资源共享和手动配置权限控制。数据工程师和数据分析师需要在各种数据仓库、数据湖和分析工具中工作,数据科学家需要在机器学习环境和notebook环境中工作,应用程序开发者则需要在生成式AI工具中工作。现在,他们能够在一个统一的环境中使用所需的数据和工具进行构建和协作,大大缩短了价值实现时间。

现在Amazon SageMaker Unified Studio已正式可用,通过将分析和AI所需的一切整合在一处,客户可以更高效地解决复杂的端到端问题,比以往更快地实现创新成果。

丰田是全球领先的汽车制造商之一,丰田内部数据来源分散,涵盖数据湖、数据库及第三方数据源,实现数据互联互通成为其一大挑战。丰田不仅需要高效整合数据,还需从多个来源快速提取信息,获取洞察并构建AI模型。Amazon SageMaker Unified Studio为丰田提供数据目录、MLOps管道和完整的人工智能和机器学习工具集,助力数据科学团队快速部署模型,并高效共享成果,实现了从数据到业务价值的快速转化。

分享到QQ 分享到微信 分享到微博

0 条评论

发表我的观点

取消

  • 昵称 *
  • 邮箱 *
  • 网址

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册