你的位置:首页 > 新品 > 正文

亚马逊云科技推出Amazon S3 Files,S3首次实现高性能文件系统级访问

发布时间:2026-04-15 责任编辑:lily

【导读】4月13日,亚马逊云科技正式推出了Amazon S3 Files,这是一款旨在打破对象存储与文件系统界限的全新服务。通过将Amazon S3存储桶转化为可直接挂载的高性能文件系统,该服务允许EC2实例、容器及Lambda函数等计算资源以标准的NFS协议直接访问S3数据。这一创新不仅消除了传统架构中数据孤岛和复杂的同步流程,还保留了S3的高持久性与成本优势,为Agentic AI构建、机器学习训练及生产级应用提供了统一、高效的数据存储中心,标志着云存储交互方式的重大革新。


Amazon S3 Files通过消除数据孤岛、同步复杂性以及在对象和文件之间的手动数据移动,有助于简化云架构。无论企业是运行已经与文件系统配合使用的生产级工具、构建依赖于基于文件的Python库和shell脚本的Agentic AI,还是为机器学习训练准备数据集,Amazon S3 Files都能让这类需要交互、共享层级化的工作负载,直接访问Amazon S3数据,而无需在Amazon S3的高持久性和成本优势与文件系统的交互功能之间进行取舍。企业现在可以将Amazon S3作为所有数据的统一存储中心,并从任何亚马逊云科技计算实例、容器和函数中直接访问这些数据。


十多年前,在解释对象存储和文件系统之间的根本区别时,一个常用的比喻是将Amazon S3对象比作图书馆里的书(无法只编辑单页,需要替换整本书),而电脑上的文件则可以逐页修改。这种通过图表和隐喻的方式可以帮助客户理解为什么不同的工作负载需要不同的存储类型。如今,这两者之间的界限不再那么分明,使用更加灵活。


过去,用户往往需要在两种方案之间做取舍:要么选择Amazon S3的低成本与高持久性,以及能直接读取Amazon S3数据的各类云服务;要么选择文件系统的交互能力。此次更新消除了这种取舍难题,使Amazon S3成为企业所有数据的核心枢纽。无论是在运行生产级应用、训练机器学习模型,还是在构建Agentic AI系统,企业都可以从任何亚马逊云科技计算实例、容器或函数中进行直接访问。



用户可以在各类环境中,像访问本地文件系统一样访问任何通用存储桶,包括Amazon Elastic Compute Cloud(Amazon EC2)实例、运行在Amazon Elastic Container Service(Amazon ECS)或Amazon Elastic Kubernetes Service(Amazon EKS)上的容器,或Amazon Lambda函数。Amazon S3 Files会将Amazon S3对象呈现为文件和目录,并支持所有的NFSv4.1以上版本的操作,例如创建、读取、更新和删除文件。


当通过文件系统处理特定文件和目录时,相关的文件元数据和内容会被放置到文件系统的高性能存储中。默认情况下,需要低延迟访问的文件将被存储在高性能存储中并由其提供服务。对于未存储在高性能存储上的文件(例如需要大量顺序读取的文件),Amazon S3 Files会自动直接从Amazon S3读取这些文件,以最大化吞吐性能。对于字节范围读取,则仅传输所请求的字节,从而最大限度减少数据传输量,降低使用成本。


该系统还支持智能预取功能,以预测数据访问需求。用户还可以对存储在文件系统高性能存储上的内容进行精细化控制。可以决定是加载完整的文件数据还是仅加载元数据,这意味着可以针对特定的访问模式进行优化。


在底层架构上,Amazon S3 Files基于Amazon Elastic File System(Amazon EFS)构建,并为活跃数据提供约1毫秒的低延迟访问。该文件系统支持多计算资源并发访问,并采用NFS close-to-open一致性模型,非常适合需要频繁修改数据的交互式共享场景——无论是通过文件工具协作的Agentic AI,还是处理数据集的机器学习训练流水线,它都能轻松应对。


关于如何为工作负载选择合适的文件服务,亚马逊云科技提供了多种服务以满足不同需求。当需要通过高性能文件系统接口对存储在Amazon S3中的数据进行交互式共享访问时,Amazon S3 Files的效果最佳。它非常适合需要多个计算资源(无论是生产级应用、使用Python库和CLI工具的Agentic AI agent,还是机器学习训练流程)协同读取、写入和修改数据的工作负载。用户可以在计算集群之间获得共享访问权限而无需复制数据,同时具有亚毫秒级延迟以及与Amazon S3存储桶的自动同步功能。


对于从本地NAS环境迁移上云的工作负载,Amazon FSx则能提供用户熟悉的功能和兼容性。Amazon FSx也是通过Amazon FSx for Lustre进行HPC高性能计算和GPU集群存储的理想选择。当企业的应用需要来自Amazon FSx for NetApp ONTAP、Amazon FSx for OpenZFS或Amazon FSx for Windows File Server的特定文件系统功能时,选择Amazon FSx则更为合适。


Amazon S3 Files的推出彻底解决了企业长期面临的存储架构取舍难题,即不再需要在S3的低成本/高扩展性与文件系统的交互灵活性之间做选择。基于Amazon EFS构建的底层架构,它提供了约1毫秒的低延迟访问和close-to-open一致性模型,使得S3真正进化为支持随机读写、增量更新和多节点共享的统一数据枢纽。对于需要跨集群共享数据、构建依赖文件系统的AI智能体或简化数据管道的企业而言,Amazon S3 Files提供了一种无需复制数据即可实现高效协同的现代化解决方案,极大地简化了云架构并提升了数据利用率。


3-958x200_20251021044704_586.png

特别推荐
技术文章更多>>
技术白皮书下载更多>>
热门搜索

关闭

 

关闭