停止向供应商提供您的数据

组织管理其数据基础设施的方式正在发生重大转变。越来越多的公司认识到存储和计算分离的优势,从而获得更好的性能、成本节约和可扩展性。这一趋势是由 AI 和 ML 工作负载日益复杂所推动的,这些工作负载需要灵活、高性能的系统。Databricks 首席执行官 Ali Ghodsi 是这一转变的杰出倡导者。在最近的一次演讲中,他强调了组织控制自己的数据的重要性。他鼓励公司停止依赖 Snowflake 和 Databricks 等供应商来管理他们的数据,而是使用基于对象存储构建的数据湖。好处?更多控制、更低的成本以及扩展数据基础设施以满足不断增长的需求的能力。Ghodsi 的信息是供应商构建、销售和倡导更具成本效益和灵活性的数据架构的更广泛运动的一部分。事实证明,存储和计算紧密集成的传统系统不足以处理 AI 和 ML 的海量数据量和处理需求。像 Databricks 这样的供应商比以往任何时候都更加投入计算,并将存储留给一流的对象存储软件。这种策略的峰值实现是在现代数据湖中,通常称为湖仓一体。现代数据湖将数据湖的灵活性与数据仓库的性能相结合。在 Databricks 等供应商的支持下,存储和计算的这种解耦标志着数据架构的关键转变,使组织能够构建高度灵活且可扩展的数据基础架构,以满足 AI 和 ML 工作负载的需求,同时最大限度地提高控制力并最大限度地降低成本。

Decoupling: 为什么它会改变游戏规则

在整个行业中,许多人都认识到,过去的单体系统已经不再适用。由 MinIO 等对象存储提供支持的现代数据湖正在成为面向未来的基础设施的标准。这种转变不仅仅是为了节省资金,尽管它确实如此,它还是为了让组织能够处理未来的数据需求,同时与当今的 AI/ML 系统、模型和工具合作。在数据呈指数级增长且 AI/ML 工作负载越来越普遍的世界中,对灵活、经济高效的基础设施的需求至关重要。传统的数据平台(如 Hadoop)通常集成了存储和计算,这在理论上听起来很高效,但在实践中会导致效率低下。使用这些传统架构,您最终需要为闲置的计算资源或未充分利用的存储付费。借助解耦架构,您可以独立扩展存储和计算。对于 AI 和机器学习来说,这是一个巨大的优势:可以有效地存储海量数据集,并且可以动态分配计算资源用于模型训练、数据处理或分析。

使用 Object Storage Anywhere 构建现代数据湖

如果您希望构建能够处理 AI 和 ML 需求的现代数据湖,那么高性能对象存储是必不可少的。例如,MinIO 提供针对大规模数据优化的企业级对象存储。通过使用像 MinIO 这样的系统,组织可以确保其现代数据湖具有高度可扩展性、可靠性和高性能,这三点在处理大型 AI/ML 数据集时至关重要。MinIO 可以部署在本地、私有云、公共云、colos、边缘或工作负载需要的任何地方。全部使用易于获取的商用硬件。这就是现代数据湖的魔力真正发挥作用的地方:您可以将对象存储用于数据湖,同时在任何需要的地方享受数据仓库的性能优势,而不会被数据饥渴的供应商提供的昂贵专有解决方案所束缚,这些供应商希望创建人工围墙花园来困住您。实际上,这意味着您的数据科学家和机器学习工程师可以直接从对象存储查询和访问大量数据以训练模型,无论数据需要在哪里。这就是真正控制自己的数据的意义所在。

保障未来

随着组织重新考虑其数据架构,确保大量数据的安全性比以往任何时候都更加重要。MinIO 的企业对象存储密钥管理服务器 (KMS) 为管理数十亿个加密密钥提供了可扩展、高度可用的解决方案,这对于在对象级别加密数据至关重要。KMS 与硬件安全模块 (HSM) 和基于云的 HSM 无缝集成,为加密操作提供了强大的信任基础,无论是在云中、本地还是边缘。MinIO 还支持多租户,允许组织通过加密区域隔离不同的团队或部门,确保敏感数据受到保护并保持对 GDPR 和 HIPAA 等法规要求的合规性。结合身份和访问管理 (IAM)、服务器端加密和审计日志记录,MinIO 确保您的数据在现代数据湖架构的每一层都得到保护

构建未来

为了在 AI 和 ML 时代保持竞争力,组织必须重新考虑其数据战略。Lakehouse 模型正迅速成为现代、可扩展数据环境的黄金标准。通过采用灵活的高性能存储解决方案,而不是随意将数据移交给供应商,企业可以确保他们有能力处理当今的数据需求和未来的挑战。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/875274.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java短信验证码

想利用java给用户发送短信的话,需要我们与电信、移动、联通三大巨头合作(其实还有广电,但是比较少用),让它帮你发信息,当然直接与它合作显然是不现实的,所以我们要借助第三方的短信平台来替我们…

el-tree父子不互相关联时,手动实现全选、反选、子级全选、清空功能

el-tree父子不互相关联时,手动实现全选、反选、子级全选、清空功能 1、功能实现图示 2、实现思路 当属性check-strictly为true时,父子节点不互相关联,如果需要全部选中或选择某一节点下的全部节点就必须手动选择每个节点,十分麻…

什么是科技与艺术相结合的异形创意圆形(饼/盘)LED显示屏

在当今数字化与创意并重的时代,科技与艺术的融合已成为推动社会进步与文化创新的重要力量。其中,晶锐创显异形创意圆形LED显示屏作为这一趋势下的杰出代表,不仅打破了传统显示设备的形态束缚,更以其独特的造型、卓越的显示效果和广…

使用AI赋能进行软件测试-文心一言

1.AI赋能的作用 提高速度和效率缺陷预测与分析 2.AI互动指令格式--文心一言 角色、指示、上下文例子、输入、输出 a 直接问AI 针对以下需求,设计测试用例。 需求: 1、账号密码登录系统验证账号和密码的正确性。 验证通过,用户登录成功,进入个人中心;验…

无刷直流电动机的匝间绝缘测试优化

近年来,随着消费者对高效、快速干发需求的增加,高速电吹风逐渐成为市场的宠儿。高速电吹风的关键技术之一便是无刷直流电动机,其转速可以高达100,000转/分钟以上,电压为DC310V。相比传统电吹风,高速电吹风在效率和用户…

Prometheus 监控平台(Prometheus Monitoring Platform)

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:Linux运维老纪的首页…

灰光模块,彩光模块-介绍

1. 引用 知识分享系列一:5G基础知识-CSDN博客 5G前传的最新进展-CSDN博客 灰光和彩光_通信行业5G招标系列点评之二:一文读懂5G前传-光纤、灰光、彩光、CWDM、LWDM、MWDM...-CSDN博客 ADOP带你了解:CWDM、DWDM、MWDM、LWDM:快速…

ffmpeg实现视频的合成与分割

视频合成与分割程序使用 作者开发了一款软件,可以实现对视频的合成和分割,界面如下: 播放时,可以选择多个视频源;在选中“保存视频”情况下,会将多个视频源合成一个视频。如果只取一个视频源中一段视频…

jmeter之TPS计算公式

需求: 如何确定环境当中的TPS指标 PV:(Page View)即页面访问量,每打开一次页面PV计数1,刷新页面也是。PV只统计页面访问次 数。 UV(Unique Visitor),唯一访问用户数,用来衡量真实访问网站的用户数量。 一般…

基于matlab交通标志识别系统用的APP designer设计的gui界面 交互原理:bp神经网络-训练好图像处理有灰度化-二值化-颜色区域定位识别

基于MATLAB的交通标志识别系统是一个实用的工具,用于识别道路交通标志。该系统结合了图像处理技术和BP神经网络模型,可以在给定的图像中定位并识别交通标志。通过使用MATLAB的App Designer工具,系统还提供了一个交互式的图形用户界面&#xf…

OpenAI发布o1大模型,突破LLM推理极限,弥补了之前在数学、科学和代码方面的不足

在北京时间9月13日凌晨,OpenAI正式发布了一系列全新的AI大模型【o1-preview 和 o1-mini】,专门针对复杂问题的解决。这一发布标志着一次重要的突破,新模型能够实现复杂的推理能力,通用模型在解决科学、代码和数学等领域中的难题方…

Linux 防火墙:iptables (一)

文章目录 iptables 概述netfilter 与 iptables 的关系 四表五链规则表规则链数据包处理的优先顺序与规则链匹配顺序规则表的优先顺序规则链的匹配顺序规则链内的匹配顺序匹配流程示意图 安装与格式iptables 的安装iptables 防火墙的配置方法iptables 命令行配置方法常用的控制类…

TestCraft - GPT支持的测试想法生成器和自动化测试生成器

在当今快速变化的软件开发世界中,自动化测试已成为确保软件质量的关键环节。而随着AI技术的进步,越来越多的工具开始引入人工智能,来辅助生成测试用例和自动化测试脚本。其中,TestCraft,作为一款GPT支持的测试想法生成…

【数据结构】双向链表专题

目录 1.双向链表的结构 2.双向链表的实现 2.1初始化 以参数的形式初始化链表: 以返回值的形式初始化链表: 2.2尾插 2.3打印 2.4头插 2.5尾删 2.6头删 2.7查找 2.8在指定位置之后插入数据​编辑 2.9删除pos节点 2.10销毁 3.整理代码 3.1…

Unity笔记:ScrollRect代码阅读

大体流程 Unity Docs - UGUI | Class ScrollRect 总的说 自身不负责Rebuild,设置脏之后交由LayoutRebuilder注册到CanvasUpdateRegistry里待rebuild的集合在固定时机统一Rebuild。自身只在Prelayout和Postlayout做一下数据准备和数据更新 自身的ICanvasElement.…

Visual Studio配置opencv环境

(1)打开属性页面(鼠标放在解决方案上,点击右键会有一个属性选项弹出) (2)配置opencv的include和opencv2路径,具体路径和版本根据自己电脑配置 (3)配置opencv…

OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准

今日凌晨,OpenAI正式推出了OpenAI o1预览模型。 对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。 OpenAI曾解释过,2023年发布…

卡车配置一键启动无钥匙进入手机控车

‌ 卡车智能一键启动无钥匙进入手机控车,通过手机应用程序与汽车内置硬件、软件的无线通信,实现对汽车的远程控制‌。 卡车改装一键启动的步骤包括安装门把手的感应装置、拆卸仪表台和门板,取出内部的待接线束,并将一键启动…

ip地址a段b段c段是什么意思

在互联网的世界里,每一个设备都需要一个独特的标识符来相互识别和通信,这就是IP地址。IP地址不仅仅是一串数字,它背后隐藏着网络的组织结构和设备的连接方式。本文将深入探讨IP地址中的A段、B段、C段的含义,以及它们在网络通信中的…

VSCode创建项目和编译多文件

前言 在刚安装好VSCode后,我简单尝试了仅main.cpp单文件编译代码,没有问题,但是当我尝试多文件编译时,就出现了无法识别cpp文件。 内容 创建项目 首先点击左上角“文件”;在菜单中选择“打开文件夹”;在…