0
用微信扫码二维码
分享至好友和朋友圈
传统观点认为,在成功使用人工智能之前,你需要解决你的数据管理缺陷。但据一些技术高管称,这可能不再是唯一途径,他们看到了在构建人工智能应用程序的同时应用生成式人工智能(GenAI)掌握语言和解决数据管理问题的潜力。
![]()
AWS负责数据和人工智能市场的副总裁Rahul Pathak认为自己是一个老派的数据专家,他从不建议为了在纸面上展示成功而走捷径。因此,当他建议GenAI可以让你在数据管理能力上领先并更快地获得结果时,你可能会注意到。
Pathak说:“在我们的世界里,必须采用序列化方式,你必须把数据库整理好,然后你必须构建一个基于数据的应用程序。”“我认为你实际上可以稍微改变一下这个过程,在这个过程中,你可以使用管理良好、安全的模型上下文协议(MCP)端点和最先进的模型,几乎立即开始为人工智能解锁数据。[它们]真的可以帮助你几乎就地解锁数据,然后开始帮助你点亮人工智能应用程序。”
显然,并非所有的AI用例都是一样的。某些用例可能需要在数据接触人工智能算法之前收集、清理和准备数据。但是,当涉及到在预训练的模型上运行推理工作负载时,可能无法对数据进行分级。好消息是,MCP绕过了许多以前可能需要的大量数据(更不用说数据管理的痛苦和花费的金钱了)。
![]()
Pathak说:“你可以把MCP服务器看作是一个联合查询。”“该模型允许您获取数据。它具有一定的模式弹性。然后知识库和索引几乎就像一个物化视图。因此,在这种组合中,您可以更快地获取数据。模型中的智能确实增强了数据工程师和数据科学家的能力,使他们能够比我们以前更快地移动。”
Pathak有一个现实世界的例子,一家制造公司希望使用生成式人工智能来加速生产。该公司已经收集了大量的遥测数据,但事实证明,从遥测数据中提取知识并将其应用于工厂生产线是困难而耗时的。
解决方案是使用GenAI的自然语言处理(NLP)功能从遥测数据中提取相关数据。然后,这些见解被输入到传统的机器学习优化模型中。在后端,GenAI再次被用来生成指令,告诉操作员如何修改他们的流程以加快生产。
Pathak说:“正是这种整合使我们能够比以前更快地行动。”“否则,你将面临一个大数据、ETL和数据整理项目,你必须这样做才能让遥测数据快速可用。我们现在可以做得更快。所以这是一个很大的突破。”
PromptQL是另一个跳过大数据管理项目直接进入GenAI项目的支持者。该公司开发了一种基于GenAI的查询工具,允许用户立即开始查询他们的数据,而无需经历构建语义层的耗时过程。
PromptQL的人员表示,语义层仍然很重要,因为它用于将业务的特定术语和指标转换为工具所需的技术表名称,以提供准确的查询。但最大的区别在于,PromptQL提倡在使用过程中构建语义层,并随着时间的推移根据用户的反馈进行定制。他们说,在一个大爆炸式的数据管理项目上花费数月或数年的时间,会导致无休止的POC(概念)并最终失败。
早期人工智能项目的高失败率就像房间里的大象。麻省理工学院最近的一项研究发现,95%的GenAI项目从未走出试验阶段,这让人们感到紧张。随着数万亿美元被投资于购买快速GPU、大规模存储阵列和大型AI数据中心,一些非常富有的机构正在对AI进行一些大赌注。
资源较少的小公司必须更加明智地利用人工智能机会。好消息是,GenAI掌握语言的能力可以以多种方式使用,包括使用它来理解数据是如何建模的,这可能会让你,如果不是跳过数据管理阶段,至少可以在构建第一个人工智能项目的同时解决它。
![]()
“这些不再是连续的步骤,”Pathak说。“我认为,对于许多正在应对遗留数据挑战的公司来说,这是一个巨大的范式转变,坦率地说,自从数据库中有多个表以来,我们一直在处理遗留数据挑战。”
他说:“我认为生成式人工智能所做的和现在的不同之处在于,它真的给了我们一些超能力来实现这些事情。”
与 Ai 时代前沿合作,将大门向更多普通用户敞开!免费课程限时领,还有好礼相送!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。欢迎扫码加入我们!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
下载网易新闻客户端
伊甸园真容现世新疆于阗
在线免费阅读/精美PDF版免费下载

微信扫一扫打赏
支付宝扫一扫打赏

