艾瑞网 前天
环球问策:如何突破AI时代的“数据悖论”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

导语:一是构建对 AI 友好的数据土壤,让 AI 能准确理解和使用企业数据;二是确保 AI 输出的结果是可信的,能支撑业务决策。

【环球网科技报道 记者 李文瑶】2025 年,行业的聚光灯打在人工智能与大数据议题上。台上的讨论热烈而宏大——大模型参数、算力竞赛、算法突破——这几乎是今年所有科技论坛的标准配置。

而在此之外,Aloudata 大应科技创始人 &CEO 周卫林却对另一个更为 " 朴素 " 的问题着迷:当所有人追逐模型的智能时,谁来解决数据的 " 脏活累活 "?

图:Aloudata 大应科技创始人 &CEO 周卫林

" 数据、算力、算法,这三要素中,数据是根本,但也是最苦最累的一环。" 周卫林在接受采访时直言不讳。这位从蚂蚁集团出来的技术创业者,选择了一条看似不那么性感的赛道——数据工程。

回归数据基础

在 AI 成为全民热潮的今天,周卫林的创业选择显得颇为 " 反常规 "。他没有去做大模型应用,也没有追逐算力基础设施,而是回到了最基础的 " 数据清洗、整合、管理 " 领域。

" 这不是偶然,而是必然。" 他分析道," 大模型爆发后,数据需求呈指数级增长,但数据供给方式还停留在 30 年前——靠 ETL 工程师手工劳作。需求增长百分之几百,人力不可能同步跟上。"

他提出了一个比喻:" 这就好比在电动车时代,你还在用马拉车的动力系统。"

2021 年,周卫林带着团队独立创业,提出了 "NoETL" 创新理念。这不是要取消数据处理,而是要重构数据生产力——把传统依赖人力的 ETL 流程,转变为由 AI 与算法驱动的自动化数据工程体系。

" 我们看到了一个根本性矛盾:数据需求的爆发式增长与传统数据生产力低下之间的鸿沟。这个鸿沟,正在成为 AI 规模化落地的最大障碍。"

诊断:AI 时代的 " 数据悖论 "

在采访中,周卫林透露了 AI 时代一个令人惊讶的 " 数据悖论 ":企业拥有海量数据,AI 具备强大能力,但二者之间却存在难以跨越的鸿沟。

" 传统数据架构是为人设计的,不是为 AI。" 他指出现行体系的根本缺陷," 当大模型进入企业,它们面对的是一个完全陌生的数据环境。"

他举了一个生动的例子:" 比如‘活跃用户数’这个指标,每家公司都有自己的定义口径。这些业务知识散落在分析师和 IT 人员的头脑里,或者藏在厚厚的文档中。大模型从公域知识中学不到这些私域逻辑。"

这就导致了 " 大模型不懂大数据 " 的尴尬局面。AI 在查询企业数据时,会遇到与人相同的问题:数据找不到、找到不敢用、口径不一致、权限复杂。" 更致命的是," 周卫林强调," 大模型是生成式的,它‘易于创造,难以判别’。在数据分析这类严肃场景中,‘幻觉’是致命的。"

因此,他提出了 " 可信智能 " 的概念:" 企业可以接受 AI ‘不会’,但不能接受它‘胡说’。可信,是 AI 在企业中规模化的基线。"

在周卫林看来,当前企业面临两个根本挑战:一是如何构建对 AI 友好的数据土壤,让 AI 能够准确理解和使用企业数据;二是如何确保 AI 输出的结果是可信的,能够支撑业务决策。

" 这不仅仅是技术问题,更是数据工程范式的革命。"

破局:构建数据语义的 " 罗塞塔石碑 "

面对这些挑战,Aloudata 大应科技的解决方案颇具哲学意味——他们要在业务世界与数据世界之间,建立一套通用的 " 语义翻译系统 "。

" 业界常见的做法是 NL2SQL(自然语言转 SQL),但我们走了一条不同的路。" 周卫林介绍,Aloudata 推出了 NL2MQL2SQL 技术路径——在自然语言与 SQL 之间,加入一层 " 指标查询语言 "(MQL)。

"MQL 就像企业数据的‘罗塞塔石碑’," 他引用了解读古埃及文的著名石碑的比喻," 它把散落在人脑中的业务知识,沉淀为机器可理解的标准语义。"

这个选择背后是深刻的技术洞察。"NL2SQL 直接让大模型生成 SQL,无法解决业务语义对齐问题。比如‘活跃用户’这个指标,大模型不知道具体口径,也无法全面了解企业复杂的数据资产,生成的 SQL 可能就是错的。而 MQL 层承载了企业的业务知识库,确保 AI 像人类专家一样准确理解业务需求。"

为了实现这一愿景,Aloudata 大应科技构建了以 " 数据语义层 " 为核心的三大引擎:语义引擎负责业务语义的定义、执行和管理,确保基于明细数据进行灵活、深入的分析;物化加速引擎通过 " 自适应物化 " 和 " 智能回收 " 技术,解决基于明细数据查询的性能瓶颈;数据虚拟化引擎实现 " 零物理搬运 " 下的跨云跨域数据连接。

" 我们要做的,是让企业的数据资产,能无缝转变为 AI 资产。" 周卫林说。

验证:从麦当劳中国到中交一公局的实践样本

理论需要实践验证,而 Aloudata 大应科技的两个应用案例恰好代表了两种不同的范式。

麦当劳中国拥有近 7000 家门店,百亿级订单数据。" 门店可以快速扩张到一万家,但培养一万个店长很难。" 周卫林指出," 数字化管理成为必然选择,但传统数据架构已无法支撑如此大规模的数据分析。"

在这个项目中,Aloudata 大应科技面临性能、成本、多引擎复用、资源隔离等多重挑战。" 我们通过‘双引擎支持’与‘智能租户隔离’等技术,在保障 SLA 的同时,实现了与客户现有 IT 资源的无缝融合。"

更重要的是,这个案例证明了 NoETL 架构在超大规模场景下的可行性。" 这不仅仅是一个技术项目,它已经成为了生产系统的一部分。"

而在中交一公局的案例中,验证的是另一维度的能力——在高严谨场景下 AI 落地的可靠性。作为央企,中交一公局对数据准确性、安全性要求极高。在这里,Aloudata 的 Data Agent 实现了 90% 以上的准确率,为国央企的 AI 选型提供了技术信心。

" 这两个案例分别代表了两种范式:一个是超大规模下的工程能力,一个是高严谨场景下的 AI 落地能力。" 周卫林分析道。

壁垒:NoETL 背后的护城河

随着案例积累和市场需求明朗,竞争也随之而来。但周卫林对 Aloudata 大应科技的护城河有着清晰认知。

" 首先,NoETL 本身是一个反定位,是对过去 30 年 ETL 体系的重构。" 他指出,这导致在原有体系中做得特别好的公司反而有历史包袱,难以快速转向。

团队背景是另一个优势。" 我们核心团队来自蚂蚁等公司,对大数据和 AI 的结合有深刻理解。这在行业里是稀缺的。"

四年的先发优势也让 Aloudata 大应科技积累了足够的技术和客户壁垒。" 当客户把我们的产品作为数字化基建深度使用后,替换成本会越来越高。"

与云厂商的关系是外界关注的焦点。对此,周卫林明确表示:" 我们与云厂商是合作大于竞争的关系。"

" 云厂商的核心是提供算力与模型,而我们的核心是数据语义编织。我们利用云厂商的算力和模型,帮助客户更好地使用 AI。这是典型的互补关系。" 他透露,Aloudata 大应科技正在积极构建合作伙伴生态,包括咨询、实施、解决方案和分销伙伴。" 我们专注于产品和技术创新,把实施和服务交给生态伙伴。"

未来:数据智能时代的想象

展望未来 3 — 5 年,周卫林看到了一个正在分化的市场格局。" 能建设好 AI 友好数据土壤的企业将获得 5-10 倍的成长加速度。" 他判断," 而那些无法适应这一变革的企业,可能会在竞争中掉队。"

同时,他认为在 " 数字白领 " 普及的细分场景中,会涌现出一批新型公司。" 这些公司不在大公司的竞争主航道,但在特定场景中能做到更高效率。"

商业模式也可能发生演变。" 未来可能会出现从软件订阅到按‘数字白领’服务收费的模式转变。软件市场可能会变得更大,因为它逐渐替代了劳动力市场。"

对于 Aloudata 大应科技的具体规划,周卫林透露了两个重点方向:一是帮助企业 " 一键将数据资产转为 AI 资产 ",解决迁移成本和效率问题;二是布局出海,服务客户的海外业务。

" 我们已经过了技术攻坚期,现在的重点是构建规模化的商业体系。" 他坦言,公司正从 " 技术驱动 " 转向 " 技术 + 商业双驱动 ",需要建立完整的销售、营销和服务体系。

从 50 家客户扩展到 500 家客户,这对组织能力是巨大考验。" 但这也是每个技术公司成长为伟大公司的必经之路。"

(文章为作者独立观点,不代表艾瑞网立场)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai ai时代 ceo 创始人 准确
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论