暂无数据

暂无数据

产品

Product

产品即服务

Product as a Service

大模型

大模型

产品简介

大模型主要在数据中台和业务应用系统层面进行交互。大数据中台可以提供各类数据,形成特定场景的知识库,与已有大模型一起,构建形成适合特定需求的模型。大模型对外提供服务能力,如虚拟助手、语音助手、搜索引擎、AI智能助理等;也为业务应用系统提供服务支持,如数据统计分析服务。

产品功能

01

数据开发服务

通过质量模板、质量规则、质量任务配置和质量告警实现数据质量检测、数据整改。支持跨库数据质量校验,支持多维度质量报告自动生成,支持数据质量问题趋势预测分析。

02

数据质量服务

通过质量模板、质量规则、质量任务配置和质量告警实现数据质量检测、数据整改。支持跨库数据质量校验,支持多维度质量报告自动生成,支持数据质量问题趋势预测分析。

03

数据质量服务

通过质量模板、质量规则、质量任务配置和质量告警实现数据质量检测、数据整改。支持跨库数据质量校验,支持多维度质量报告自动生成,支持数据质量问题趋势预测分析。

04

数据质量服务

通过质量模板、质量规则、质量任务配置和质量告警实现数据质量检测、数据整改。支持跨库数据质量校验,支持多维度质量报告自动生成,支持数据质量问题趋势预测分析。

05

数据质量服务

通过质量模板、质量规则、质量任务配置和质量告警实现数据质量检测、数据整改。支持跨库数据质量校验,支持多维度质量报告自动生成,支持数据质量问题趋势预测分析。

06

数据质量服务

通过质量模板、质量规则、质量任务配置和质量告警实现数据质量检测、数据整改。支持跨库数据质量校验,支持多维度质量报告自动生成,支持数据质量问题趋势预测分析。

07

数据质量服务

通过质量模板、质量规则、质量任务配置和质量告警实现数据质量检测、数据整改。支持跨库数据质量校验,支持多维度质量报告自动生成,支持数据质量问题趋势预测分析。

大模型应用分析

目前大模型人工智能应用主要可以分为工具型应用、通用软件、行业软件、智能硬件、AI助手五大类。
从产品形态上看,它们将沿着AIGC(内容生成)、Copilot(智能助手)、Insight(知识洞察)和Agent(数字代理)等重要方向演进。

工具型应用包括聊天机器人、搜索引擎、文本工具、AI作画和代码工具等,主要面向消费者市场。这些产品的同质化程度较高,底层模型的能力对产品的受欢迎程度至关重要。竞争优势的建立来自于差异化的产品定位和持续训练更强大的底层模型和算法。

通用软件包括办公软件、企业服务、IT运维、软件开发、网络安全、数据智能等领域。各行业的头部厂商已经推出了标杆产品,常见的产品形态是AI智能助理(Coplilot)。目前各个赛道竞争格局相对稳定,未来竞争的关键在于AI与场景/工作流的深度融合。通用软件领域正在处于进入商业化落地的关键阶段。

行业软件涉及金融、医疗、教育、工业、游戏、法律等多个行业。在游戏、法律、教育和电商等C端场景中,生成式人工智能有较多结合点;而在医疗、金融和工业等B端场景中。

AI助手(Coplilot)在这些领域也得到广泛应用。在金融、医疗和工业等领域,具有前景的应用将来自于数据分析和知识洞察工具。

智能硬件包括智能汽车、机器人和智能终端等。生产式人工智能与智能硬件的结合主要分为语音助手和数字代理AI Agent两大类别。语音助手广泛应用于智能座舱、智能音箱和家用机器人等各类智能终端,大模型和生成式人工智能技术提升了感知和生成能力,改善了用户体验。数字代理AI Agent在感知与决策能力方面仍存在挑战,应用空间的打开关键在于计算机视觉和具身智能等底层技术的突破。

 

构建自有大模型挑战

在垂直行业领域的大模型问答效果仍有待提升,对于数字化场景来说,不同场景也有不同的特点,因此需要构建自己的数字化场景大模型。
构造垂类大模型直接的解决方案之一就是注入领域知识。
知识注入方法可以分为领域微调(Fine-Tuning)和外挂知识库(Knowledge Base)两种。

领域微调是通过少量的增量数据对基础模型进行进一步训练,需要有足够的标记数据。
训练中的问题在于成本过高问题,有研究人员分析过,假设普通人想用云计算来训练一个谷歌的PaLM,参数量为5400 亿,需要准备900~1700 万美元。
外挂知识库本质上不去修改基座的模型参数,而是让给你模型分析知识库后再返回答案。
这里就不涉及到重新训练问题,成本比较低。而且回答精度更高,适应性也更强。

 

通用方案流程

实现的基本流程大致如下:
首先通过Langchain加载场景各类数据,LangChain对于不同格式的数据源内置了不同的解析脚本,最终这些数据都将转换为纯Txt文本格式,以实现文本标准化。
然后进行文本拆分成文本块。文本拆分后,需要将文本进行向量化表示,将其映射为低维稠密的向量并存储到向量数据库中。向量数据库选用无需注册的Faiss。
最后,就能根据构建好的向量数据库召回对应文本片段,即语义检索匹配过程;将Prompt喂给模型进行推理得到答案。

 

总体架构实现

大模型主要在数据中台和业务应用系统层面进行交互。大数据中台可以提供各类数据,形成特定场景的知识库,与已有大模型一起,构建形成适合特定需求的模型。大模型对外提供服务能力,如虚拟助手、语音助手、搜索引擎、AI智能助理等;也为业务应用系统提供服务支持,如数据统计分析服务。