龚伟华：深度应用aigc技术，构建知识驱动大模型 -金沙娱场城app

作者：金融电子化发布时间：2024-08-12

北京银行深入践行“一个银行（onebank）、一体数据（onedata）、一体平台（oneplatform）”理念，以“双客”体验为中心，以价值创造为导向，深度应用aigc技术，加快构建知识驱动的大模型应用体系。

2023年，aigc和大模型产业井喷，推动人工智能加速渗透进百行千业，引发生产力与创造力革命。北京银行坚持以系统化思维，深度应用aigc技术，全方位布局人工智能与金融场景的深度融合，逐步形成以大模型为核心算法，多模型适配、多任务插件、多源知识互补的大模型应用体系，支持业务部门以aigc能力重构场景和体验。

北京银行首席信息官龚伟华

自2023年2月北京银行开始探索大模型在金融领域的应用，2023年4月，上线首个大模型问答工具京智助手，后续经过多次版本迭代，先后引入vicuna、chatglm、百川等开源大模型，将行内知识库与大模型相结合，实现了行内知识的检索问答，并集成外部数据查询、rpa插件，探索大模型在数据查询、任务执行等方面的应用。

2023年8月，在前期建设成果的基础上，北京银行启动aib金融智能应用平台建设工作，联合11个业务部门，整理了超16万条金融知识，面向理财经理岗、大堂经理岗、客户经理岗、综合柜员岗、远程客服岗提供理财产品查询、业务问题解答、组合金融资讯、客户营销话术、宏观政策研究、行业发展前瞻等实时在线支持。aib平台逐步构建起前中后台全覆盖的智能应用体系，打造人人能用、人人会用、人人想用、人人好用的ai工具，全面提升业务专业化水平。

大模型应用体系自下而上包括算力层、数据层、框架层、模型层、应用层。具体而言，算力层包括gpu、npu、cpu、内存等计算资源，支持基于信创ai算力进行大模型训练和推理。数据层建立全行知识库，整合行内规章制度、产品知识、业务流程等信息，加载至向量数据库中进行统一存储和管理。框架层构建大模型推理和训练能力，支持模型精调、模型评估、模型推理、搜索增强、提示工程等大模型基础能力。模型层支持多种行业主流基础大模型部署应用，可根据具体的金融场景和任务，融合金融知识进行模型精调，生成金融行业大模型和场景任务模型，支持根据业务场景需要，择优使用。应用层对接业务场景和应用系统，提供大模型应用服务。

为了更好地与业务场景结合，北京银行在大模型技术实践中采用agent智能应用、金融知识库、智能检索、模型微调等技术，提升了大模型在金融场景应用的灵活性、可解释性、安全性和可适应性。

建立大模型驱动的agent智能应用能力，实现大模型能力快速对接。自主研发大模型驱动的agent智能应用能力，提供流程编排、插件开发、agent部署等全方位功能支持，agent具备语义理解、任务规划、插件调用等能力，可支持智能问答、知识检索、数据分析、任务执行等业务场景应用。agent技术是一种能够实现环境感知、决策制定和执行动作的智能实体，其核心驱动力在于大模型，但除此之外，北京银行还增加了规划、记忆和工具使用等关键组件，这使得agent不仅能够理解并响应环境，还能根据目标进行独立思考并采取行动，通过可组装能力实现人机协同，从而提升业务价值。

建立多元化金融知识库。采用向量数据库、知识图谱等技术，针对从营销策略、操作规范、监管政策到内部审计等多个关键业务环节，形成一套全面、立体的金融知识图谱体系，确保所有业务决策和内容生成都有扎实的数据基础。打破“数据孤岛”，与各个业务系统实现数据互通，建设北京银行专属的大模型生态，真正做到服务一线、服务业务。

自研数据查询和搜索引擎，提升金融应用的准确性。打造融合正排索引和倒排索引的搜索引擎，能够迅速准确定位并提取大模型所需的金融知识点，基于最新、最权威的数据生成内容，提升内容的专业性和可信度。同时，系统自动引用知识来源，增强了生成内容的透明度和可追溯性。另外，自研text2sql算法，并构建指标知识领域的专家模型，以大模型连接指标知识库，解耦底层复杂数据结构，避免“ai幻觉”捏造字段、虚构取数口径，一本正经胡编乱造等现象。

基于信创算力和框架，构建l1行业大模型构建和l2场景任务模型。利用信创算力和框架，针对银行业务特性对大模型进行微调，通过锁定预训练模型的部分参数，加入专门针对行内积累的金融知识库训练得到的旁路矩阵，使模型在保留原有通用能力的同时，增强在处理金融场景问题时的泛化能力和专业适应性，确保生成内容更符合银行业务实际需要，有效服务于复杂业务场景。

银行业作为强监管行业，在政策方面一直遵循高标准和高要求。中小银行机构在进行大模型应用探索时，还面临算力资源不足、训练数据欠缺、算法不安全等诸多问题。

算力资源不足。大模型的训练及推理需要有足够的ai算力支撑，硬件设备的采购和维护需要高昂的资金投入，给金融机构带来较大的成本压力。同时，在高端gpu芯片断供的背景下，金融机构针对中高端ai算力的需求存在较大缺口，当前信创ai芯片的应用生态还不完善，适配涉及cpu、操作系统、云平台、ai框架、加速框架和算法模型等多个层次，适配工作复杂且难度大。

训练数据欠缺。数据是大模型训练的基础，为了切实解决金融业务问题，需要针对具体的任务场景，采用大量高质量、多领域的金融数据大模型进行增量训练。单一金融机构掌握的数据资源较为有限，一定程度上影响大模型应用效果。金融数据敏感性高，在数据分级分类管理、数据脱敏清洗、防止数据偏见和滥用等环节也存在难题。

算法安全度存疑。在安全可信方面，大模型本身存在幻觉问题，其训练数据难以溯源、生成内容不可信、计算过程不可解释，难以直接应用于数据准确性要求高、业务流程复杂度高的金融场景中。另外，在科技伦理方面，大模型还可能引发算法歧视、道德、造假等科技伦理风险，影响金融业的健康可持续发展。

随着金融领域垂直大模型的深入发展，银行业大模型应用将更多地触及银行核心业务。北京银行将紧跟大模型产业发展动态，加强多模态大模型的研究和场景应用，持续在平台建设和场景创新两方面进行探索。

在平台建设方面，持续建设大模型应用平台，统筹大模型算力、模型、数据管理，逐步积累大模型训练数据，提升大模型的安全性，利用agent能力，实现与行内其他中台能力的快速对接和集成，为各业务线利用大模型访问数据、执行业务流程提供技术支撑。

在场景创新方面，探索大模型在全场景、多领域的创新应用，深度结合信贷、协同办公、精准营销、智能客服等场景，利用大模型技术实现信贷报告生成、智能会议纪要、营销文案生成、客服工单小结等功能，赋能一线降本增效，夯实“大科技”基础，进一步提升数字化转型能力，全面构建以人工智能为驱动的商业银行。

（此文刊发于《金融电子化》2024年6月下半月刊）

2024-08-13

2024-03-04

2023-06-27

2023-06-20

2023-04-17

2024-08-27

2024-08-26

2024-08-27

2024-08-26

2024-08-27

2024-08-26

2024-08-27

龚伟华：深度应用aigc技术，构建知识驱动大模型 -金沙娱场城app

ai对话：类chatgpt产品体验

好用的ai绘画工具

火热的aigc产品

大公司发布的大模型产品都有哪些？

政府对aigc的扶持政策

aigc对就业的影响：我们会失业吗？

aigc对内容创作的影响

aigc对绘画设计领域的影响

aigc对各行各业的影响