DeepSeek引发新一轮的热潮,推动大模型从辅助角色成为各个业务的“刚需”,成为热门话题。然而,在应用过程中也面临着数据安全、模型准确性、人才短缺和系统集成等挑战。以下分享均来自社区同行实践中的观察和经验,希望能为大家提供解决思路参考。
@faiy0000 中信建投证券 信息分析/架构师:
1、其实对于落地DeepSeek本身没有太大的难点吧;
2、我理解的难点是利用DeepSeek做相关的应用场景开发和应用场景落地。目前遇到的问题主要有幻觉问题,算力不足,比如对于长尾客户,不能满足大量的tps的要求,这样可能只能限制客户端调用量。
3、还有一个比较大的问题是合规问题,合规认为某些应用上大模型没有透明的决策路径,对于结论的合理性,很难清晰度解释。
解决方案:算力不足,除了增加算力或者租借算力,没有很好的解决方案。其中一种可能是限制客户的使用量,或者有限范围内开放使用。 合规问题,可以通过与合规老师充分沟通,制定一些模板,通过模板的定制限制大模型的自我发挥。
@jillme 某金融机构 CIO:
个人感觉落地困难除了很多人提到的数据安全,法律合规和需要大量人员模型训练的准确性之外。还有几个也是落地中遇到的难点。
1、选择合适的应用场景,虽然网上已经有很多场景,但是除了风控,客户画像营销,辅助客服这些常见场景外,企业构建大模块肯定是希望在更多的场景内有应用落地,扩展更多的应用场景并能在训练和应用中适应本企业的战略需求服务,是各个单位面临的巨大挑战。
现在的解决思路还是靠借鉴成功经验与小步试错并行,成立各个专项团队去调研落地场景。
2、交互方式匮乏,目前大量的还是文本的方式交互,实际上用户期待的是能够理解专业语境、提供精准、直观解决方案的助手,简单的对话和文字提示还是直观度和方便度不足。所以在大模型外,构建智能体的应用需要同步进行,把单一对话到多维交互,从被动应答到主动服务,从通用模式到专业适配,构建多维交互模式。
@全国性股份制商业银行行业用户:
DeepSeek等大模型在金融业落地主要有以下几个问题:
1、算力投入大。目前大模型的发展依然遵循规模效应,目前的DeepSeek-R1满血版为671B,单个模型部署就需要几台算力服务器。即使32B的量化版,部署一个支持20并发的实例也需要数十万的算力硬件。因此金融行业实现大模型落地应用,需要解决算力投入的问题。解决方案是金融机构在决策层要了解并意识到算力资源已经是IT基建的一部分,需要持续加大投入。
2、投入产出尚不明显。DeepSeek等大模型确实具备很强的语言理解、推理和生成都能力,但目前金融业高价值的落地场景不多,依然停留在摘要、智能问答、写作等场景,对金融业的核心业务支持有限。这个问题也会制约管理层加大算力投入的决心。解决方案是需要银行业务侧人员主动参与场景探索和落地,挖掘或开创更多面向核心业务的大模型应用场景,以找到投入产出的平衡点。
@allanrong 浙商银行 主管:
其他同业已经说明很多问题,我主要补充两点:
银行将面临集成与运营挑战,将大模型集成到银行现有的IT系统和业务流程中可能面临技术兼容性和操作复杂性的问题。大模型的应用需要与现有的业务流程相结合,这可能涉及到系统升级、流程调整等挑战。在私有化场景中,我们银行可能需要投入大量时间和成本来确保大模型与内部系统的无缝对接。
建议是与实践经验的厂商合作,或共建实验室来降低风险。
银行将面临在其他场景中更加低的“幻觉”容忍度,多项实证研究发现,通用 LLM 在财报、利率、法规等文本领域的幻觉概率显著高于15%,远超金融业务可承受上限。
@卡尔 华泰证券 研发工程师:
1、DeepSeek落地有几个需要考虑的点:
1)本地化部署DeepSeek-R1满血版,模型容量太大,没有足够的GPU资源不敢轻易尝试。
2)使用互联网DeepSeek-R1 SaaS服务,可能存在数据安全性风险。
3)如何引入领域知识,如何防范恶意回答。
4)如何衔接自研组件。
2、我个人觉得金融企业要落地Deepseek应用:
1)首先明确业务场景,是否存在数据安全,是否可以借助外力,例如互联网大模型开发平台等等。
2)如果需要本地部署大模型,我个人推荐的方式是使用DeeSeek-R1-distill的小模型。
3)涉及领域知识,可以自建知识库,用RAG完成模型微调等。
4)涉及自研组件的调用,可以考虑使用MCP方式衔接各组件。
5)构建业务场景的智能体:可以考虑流程编排,可以参考open-Manus框架,自建编排逻辑。
@朱向东 某银行 高级工程师:
@jinhaibo 昆仑银行 技术管理:
难点一:算力不足方面,大模型部署、训练、推理都需要GPU算力资源,为了能够商用部署对于资源的需求会出现一个激升,如何在算力有限的情况下开展探索和落地。
解决思路:可以从两个方面来考虑,一是在场景选择上对算力需求进行评估,优先选择算力投入和效益产出明显的场景进行落地;二是利用集团大模型能力,搭建智能体,采用大小模型相结合,融合RAG检索模块,通过与行内系统交互获取客户画像、账户信息等信息,结合集团DeepSeek推理能力来满足场景算力需要。
难点二:数据安全方面,银行是一个强监管的行业,且存在大量敏感客户信息,在合规经营的要求下需要确保数据安全和隐私保护。
解决思路:基于这种监管背景下,大模型的使用和场景落地必然会受到一定约束,在部署上进行私有化部署,在模型训练上,控制数据使用范围,对敏感数据进行二次加工标签化,对数据进行分类分级管理,经过授权的人员、系统才能进行数据使用。
难点三:模型准确性方面,大模型厂商众多、更新迭代快、表现情况各异,导致不同行业和场景产出的结果具有一定不确定性。
解决思路:需要紧跟市场趋势,不断探索新的产品,在具体场景中验证哪个模型准确性更高,产出的答复更贴合需求,同时在大模型使用中引入人工复核和质检,使大模型作为员工的助手,提升效率的工具,而非完全替代员工。
发表评论 取消回复