
202501 MaxKB:基于大模型和 RAG 的知识库问答系统.pdf
《202501 MaxKB:基于大模型和 RAG 的知识库问答系统.pdf》由会员分享,可在线阅读,更多相关《202501 MaxKB:基于大模型和 RAG 的知识库问答系统.pdf(52页珍藏版)》请在优文库上搜索。
1、基于大模型和 RAG 的知识库问答系统2025年版目录2AI 技术发展现状34MaxKB 产品方案MaxKB 案例分享1飞致云公司简介5MaxKB 使用介绍2014成立3,000+客户300+杭州、北京、上海、深圳、广州、南京、成都、武汉、苏州、西安、长沙、郑州、济南、青岛、厦门、合肥、重庆、天津18GitHub Star 总数开源产品月均下载数中国领先的开源软件公司分支机构员工价值观130,000+100,000+飞致云旗下的知名开源项目基于创新的开源模式,向中国数字化团队交付被广泛验证、可信赖的通用工具软件。运维面板运维审计建站&CMSBI 分析软件测试知识库问答广受欢迎的开源堡垒机Sta
2、r 25,000+基于大模型的开源知识库问答系统Star 34,000+现代化、开源 Linux 运维管理面板Star 24,000+强大易用的开源建站工具Star 18,000+Star 12,000+新一代的开源持续测试工具Star 11,000+人人可用的开源 BI 工具开源影响力排名前十六大开源项目 Star 破万开源影响力不断提升来源:https:/star- 技术发展现状34MaxKB 产品方案MaxKB 案例分享1飞致云公司简介5MaxKB 使用介绍人工智能的发展已到战略拐点图1:技术革命的周期性示意图第五阶段技术能力产业发展酝酿期构造范式技术大爆炸第四阶段第三阶段第二阶段新产品
3、、新产业的爆炸性增长和迅速创新全部集群(新产业、技术体系和基础设施)创新和市场潜力的全面扩张产业范式的颠覆式创新扩张新产品和新产业接近成熟,已经构建独立的技术体系AI所处位置成熟期第一阶段成长期 产业化新产品、新产业、新技术体系接连出现并持续更新用得上新技术 用得好新技术看得到新技术看得懂新技术中国式新技术 经过近七十年的发展,人工智能自出现至今其核心能力一直在提升,到如今已经成为覆盖感知、认知、决策、学习、执行、社会协作能力,未来还会向符合人类情感、伦理与道德观念的智能机器迈进。发展到现在,人工智能的技术能力已经到了一个拐点,即从技术能力驱动向需求应用驱动转型的关键时期。随着技术能力的提升,
4、技术进化引发经济进化,从旧范式抵达新范式。如今人工智能的发展已经处于从第三阶段向第四阶段过渡的时期。人工智能的能力成长历程已经足够长,到了寻找需求的战略拐点。算力拐点:DeepSeek的出现,意味着算力效率拐点显现DeepSeek通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知1.E+041.E+061.E+081.E+101.E+121.E+022011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026训练算力(petaFLOPs)AlexNetTransformerBERT
5、-LargeGPT-3 175B(davinci)Megatron-Turing NLG 530B PaLM(540B)GLM-130BLlama 2-70B Baichuan2-13BBaichuan2-7BGPT-4Claude 2Gemini Ultrao1GPT-4oDeepSeek-R1-671BDeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-1.5B算力拐点:DeepSeek的出现,意味着算力效率拐点显现DeepSeek通过重新设计AI Infra,验证“性价比”训练路径DeepSeek-R1少多GPU数量模型效果低高De
6、epSeek-R1 的效果示意:更少的GPUGPU(或其他AIAI芯片)带来同样的效果备注:该图仅为示意,不代表实际情况下具体数量与效果的对比*该图为无编码基础分析师通过DeepSeek R1协作利用python编码生成DeepSeek-R1的惊艳之处是通过重新设计训练流程、以少量SFT数据+多轮强化学习的办法,在提高了模型准确性的同时,也显著降低了内存占用和计算开销。DeepSeek-R1提供了一种低成本训练的方法,而不是说只能通过低成本来进行训练。反而通过优化,DeepSeek-R1 可能实现了算力与性能的近似线性关系。每增加一张 GPU,模型推理能力可稳定提升,无需依赖复杂的外部监督机制
7、。这一特性直接验证了“算力即性能”的 Scaling Law,为AI芯片市场及AI Infra市场提供了明确的增量需求逻辑。数据拐点:AI基础大模型的参数量迎来拐点2025年发布的大模型,都具有低参数量的特征,为本地化部署到AI终端运行提供了可能2018年6月 2018年10月 2019年2月 2019年7月 2020年6月 2021年12月 2023年2024年图:AI预训练模型的参数规模呈现走势Llama3-400B-InTraining4万亿新版BERT 4810亿GPT-3 1750亿Facebook 94亿Stab leLM M6 1750亿2024年之前,最大参数量一直在增长GPT
8、-1 BERT-Large GPT-21.17亿 3.4亿 15亿DeepSeek-R1-671B,6710MiniMax-Text-01,4560 MiniMax-VL-01,4560DeepSeek-R1-Distill-Qwen-32B,320DeepSeek-R1-Distill-Phi-4,140 Qwen-1.5B,152025年1月2025年1月2025年1月2025年1月2025年1月2025年1月2025年发布的大模型开始分化为两极高参数量低参数量技术路径的循环:算法创新再次成为新的突破点AI技术创新一直在围绕核心三要素在动态循环,2025年再次进入算法创新阶段图:每年AI技
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 202501 MaxKB:基于大模型和 RAG 的知识库问答系统 MaxKB 基于 模型 知识库 问答 系统

链接地址:https://www.1848.cn/doc/362975.html