在工业大模型规模化赋能的路上，还有多少“拦路虎”? _ 信息化动态

在工业大模型规模化赋能的路上，还有多少“拦路虎”?

来源：通信世界全媒体时间：2024-07-24 08:29

　　在科技发展的浪潮中，人工智能以其前所未有的力量，正深刻地改变着我们的世界。其中，大模型作为AI技术的重要突破，正逐步成为推动各行各业转型升级的关键力量。大模型，以其强大的数据处理能力、复杂场景下的高适应性以及持续学习的潜力，正逐步渗透并赋能千行百业，开启了一个全新的智能时代。

　　大模型赋能千行百业，初见成效

　　大模型，顾名思义，是指具有大规模参数和复杂计算结构的机器学习模型，拥有数十亿甚至数千亿个参数。早在1956年，计算机专家约翰·麦卡锡提出了“人工智能”概念，AI发展由最开始基于小规模专家知识逐步发展为基于机器学习。到2022年，ChatGPT横空出世，彻底把这一概念由以往仅限在专业领域传播向了普罗大众。

　　在国内，相关领域内的研究也早已开始。2001年中国科学院计算技术研究所成立了机器学习与数据挖掘实验室，开始了对大模型的研究工作。2011年，百度推出了基于大数据和大模型的搜索算法“海量深度学习技术”。此后，国内的互联网公司纷纷加大在大模型领域的研发投入，推动了大模型在搜索、推荐等多个领域的应用拓展。发展到今天，在大模型领域已呈现“百模大战”的景象，截至2024年3月，通过国家网信办备案的大模型就有117个。

　　目前，在金融、医疗、教育、农业等多个行业，国内已集中诞生了一批AI大模型应用。在金融行业，金融机构可以利用大模型处理和分析大量的金融数据，提高决策效率和准确性，优化资源配置，降低风险。在医疗领域，大模型可以在医疗文本处理、医疗问答、医疗影像诊断、疾病预测等场景下发挥作用。通过处理和分析医疗记录、临床试验数据和医学文献，辅助医生进行更准确的诊断，提供个性化的治疗建议，提高医疗服务质量。而在教育行业可以利用大模型进行个性化学习、自动评分和教育资源的智能推荐，满足学生的个性化需求，提高教学效果和学习体验。在农业领域，大模型被用于精准农业、资源管理等方面，通过分析土壤、气候、作物生长等数据，为农民提供精准的种植和管理建议，提高农作物的产量和质量。

　　这些领域的应用展示了大模型对行业的巨大赋能作用，按照目前的发展速度，随着技术的不断进步和应用的深入，大模型将在更多领域发挥更突出的作用。

　　工业领域规模化赋能，道阻且长

　　大模型在工业领域的应用，相较于其他行业，进度要稍慢一筹。

　　当前，我国工业拥有41个工业大类、207个中类、666个小类，涵盖了联合国产业分类中的全部工业门类，在全球500种工业品种中，‌我国有4成以上的产品产量位居全球第一，具有全、多、大的独特优势。相关数据统计，2023年我国全部工业增加值达到39.9万亿元，占GDP比重31.7%。此外，‌我国制造业规模占全球的30%以上，‌连续14年位居全球第一。庞大的产业规模，为工业大模型的规模化赋能提供丰沃的“土壤“，同样也带来了诸多挑战。

　　腾讯发布的《工业大模型应用报告》指出，工业大模型的应用场景集中在研发设计、生产制造、经营管理和产品服务四个环节。目前工业大模型应用存在预训练工业大模型、微调、检索增强生成三种主要构建模式，且三者之间并不独立存在往往会采用多种模式共同发力。那么制约工业大模型的发展，究竟有哪些因素呢?

　　一是数据。工业领域虽然场景众多，存在大量数据，但碎片化现象明显。工业数据收集和清洗历来就是一大难点，再加上各个企业之间因为规模、技术实力的差距，也容易造成数据采集、治理水平的参次不齐。当前我国的数据市场，尚处于早期发展，还未建立起比较完善的数据共享、确权机制。此外，大多数企业十分重视数据安全，很多都要求大模型的数据要本地化部署，数据不出企业或园区是基本要求，工业领域存在严重的跨行业、跨场景数据壁垒问题。这就导致工业大模型在构建时难以获得全面、高质量的数据进行深度学习训练。

　　二是成本。据了解，大模型的部署成本中，不仅包括算力成本、部署成本，还包括试错成本、人力成本等。模型越大、参数越多，所需的算力成本就越高。这是动辄百万千万甚至上亿的支出。训练大模型还需要大量GPU的支持，这是一笔不小的硬件支出，以微软与英伟达合作推出的MegatronTuring-NLG模型为例，训练中消耗了4480块A100GPU，单次训练的成本就是数百万美元。其他的建设费用、运营成本，人才培养……对于一些企业来说，是不小的负担。在国家统计发布的数据中，以2023年为例，规模以上工业企业平均利润率为5.76%，较低的利润让很多企业在大模型的投入上望而却步。

　　三是应用场景和行业知识的限制。工业领域规模庞大范围广，41个工业大类、207个中类、666个小类，涉及千千万万的应用场景，单是做到覆盖这些场景就很不容易。何况在前沿技术与真实应用场景之间也存在较大差异，工业大模型在不同场景下的适配性和泛化性有待提高。大模型在赋能某一行业时，就需要该行业的专业知识，而不同行业的专业知识差异巨大，相关的知识、经验难以复用。目前很多通用大模型缺乏对应行业的深入知识，这使得它们难以解决行业中遇到的复杂任务。

　　以上三点，是当前工业大模型在发展过程中遇到的主要痛点，造成现阶段大模型在工业领域内部署率较低，但也说明未来存在着巨大的上升空间。积极去解决这些问题，让工业大模型早日规模化赋能相关产业，将会对我国工业的未来发展产生深远影响，不仅将夯实中国的工业实力，还将为相关产业的未来发展提供新的动力和方向。

附件下载

扫一扫在手机上查看当前页面