在工业大模型规模化赋能的路上,还有多少“拦路虎”?
来源:通信世界全媒体 时间:2024-07-24 08:29

  在科技发展的浪潮中,人工智能以其前所未有的力量,正深刻地改变着我们的世界。其中,大模型作为AI技术的重要突破,正逐步成为推动各行各业转型升级的关键力量。大模型,以其强大的数据处理能力、复杂场景下的高适应性以及持续学习的潜力,正逐步渗透并赋能千行百业,开启了一个全新的智能时代。

  大模型赋能千行百业,初见成效

  大模型,顾名思义,是指具有大规模参数和复杂计算结构的机器学习模型,拥有数十亿甚至数千亿个参数。早在1956年,计算机专家约翰·麦卡锡提出了“人工智能”概念,AI发展由最开始基于小规模专家知识逐步发展为基于机器学习。到2022年,ChatGPT横空出世,彻底把这一概念由以往仅限在专业领域传播向了普罗大众。

  在国内,相关领域内的研究也早已开始。2001年中国科学院计算技术研究所成立了机器学习与数据挖掘实验室,开始了对大模型的研究工作。2011年,百度推出了基于大数据和大模型的搜索算法“海量深度学习技术”。此后,国内的互联网公司纷纷加大在大模型领域的研发投入,推动了大模型在搜索、推荐等多个领域的应用拓展。发展到今天,在大模型领域已呈现“百模大战”的景象,截至2024年3月,通过国家网信办备案的大模型就有117个。

  目前,在金融、医疗、教育、农业等多个行业,国内已集中诞生了一批AI大模型应用。在金融行业,金融机构可以利用大模型处理和分析大量的金融数据,提高决策效率和准确性,优化资源配置,降低风险。在医疗领域,大模型可以在医疗文本处理、医疗问答、医疗影像诊断、疾病预测等场景下发挥作用。通过处理和分析医疗记录、临床试验数据和医学文献,辅助医生进行更准确的诊断,提供个性化的治疗建议,提高医疗服务质量。而在教育行业可以利用大模型进行个性化学习、自动评分和教育资源的智能推荐,满足学生的个性化需求,提高教学效果和学习体验。在农业领域,大模型被用于精准农业、资源管理等方面,通过分析土壤、气候、作物生长等数据,为农民提供精准的种植和管理建议,提高农作物的产量和质量。

  这些领域的应用展示了大模型对行业的巨大赋能作用,按照目前的发展速度,随着技术的不断进步和应用的深入,大模型将在更多领域发挥更突出的作用。

  工业领域规模化赋能,道阻且长

  大模型在工业领域的应用,相较于其他行业,进度要稍慢一筹。

  当前,我国工业拥有41个工业大类、207个中类、666个小类,涵盖了联合国产业分类中的全部工业门类,在全球500种工业品种中,‌我国有4成以上的产品产量位居全球第一,具有全、多、大的独特优势。相关数据统计,2023年我国全部工业增加值达到39.9万亿元,占GDP比重31.7%。此外,‌我国制造业规模占全球的30%以上,‌连续14年位居全球第一。庞大的产业规模,为工业大模型的规模化赋能提供丰沃的“土壤“,同样也带来了诸多挑战。

  腾讯发布的《工业大模型应用报告》指出,工业大模型的应用场景集中在研发设计、生产制造、经营管理和产品服务四个环节。目前工业大模型应用存在预训练工业大模型、微调、检索增强生成三种主要构建模式,且三者之间并不独立存在往往会采用多种模式共同发力。那么制约工业大模型的发展,究竟有哪些因素呢?

  一是数据。工业领域虽然场景众多,存在大量数据,但碎片化现象明显。工业数据收集和清洗历来就是一大难点,再加上各个企业之间因为规模、技术实力的差距,也容易造成数据采集、治理水平的参次不齐。当前我国的数据市场,尚处于早期发展,还未建立起比较完善的数据共享、确权机制。此外,大多数企业十分重视数据安全,很多都要求大模型的数据要本地化部署,数据不出企业或园区是基本要求,工业领域存在严重的跨行业、跨场景数据壁垒问题。这就导致工业大模型在构建时难以获得全面、高质量的数据进行深度学习训练。

  二是成本。据了解,大模型的部署成本中,不仅包括算力成本、部署成本,还包括试错成本、人力成本等。模型越大、参数越多,所需的算力成本就越高。这是动辄百万千万甚至上亿的支出。训练大模型还需要大量GPU的支持,这是一笔不小的硬件支出,以微软与英伟达合作推出的MegatronTuring-NLG模型为例,训练中消耗了4480块A100GPU,单次训练的成本就是数百万美元。其他的建设费用、运营成本,人才培养……对于一些企业来说,是不小的负担。在国家统计发布的数据中,以2023年为例,规模以上工业企业平均利润率为5.76%,较低的利润让很多企业在大模型的投入上望而却步。

  三是应用场景和行业知识的限制。工业领域规模庞大范围广,41个工业大类、207个中类、666个小类,涉及千千万万的应用场景,单是做到覆盖这些场景就很不容易。何况在前沿技术与真实应用场景之间也存在较大差异,工业大模型在不同场景下的适配性和泛化性有待提高。大模型在赋能某一行业时,就需要该行业的专业知识,而不同行业的专业知识差异巨大,相关的知识、经验难以复用。目前很多通用大模型缺乏对应行业的深入知识,这使得它们难以解决行业中遇到的复杂任务。

  以上三点,是当前工业大模型在发展过程中遇到的主要痛点,造成现阶段大模型在工业领域内部署率较低,但也说明未来存在着巨大的上升空间。积极去解决这些问题,让工业大模型早日规模化赋能相关产业,将会对我国工业的未来发展产生深远影响,不仅将夯实中国的工业实力,还将为相关产业的未来发展提供新的动力和方向。

附件下载

扫一扫在手机上查看当前页面

相关链接